OpenAI представляет первую серию моделей рассуждений: запуск o1

На фоне шумихи вокруг ожидаемого релиза Project Strawberry от OpenAI компания выпустила свою последнюю модель OpenAI o1. Хотя официально она не названа Strawberry, эта версия обладает передовыми возможностями рассуждений, которые вызвали многочисленные спекуляции.

В дополнение к OpenAI o1, существует более доступный вариант под названием OpenAI o1 mini. Этот шаг продолжает тенденцию OpenAI выпускать меньшие модели для лучшей поддержки разработчиков после введения GPT-4o mini.

Название o1 символизирует новый старт, перестраивая систему наименований, которая стала несколько запутанной в предыдущих моделях.

Важно отметить, что o1 имеет более высокие эксплуатационные расходы по сравнению с существующими моделями, а также более медленное время отклика. Однако текущая версия является лишь «предварительным просмотром», отражающим раннюю фазу разработки.

OpenAI o1 существенно отличается от моделей GPT, поскольку имеет уникальную методологию обучения, которая использует новый алгоритм оптимизации и набор данных.

Эта инновационная модель отлично справляется с решением сложных проблем в таких областях, как наука, кодирование и математика, с помощью улучшенного рассуждения. OpenAI o1 использует обучение с подкреплением для решения проблем, включая механизм вознаграждения и наказания. В отличие от предыдущих моделей, которые в первую очередь предсказывали следующее слово, o1 интегрирует «цепочку мыслей», побуждающую эффективно отвечать на запросы. Это достижение означает значительный шаг к достижению интеллекта, подобного человеческому, что приводит к повышению точности и снижению тенденций к галлюцинациям (хотя он все еще склонен к случайным неточностям).

При предъявлении подсказки o1 будет артикулировать свой мыслительный процесс, демонстрируя заметные улучшения в способностях к рассуждению по сравнению с более ранними моделями. Например, o1 достиг впечатляющего результата в 83% на Международной математической олимпиаде (IMO), в то время как GPT-4o справился только с 13%.

Несмотря на способность рассуждать и делиться своими мыслительными процессами, существует наложенный лимит на время размышлений. Пользователи могут получить подсказку типа «О, у меня заканчивается время; позвольте мне быстро получить ответ», как сообщает The Verge.

В то время как o1 отлично справляется с решением сложных задач, требующих обширных общих знаний, o1 mini лучше подходит для кодирования, математики и научных задач, не требующих обширного понимания общих знаний. Кроме того, o1 mini значительно более доступен, будучи почти на 80% дешевле, чем o1.

В настоящее время o1 не хватает функций, имеющихся в GPT-4o, таких как просмотр интернета или прием файлов/изображений в качестве входных данных, хотя OpenAI активно работает над включением этих возможностей. Модели o1 специально разработаны для пользователей, которым нужны решения сложных проблем, включая исследователей в области здравоохранения, физиков, экономистов и разработчиков программного обеспечения.

Кто может получить доступ к модели? Начиная с сегодняшнего дня пользователи ChatGPT Plus и Team могут получить доступ к o1-preview и o1-mini. Пользователи Edu и Enterprise получат доступ на следующей неделе. Пользователи плана ChatGPT Free не получат немедленного доступа, но OpenAI стремится предоставить доступ к o1-mini для бесплатных пользователей в будущем.

Лимиты использования для обеих моделей установлены на уровне 30 сообщений в неделю для o1 и 50 сообщений для o1-mini, при этом в будущем планируется увеличить эти ограничения.

С точки зрения ценообразования API для o1 относительно дорогое; o1-preview стоит $15 за миллион входных токенов и $60 за миллион выходных токенов. Напротив, GPT-4o стоит $5 за миллион входных токенов и $15 за миллион выходных токенов.

Как получить доступ к моделям? Пользователи могут переключаться между o1 и o1-mini из меню ChatGPT. OpenAI также работает над автоматизацией выбора моделей на основе пользовательских подсказок в будущем.

Запуск o1 и o1-mini подчеркивает приверженность OpenAI инновациям, выделяя ее среди конкурентов. Если модель сможет успешно выполнять сложные задачи рассуждения, она может стать значительным шагом вперед на пути к общему искусственному интеллекту (AGI). Однако некоторые первоначальные отзывы указывают на то, что o1 может испытывать трудности с базовыми задачами рассуждения.

Новый O1 по-прежнему терпит неудачу в ответах на простые вопросы от
u/knowledgehacker в
ChatGPT

Поскольку OpenAI продолжает разрабатывать серию o1, пользователи сохраняют надежду, что будущие обновления улучшат производительность модели. Кроме того, OpenAI планирует продолжить развертывание новых моделей в серии GPT, поддерживая ожидания относительно потенциального GPT-5.

Источник