OpenAI недавно анонсировала свою модель GPT-4o, новую флагманскую модель движка, на котором работает ChatGPT, ее знаменитый чат-бот на базе искусственного интеллекта, впервые выпущенный в 2022 году. Эта новая модель выводит взаимодействие человека с компьютером на совершенно новый уровень, делая его более быстрым и удобным. гораздо естественнее.
В GPT-4o буква «o» означает «omni», поскольку она объединяет текст, изображение и звук в единую модель. Хотя улучшений в интеллекте и рассуждениях по сравнению с моделью GPT-4 Turbo нет, есть множество новых обновлений. Он предназначен для обеспечения более быстрых и более человечных ответов и может даже имитировать эмоции. Он также значительно быстрее понимает визуальные и аудиовходы. В этом глубоком обзоре мы рассмотрим функции, которые предлагает GPT-4o, и то, как они произведут революцию в том, как мы взаимодействуем с помощниками искусственного интеллекта. Итак, присоединяйтесь к нам, и начнем!
GPT-4o значительно быстрее
Модель GPT-4o позволяет ChatGPT принимать входные данные в различных формах, включая аудио, текст, изображения или их комбинации. Он также может предоставлять ответы в разных форматах. Однако что больше всего впечатляет в нем, так это скорость, с которой он дает вам ответы.
Благодаря новой модели ChatGPT требуется всего около 320 миллисекунд или даже меньше, чтобы ответить на аудиовход, что близко к времени, которое требуется человеку, чтобы ответить в разговоре. Помимо этого, производительность GPT-4o аналогична GPT-4 Turbo в том, что касается использования английского языка или написания кода.
Он также намного лучше реагирует на текстовый ввод на языках, отличных от английского, и значительно дешевле в API, поскольку он намного более эффективен, чем его предшественник.
Он также имеет новый интерфейс, призванный сделать взаимодействие проще и удобнее.
Это мультимодальный
Существующий голосовой режим ChatGPT состоит из трех моделей. Первый принимает текстовый ввод и обеспечивает вывод в том же формате, а второй преобразует аудиовход в текст, который принимается ChatGPT для обеспечения текстового вывода. Последняя модель преобразует текст в аудио.
Однако такая конструкция приводит к потере информации, поскольку модель не может напрямую взаимодействовать с аудиовходом или отображать выходные данные, содержащие эмоциональные элементы. С помощью GPT-4o OpenAI создала единую мультимодальную модель, которая может понимать различные типы входных данных и напрямую обрабатывать требуемые выходные данные.
В настоящее время он поддерживает 50 языков, а также будет доступен через API.
Он может имитировать человеческие эмоции
Когда ChatGPT был впервые анонсирован, одним из самых больших недостатков чат-бота с искусственным интеллектом для многих людей было то, что он не мог давать эмоциональные реакции. С помощью GPT-4o ChatGPT может имитировать человеческие эмоции и предоставлять подходящие ответы, интегрирующие такие эмоции.
В демоверсиях, которыми поделился OpenAI, можно увидеть, как чат-бот смеется, поет и даже показывает сарказм, когда его об этом просят. Это намного превосходит то, что в настоящее время может делать любой другой чат-бот с искусственным интеллектом, и сделает взаимодействие с пользователем намного более приятным. По данным OpenAI, новая модель позволит ChatGPT также определять настроение пользователя и предоставлять адекватные ответы на основе этой информации.
В сочетании с возможностью использования визуальных данных способность обеспечивать эмоциональные реакции является одной из самых впечатляющих функций, предлагаемых новой моделью.
Новая модель может хранить больший объем информации
Благодаря GPT-4o ChatGPT теперь может лучше понимать изображения, такие как диаграммы и фотографии, а также хранить больше информации о пользователе. Это также приводит к тому, что ответы могут содержать более крупные фрагменты текста, что может быть полезно в нескольких случаях использования.
Например, вы можете попросить чат-бота перевести большие фрагменты текста прямо сейчас, и он поможет вам с живым переводом. Поскольку он может использовать визуальные и аудиовходы наряду с текстовыми, вы можете использовать его для сбора информации из снимков экрана, фотографий и других изображений.
Поскольку он может хранить больший объем информации без необходимости повторения пользователями, GPT-4o позволяет пользователям участвовать в двусторонних разговорах с чат-ботом с искусственным интеллектом. Имея больше информации, пользователи могут ожидать, что разговоры будут более сложными.
Гарантии в новой модели
Как и существующие модели GPT, GPT-4o разработан с учетом определенных мер безопасности. Данные обучения были отфильтрованы, и после обучения было уточнено поведение модели. OpenAI также оценила модель ИИ по нескольким параметрам, таким как кибербезопасность и убеждение, чтобы избежать нежелательных инцидентов.
Кроме того, разработчики воспользовались помощью более 70 экспертов в различных областях, таких как дезинформация и социальная психология, чтобы выявить и смягчить риски, которые могут возникнуть или увеличиться с новой моделью. Они также будут продолжать отслеживать использование чат-бота на предмет будущих рисков и предпринимать необходимые действия по мере необходимости.
Начнем с того, что OpenAI предоставит только ограниченный набор предустановок моделей голоса. Также будут учитываться отзывы пользователей для улучшения модели и обеспечения полной безопасности.
Наличие GPT-4o
До сих пор было доступно две версии ChatGPT: бесплатная версия, работающая с GPT 3.5, и платная версия, работающая с GPT 4.0 и стоившая 20 долларов в месяц. Последний может получить доступ к более крупной языковой модели, позволяющей обрабатывать большие объемы данных.
GPT-4o будет доступен как бесплатным, так и платным пользователям, и ожидается, что он появится на устройствах в ближайшие недели. Оно будет доступно на мобильных устройствах через существующее приложение, которое будет обновлено, а в дополнение к веб-версии для пользователей настольных компьютеров будет доступно новое настольное приложение macOS (версия для Windows появится позже в этом году).
Чтобы различать бесплатных и платных пользователей, OpenAI предложит платным пользователям в пять раз больше возможностей, чем бесплатным пользователям. Как только лимит исчерпается, вы вернетесь на ChatGPT 3.5.
Заявление OpenAI относительно GPT-40 было сделано всего за день до ежегодной конференции разработчиков ввода-вывода Google, на которой Google, как ожидается, сделает свои собственные объявления, связанные с искусственным интеллектом. OpenAI также пообещала, что в ближайшее время появятся новые анонсы, поэтому не может быть никаких сомнений в том, что конкуренция между двумя соперниками только начинает обостряться.
Хотя мы не знаем, когда OpenAI представит новые изменения в своей модели искусственного интеллекта, мы знаем, что GPT-4o появится на устройствах с ChatGPT по всему миру. Итак, держите пальцы скрещенными и ждите, пока обновление появится на вашем устройстве. До скорого!
Добавить комментарий