Помните голосовую демонстрацию GPT-4o от OpenAI пару месяцев назад, которая потрясла мир своей схожестью с человеком? Знаете, ту, которая могла заставить вас на время забыть, что вы разговариваете с ИИ, и даже напомнила многим ИИ-персонажа Скарлетт Йоханссон из фильма «Она» (и тоже подверглась критике за то же самое).
OpenAI наконец-то начинает развертывать его в Alpha для небольшого числа пользователей ChatGPT Plus, как компания поделилась на X. Хотя изначально компания планировала начать развертывание в июне, оно было отложено по соображениям безопасности и для того, чтобы гарантировать, что он сможет «достичь планки [OpenAI] для запуска». Таким образом, компания была занята улучшением модели с командой внешних красных командеров, чтобы она могла обнаруживать и отклонять определенный контент.
Мы начинаем развертывать расширенный голосовой режим для небольшой группы пользователей ChatGPT Plus. Расширенный голосовой режим предлагает более естественные разговоры в реальном времени, позволяет вам прерывать собеседника в любое время, а также чувствует и реагирует на ваши эмоции. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) 30 июля 2024 г.
Теперь некоторые платные пользователи начинают получать доступ к модели в своем приложении ChatGPT, но прямо сейчас доступ к альфа-версии останется небольшим. Компания заявляет, что планирует постепенно развернуть доступ для большего числа пользователей и предоставить его всем платным пользователям позже осенью.
Похоже, нет способа запросить доступ к Расширенному голосовому режиму. Если вы входите в список небольшого числа пользователей, которые получат доступ к альфа-версии, вы получите электронное письмо с инструкциями, а также уведомление в приложении ChatGPT для опробования Голосового режима.
Расширенный голосовой режим будет способен говорить только 4 предустановленными голосами — Джунипер, Эмбер, Коув и Бриз. Примечательно, что OpenAI удалила Скай — ту, которая звучала как Скарлетт Йоханссон вскоре после того, как демо было выпущено на весеннем мероприятии, и актриса отправила письма в компанию с вопросом о том, как был сделан этот голос (на которые OpenAI, по-видимому, так и не ответила). Скай, похоже, все еще не входит в список.
ChatGPT-4o также не сможет предоставлять выходные данные любым другим голосом, кроме тех, что указаны в предустановке, чтобы защитить конфиденциальность пользователя. Также существуют защитные ограждения для блокировки запросов на любой жестокий или защищенный авторским правом контент.
Если у вас есть доступ к расширенному голосовому режиму в приложении ChatGPT, продолжайте и попробуйте. Хотя он не сможет делать все, что показано в демонстрациях, пока не получит возможности зрения, он все равно выглядит весьма впечатляюще, согласно некоторым видео, которыми поделились пользователи, имеющие доступ.
Добавить комментарий