Meta выпускает Llama 3.1: самую мощную модель ИИ с открытым исходным кодом на сегодняшний день

Meta объявила о выпуске Llama 3.1, своей последней и самой передовой модели искусственного интеллекта с открытым исходным кодом. Эта новая версия представляет собой значительный скачок вперед в технологии ИИ, и Meta утверждает, что она превосходит ведущие фирменные модели таких компаний, как OpenAI.

Флагманская модель Llama 3.1 405B, включающая 405 миллиардов параметров, теперь является крупнейшей общедоступной базовой моделью. Она демонстрирует самые современные возможности в области общих знаний, математики, использования инструментов и многоязычного перевода. Модель была обучена на более чем 15 триллионах токенов с использованием более 16 000 графических процессоров H100 от Nvidia.

Одним из ключевых улучшений Llama 3.1 является расширенная длина контекста в 128 тыс. токенов, что в 16 раз превышает емкость предыдущих моделей Llama. Это позволяет ИИ обрабатывать и понимать гораздо более длинные отрывки текста, повышая его способность справляться со сложными задачами и генерировать более тонкие ответы.

Новая модель поддерживает восемь языков: английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский. Эта многоязычная возможность делает Llama 3.1 универсальным инструментом для разработчиков и предприятий, работающих над глобальными приложениями ИИ.

Meta выпускает Llama 3.1 в трех размерах: параметры 405B , 70B и 8B . Каждый размер оптимизирован для различных вариантов использования:

Модель 405B идеально подходит для корпоративных приложений и сложных исследований, она способна генерировать длинные тексты, выполнять многоязычный перевод, кодирование и сложные логические задачи.
Модель 70B подходит для создания контента, разговорного ИИ и понимания языка.
Модель 8B предназначена для приложений с ограниченными вычислительными ресурсами, таких как мобильные устройства.

Для облегчения внедрения Meta сотрудничает с крупными технологическими компаниями, такими как Amazon, Google и Databricks, чтобы сделать Llama 3.1 доступной на различных платформах. Например, модели теперь доступны на Amazon Web Services (AWS) через такие сервисы, как Amazon SageMaker JumpStart и Amazon Bedrock.

Генеральный директор Meta Марк Цукерберг подчеркивает важность ИИ с открытым исходным кодом, заявляя, что это ключ к демократизации преимуществ ИИ. Он считает, что модели с открытым исходным кодом, такие как Llama 3.1, в конечном итоге превзойдут проприетарные по возможностям и темпам принятия.

Выпуск Llama 3.1 также поставляется с обновленной лицензией, которая позволяет разработчикам использовать выходные данные модели для улучшения других систем ИИ. Ожидается, что этот шаг ускорит инновации в области ИИ и предоставит разработчикам большую гибкость в создании и настройке приложений ИИ.

Приверженность Meta к ИИ с открытым исходным кодом напоминает о том, как Linux стал доминирующей операционной системой с открытым исходным кодом для многих устройств и серверов. Компания надеется, что Llama 3.1 также станет краеугольным камнем для разработки ИИ.

Поскольку ИИ продолжает стремительно развиваться, выпуск Llama 3.1 знаменует собой важную веху в деле повышения доступности мощных моделей ИИ для разработчиков и предприятий по всему миру. Он закладывает основу для новой эры инноваций ИИ, где модели с открытым исходным кодом напрямую конкурируют со своими фирменными аналогами и потенциально превосходят их.