

Индийская лаборатория ИИ Sarvam представила инновационное поколение крупных языковых моделей, готовых изменить ландшафт открытого ИИ. Презентация состоялась на саммите India AI Impact в Нью-Дели, и этот запуск соответствует стратегической инициативе Индии по уменьшению зависимости от иностранных ИИ-платформ, учитывая региональные языковые нужды и уникальные случаи использования. Улучшения Sarvam включают модели с 30 миллиардами и 105 миллиардами параметров, дополненные механизмом преобразования текста в речь, конвертером речи в текст и моделью визуального распознавания, нацеленную на разбор документов. Этот скачок превосходит их предыдущую модель с 2 миллиардами параметров от октября 2024 года. Что отличает новые разработки Sarvam, так это их архитектура «смеси экспертов», оптимизирующая эффективность за счет активации меньшей части параметров в любой момент времени, тем самым снижая вычислительные затраты. Модель на 30 миллиардов поддерживает обширный контекст из 32 000 токенов, способствующих разговорному выходу, тогда как версия на 105 миллиардов расширяет это до окна в 128 000 токенов, чтобы справляться со сложными многозадачными рассуждениями. Sarvam начала разработку этих моделей с нуля, не улучшая существующие открытые фреймворки. Для сборки модели на 30 миллиардов использовались обширные 16 триллионов токенов текста, в то время как модель на 105 миллиардов охватывала множество индийских диалектов, отражая её всеобъемлющий охват. Модели спроектированы для бесшовного развертывания в реальном времени, поддерживая функции в голосовых системах и чат-интерфейсах на индийских языках. Это достижение было поддержано ресурсами из государственной программы IndiaAI Mission с помощью оператора дата-центра Yotta и технологического гиганта Nvidia. Соучредитель Пратюш Кумар подчеркнул прагматичный подход к масштабируемости и применению моделей, акцентируя внимания на целенаправленном росте, базирующемся на общественных нуждах. Sarvam планирует открытие кода своих выдающихся моделей, хотя без детализации обмена данными или полного выпуска кода. Смотрящая в будущее Sarvam намерена расшириться в специализированные AI-сервисы, с инициативами, такими как Sarvam for Work, нацеленными на автоматизацию в предприятиях, наряду с Samvaad, платформой для разговорных AI-агентов. Привлёк более 50 миллионов долларов финансирования от Lightspeed Venture Partners, Khosla Ventures и Peak XV Partners, Sarvam позиционирует себя как мощного конкурента, стремящегося к революции в области ИИ.