

Індійська лабораторія штучного інтелекту Sarvam представила інноваційне покоління великих мовних моделей, які готуються переглянути ландшафт платформ з відкритим кодом у галузі штучного інтелекту. Представлений на саміті India AI Impact Summit у Нью-Делі, цей запуск відповідає стратегічній ініціативі Індії щодо зменшення залежності від іноземних платформ штучного інтелекту, задовольняючи потреби в регіональних мовах та унікальних випадках використання. Розробки Sarvam включають моделі з 30 мільярдами та 105 мільярдами параметрів, доповнені рушієм перетворення тексту в мову, конвертером «з мови в текст» та візійною моделлю для обробки документів. Цей розвиток випереджає їхню попередню модель на 2 мільярди параметрів з жовтня 2024 року. Що відрізняє нові розробки Sarvam, так це їхня архітектура суміші експертів, яка оптимізує ефективність, активуючи меншу частину параметрів у будь-який момент часу, таким чином знижуючи витрати на обчислення. Модель з 30 мільярдами параметрів підтримує розширений контекст до 32 000 токенів, що сприяє виробленню розмовних відповідей, тоді як варіант з 105 мільярдами параметрів розширює це до вікна у 128 000 токенів для забезпечення комплексного, багатоступеневого міркування. Sarvam почала створювати ці моделі з нуля, замість того щоб удосконалити існуючі рамки з відкритим кодом. Для створення моделі з 30 мільярдами параметрів було використано 16 трильйонів текстових токенів, тоді як модель з 105 мільярдами параметрів охопила безліч індійських діалектів, відображаючи її загальнодосяжність. Моделі розроблені для безперебійного розгортання реальних додатків, підтримуючи функціональність у системах з голосовим керуванням та чат-інтерфейсах індійськими мовами. Це досягнення було здійснено завдяки ресурсам державної місії Індії IndiaAI Mission, за підтримки оператора дата-центрів Yotta та технологічного гіганта Nvidia. Співзасновник Пратюш Кумар підкреслив прагматичний підхід до масштабування та застосування моделей, наголошуючи на цілеспрямованому зростанні, що спирається на суспільні потреби. Sarvam планує відкрити свої вагомі моделі, хоча не уточнює деталізацію щодо обміну даними або повного випуску коду. У майбутньому Sarvam прагне розширити свої можливості у галузі спеціалізованих утиліт штучного інтелекту, з ініціативами, такими як Sarvam для роботи, що орієнтовані на автоматизацію підприємств, а також Samvaad, платформа для розмовного штучного інтелекту. Накопичивши понад 50 мільйонів доларів фінансування, за підтримки Lightspeed Venture Partners, Khosla Ventures і Peak XV Partners, Sarvam позиціонує себе як потужний претендент, який має намір революціонізувати фронт штучного інтелекту.