

El laboratorio indio de inteligencia artificial Sarvam ha introducido una innovadora generación de modelos de lenguaje extensos destinados a redefinir el panorama de la inteligencia artificial de código abierto. Presentados en la Cumbre de Impacto de IA de India en Nueva Delhi, este lanzamiento se alinea con la iniciativa estratégica de India para reducir la dependencia de plataformas de IA extranjeras, abordando las necesidades de lenguas regionales y casos de uso únicos. El avance de Sarvam incluye modelos con 30 mil millones y 105 mil millones de parámetros, complementados por un motor de texto a voz, un convertidor de voz a texto y un modelo de visión dirigido al análisis de documentos. Este desarrollo supera el modelo anterior de 2 mil millones de parámetros de octubre de 2024. Lo que diferencia a las nuevas incorporaciones de Sarvam es su arquitectura de mezcla de expertos, que optimiza la eficiencia al activar una menor fracción de sus parámetros en cualquier instancia, reduciendo así los costos de computación. El modelo de 30 mil millones admite un contexto extenso de 32,000 tokens, conductivo a salidas conversacionales, mientras que la variante de 105 mil millones amplía esto a una ventana de 128,000 tokens para manejar labores sofisticadas de razonamiento multiescalón. Sarvam se embarcó en la creación de estos modelos desde cero en lugar de mejorar marcos de código abierto preexistentes. Para su ensamblaje, el modelo de 30 mil millones se informó mediante un expansivo corpus de texto de 16 billones de tokens, mientras que el modelo de 105 mil millones abarcó una multitud de dialectos indios, reflejando su alcance comprehensivo. Los modelos están diseñados para un despliegue de aplicaciones en tiempo real sin interrupciones, apoyando funcionalidades en sistemas activados por voz e interfaces de chat en lenguas indias. Este logro fue impulsado por los recursos de la Misión IndiaAI respaldada por el estado de India, con la asistencia del operador de centros de datos Yotta y el gigante tecnológico Nvidia. El cofundador Pratyush Kumar destacó una perspectiva pragmática hacia la escalabilidad y aplicabilidad de los modelos, enfatizando un crecimiento con propósito basado en las necesidades sociales. Sarvam prevé liberar su prominente modelo como código abierto, aunque sin detallar aspectos específicos sobre el compartimiento de datos o lanzamientos de código completos. Mirando hacia el futuro, Sarvam aspira a expandirse en utilidades de IA personalizadas, con iniciativas como Sarvam for Work, dirigidas a la automatización empresarial, junto a Samvaad, una plataforma de agentes de IA conversacionales. Con más de 50 millones de dólares acumulados en financiación, anclados por Lightspeed Venture Partners, Khosla Ventures y Peak XV Partners, Sarvam se posiciona como un contendiente formidable con la intención de revolucionar la frontera de la inteligencia artificial.