vivo lanza el primer gran modelo multimodal 3B para dispositivos con liderazgo en 10B

Eduardo Ruiz

4 meses hace

Categorías: Domotica

vivo lanza el primer gran modelo multimodal 3B para dispositivos con liderazgo en 10B

vivo ha presentado su nuevo modelo de inferencia multimodal a escala 3B para dispositivos edge, llamado Lanxin 3B. Tras un año de entrenamiento y optimización continua, este desarrollo se posiciona como el primero en la industria en integrar cinco capacidades clave en una arquitectura unificada “One Model” dentro del rango de 3.000 millones de parámetros. Además, vivo ha logrado extender la longitud del contexto soportado hasta 128.000 tokens, lo que potencia su capacidad para manejar secuencias de entrada complejas y muy extensas sin pérdida de precisión o coherencia.

En cuanto a rendimiento, Lanxin 3B ha destacado en distintos benchmarks especializados. En el leaderboard multimodal OpenCompass, el modelo ha superado a todos los competidores con 8.000 millones de parámetros, consolidándose como uno de los mejores en la categoría de modelos grandes con menos de 10 mil millones de parámetros. Asimismo, obtuvo la primera posición general en la evaluación SuperCLUE para modelos de IA de edge móvil dentro de la misma franja de parámetros. Otro logro de vivo es la calificación “L3 Excellence” otorgada por el Instituto Chino de Tecnología de la Información y las Comunicaciones (CAICT), que reconoce las prestaciones prácticas del modelo en servicios inteligentes para terminales.

Actualizaciones en la imagen con vivo Lanxin

Más allá del modelo de lenguaje, vivo ha anunciado mejoras significativas en su modelo de imagen Lanxin. La modernización se basa en una estrategia progresiva de entrenamiento por etapas, enfocada en optimizar la alineación entre las imágenes generadas y las descripciones textuales, así como en elevar la calidad visual. Además, se ha aplicado una profunda optimización basada en una red de control de glifos para resolver los retos en la representación de textos largos dentro de las imágenes, logrando una generación de caracteres más precisa y fiel al contenido original.

Gracias a este modelo de imagen mejorado, vivo ha ampliado las capacidades de edición fotográfica impulsadas por inteligencia artificial. Estas herramientas avanzadas ofrecen a los usuarios opciones más sofisticadas para refinar imágenes directamente en sus dispositivos, todo ello sin depender de procesamiento en la nube. Esta combinación de tecnologías refleja el compromiso de vivo por ofrecer soluciones de IA integradas, eficientes y adaptadas a las restricciones del hardware móvil.

Impulso a la inteligencia artificial de vivo en dispositivos edge

Estos avances evidencian el esfuerzo de vivo por liderar en IA integrada para dispositivos edge, combinando capacidades multimodales y una inferencia eficiente en modelos compactos. La combinación del entendimiento lingüístico con un procesamiento visual mejorado busca entregar servicios de inteligencia artificial contextualizados y de alto rendimiento, eliminando la necesidad de infraestructura cloud. Así, vivo refuerza su propuesta para usuarios que exigen soluciones inteligentes, rápidas y seguras directamente en sus terminales, marcando un paso adelante en la evolución de la IA móvil.

Fuente

La entrada vivo lanza el primer gran modelo multimodal 3B para dispositivos con liderazgo en 10B se publicó primero en Domótica en Casa.

Konnected se une al programa Works with Home Assistant »

« ZTE SC41: cámara de vigilancia con vídeo 2.5K y detección AI

Eduardo Ruiz: Informático de vocación, apasionado de la tecnología y blogger desde hace mucho tiempo, escribo de lo que me entretiene y disfruto con ello. Si deseas seguirme, usa el rss del blog o en mi perfil de Google+.

Xiaomi Mi Box 5 llega al mercado tras tres años de espera, con un precio desde 39 euros y soporte para 4K
La serie Mi Box 5 hizo su esperado regreso con el lanzamiento de la nueva…
Alexa Hunches, la intuición de Alexa
Una de las cosas que buscamos de los asistentes virtuales, es que nos ayuden en…