La potencia china de tecnología y comercio electrónico Alibaba Group Holding Ltd. ha presentado Qwen 2.5 Max, un modelo de IA de vanguardia que la compañía afirma que supera en Deepseek v3, una afirmación contundente hecha menos de tres semanas después del esperado lanzamiento de Deepseek el 10 de enero. Alibaba alabó el lunes pasado a su otro competidor chino, pero no cierra la semana sin marcar perfil propio. Una carrera feroz dentro del mismo gigante asiático que coincide con el año nuevo de este país.

Según Alibaba, Qwen 2.5 Max supera los principales modelos de IA de Deepseek, OpenAI y Meta en evaluaciones de rendimiento. El modelo demostró resultados superiores en varios puntos de referencia, incluidos Arena-Hard, LiveBench, LiveCodeBench, MMLU y GPQA-Diamond. En particular, sus puntuaciones en MMLU y LiveCodeBench establecen nuevos estándares de la industria, destacando sus capacidades avanzadas.

Sobre Qwen

Alibaba Cloud proporciona series de modelos Tongyi Qianwen (Qwen) a la comunidad de código abierto. Esta serie incluye Qwen, el gran modelo de lenguaje (LLM); Qwen-VL, el gran modelo de visión del lenguaje; Qwen-Audio, el modelo de audio de gran lenguaje; Qwen-Coder, el modelo de codificación; y Qwen-Math, el modelo matemático. Podéis probar los modelos Qwen y personalizarlos y desplegarles fácilmente en Alibaba Cloud Model Studio.

Los últimos modelos Qwen 2.5 están entrenados previamente con un conjunto de datos a gran escala, que incluye hasta 18 billones de fichas. En comparación con Qwen2, Qwen2.5 ha adquirido mucho más conocimientos y ha mejorado mucho las capacidades de codificación (HumanEval 85+) y matemáticas (MATH 80+). Además, los nuevos modelos han mejorado significativamente al seguir instrucciones, generar textos largos, comprender datos estructurados y generar salidas estructuradas.

Los modelos Qwen2.5 generalmente son más resistentes a la diversidad de indicaciones del sistema, mejorando la implementación de juegos de rol y la configuración de condiciones para los chatbots. Qwen2.5-Coder se ha entrenado con 5,5 billones de fichas de datos relacionadas con el código, ofreciendo un rendimiento competitivo en comparación con modelos de lenguaje mayores en los puntos de referencia de evaluación de codificación. Qwen2.5-Math admite tanto el chino como el inglés e incorpora varios métodos de razonamiento, como Chain-of-Thought (CoT), Program-of-Thought (PoT) y Tool-Integrated Reasoning (TIRO).

Las principales características son:

Rendimiento líder en múltiples dimensiones

Qwen supera otros modelos de referencia de código abierto de tamaños similares en una serie de conjuntos de datos de referencia que evalúan la comprensión del lenguaje natural, la resolución de problemas matemáticos, la codificación, etc.

Personalización fácil y de bajo coste

Podéis implementar modelos Qwen con unos cuantos clics en PAI-EAS y ajustarlos con vuestros datos almacenados a Alibaba Cloud o fuentes externas para llevar a cabo tareas específicas del sector o de la empresa.

Aplicaciones para la era de la IA generativa

Podéis aprovechar las API de Qwen para crear aplicaciones de IA generativas para una amplia gama de escenarios como la escritura, la generación de imágenes, el análisis de audio, etc. para mejorar la eficiencia del trabajo a vuestra organización y transformar la experiencia del cliente.

Todo es una estrategia

La presentación de Qwen 2.5 Max parece estratégicamente programada, cosa que podría reflejar la presión creciente dentro del propio sector tecnológico de la China para mantener el impulso competitivo contra los rivales extranjeros. El anuncio llega el 29 de enero de 2025, el primer día del Año Nuevo Lunar, un día festivo importante cuando la mayoría de las empresas chinas interrumpen temporalmente sus operaciones. Esta revelación temprana pone de manifiesto la determinación de Alibaba de mantener su posición de liderazgo en innovación en IA a pesar del aumento de la competencia provocada por Deepseek. A medida que la tecnología de IA sigue evolucionando a un ritmo rápido, la última consecución de Alibaba indica otro paso adelante en la carrera mundial de IA.