China vuelve a golpear en IA: Alibaba lanza su modelo Qwen2.5-Max

29 enero 2025

Esta semana promete ser una de las más fuertes en temas de Inteligencia Artificial, siendo China nuevamente la protagonista con Qwen2.5-Max. Durante este miércoles, el consorcio chino dedicado al comercio web, Alibaba, estrenó su nuevo gran modelo de lenguaje (LLM) que dice superar a GPT-4o y el recién estrenado DeepSeek V3.

Basado en la arquitectura Mixture-of-Experts (MoE), Qwen2.5-Max fue preentrenado con más de 20 billones de tokens, que fueron ajustados mediante técnicas de Fine-Tuning Supervisado (SFT) y Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF). Actualmente, se encuentra disponible a través de una API en Alibaba Cloud y se puede interactuar con él mediante Qwen Chat.

Según revela el equipo, el modelo fue evaluado en diversos benchmarks reconocidos por la comunidad. Entre estos se incluye MMLU-Pro (evaluación de conocimientos a nivel universitario), LiveCodeBench (capacidades de codificación), LiveBench (evaluación de capacidades generales) y Arena-Hard (preferencias humanas). En estas pruebas, Qwen2.5-Max superó a otros modelos como DeepSeek V3, GPT-4o y Claude-3.5-Sonnet en varias categorías, demostrando su eficacia en tareas complejas.

Qwen2.5-Max: Disponibilidad, uso y Futuro

Los interesados pueden interactuar con Qwen2.5-Max a través de Qwen Chat o acceder a su API mediante Alibaba Cloud. También se puede probar una versión 7B de 1 millon de Tokens en LM Studio, que está disponible desde hace 5 días.

Para utilizar la API, es necesario registrar una cuenta en Alibaba Cloud, activar el servicio Model Studio y generar una clave API. Cabe destacar que la API es compatible con la de OpenAI, facilitando su integración en aplicaciones existentes.

Finalmente, el equipo de Qwen planea continuar ampliando el tamaño de los datos y del modelo para mejorar las capacidades de razonamiento y pensamiento de los modelos de lenguaje. Mediante la aplicación de técnicas avanzadas de aprendizaje por refuerzo, buscan desarrollar modelos que puedan superar la inteligencia humana y explorar nuevos horizontes en el conocimiento y la comprensión.

Artículo anterior

Sniper Elite: Resistance, Eternal Strands y 12 juegos más también llegan Xbox Game Pass en enero 2025

Artículo siguiente

Temporada 3 de The White Lotus presenta su tráiler oficial

China vuelve a golpear en IA: Alibaba lanza su modelo Qwen2.5-Max

Qwen2.5-Max: Disponibilidad, uso y Futuro

Últimos artículos

Primeras Impresiones | Marvel Tokon: Fighting Souls

El chileno Craime gana el campeonato de Street Fighter 6 en la Esports World Cup 2026

Review | Xiaomi 17T, la base del balance precio-calidad

Los juegos gratis de PlayStation Plus para agosto 2026

Nintendo Switch Online recibirá a Super Mario Sunshine y 2 cancelados de Virtual Boy

Destacados

Primeras Impresiones | Marvel Tokon: Fighting Souls

El chileno Craime gana el campeonato de Street Fighter 6 en la Esports World Cup 2026

Review | Xiaomi 17T, la base del balance precio-calidad

Review | Granblue Fantasy: Relink – Endless Ragnarok, la expansión del endgame

Guía | Ragnarok Origin Classic América: Todo lo que necesitas saber

Primeras Impresiones | Marvel Tokon: Fighting Souls

El chileno Craime gana el campeonato de Street Fighter 6 en...