Esta semana promete ser una de las más fuertes en temas de Inteligencia Artificial, siendo China nuevamente la protagonista con Qwen2.5-Max. Durante este miércoles, el consorcio chino dedicado al comercio web, Alibaba, estrenó su nuevo gran modelo de lenguaje (LLM) que dice superar a GPT-4o y el recién estrenado DeepSeek V3.
Basado en la arquitectura Mixture-of-Experts (MoE), Qwen2.5-Max fue preentrenado con más de 20 billones de tokens, que fueron ajustados mediante técnicas de Fine-Tuning Supervisado (SFT) y Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF). Actualmente, se encuentra disponible a través de una API en Alibaba Cloud y se puede interactuar con él mediante Qwen Chat.
Según revela el equipo, el modelo fue evaluado en diversos benchmarks reconocidos por la comunidad. Entre estos se incluye MMLU-Pro (evaluación de conocimientos a nivel universitario), LiveCodeBench (capacidades de codificación), LiveBench (evaluación de capacidades generales) y Arena-Hard (preferencias humanas). En estas pruebas, Qwen2.5-Max superó a otros modelos como DeepSeek V3, GPT-4o y Claude-3.5-Sonnet en varias categorías, demostrando su eficacia en tareas complejas.

Qwen2.5-Max: Disponibilidad, uso y Futuro
Los interesados pueden interactuar con Qwen2.5-Max a través de Qwen Chat o acceder a su API mediante Alibaba Cloud. También se puede probar una versión 7B de 1 millon de Tokens en LM Studio, que está disponible desde hace 5 días.
Para utilizar la API, es necesario registrar una cuenta en Alibaba Cloud, activar el servicio Model Studio y generar una clave API. Cabe destacar que la API es compatible con la de OpenAI, facilitando su integración en aplicaciones existentes.
Finalmente, el equipo de Qwen planea continuar ampliando el tamaño de los datos y del modelo para mejorar las capacidades de razonamiento y pensamiento de los modelos de lenguaje. Mediante la aplicación de técnicas avanzadas de aprendizaje por refuerzo, buscan desarrollar modelos que puedan superar la inteligencia humana y explorar nuevos horizontes en el conocimiento y la comprensión.