InicioTecnologíaInteligencia ArtificialChina vuelve a golpear en IA: Alibaba lanza su modelo Qwen2.5-Max

China vuelve a golpear en IA: Alibaba lanza su modelo Qwen2.5-Max

El nuevo LLM chino supera a DeepSeek V3 y GPT-4o en campos como LiveCodeBench y Arena-Hard

Esta semana promete ser una de las más fuertes en temas de Inteligencia Artificial, siendo China nuevamente la protagonista con Qwen2.5-Max. Durante este miércoles, el consorcio chino dedicado al comercio web, Alibaba, estrenó su nuevo gran modelo de lenguaje (LLM) que dice superar a GPT-4o y el recién estrenado DeepSeek V3.

Basado en la arquitectura Mixture-of-Experts (MoE), Qwen2.5-Max fue preentrenado con más de 20 billones de tokens, que fueron ajustados mediante técnicas de Fine-Tuning Supervisado (SFT) y Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF). Actualmente, se encuentra disponible a través de una API en Alibaba Cloud y se puede interactuar con él mediante Qwen Chat.

Según revela el equipo, el modelo fue evaluado en diversos benchmarks reconocidos por la comunidad. Entre estos se incluye MMLU-Pro (evaluación de conocimientos a nivel universitario), LiveCodeBench (capacidades de codificación), LiveBench (evaluación de capacidades generales) y Arena-Hard (preferencias humanas). En estas pruebas, Qwen2.5-Max superó a otros modelos como DeepSeek V3, GPT-4o y Claude-3.5-Sonnet en varias categorías, demostrando su eficacia en tareas complejas.

Qwen2.5-Max: Disponibilidad, uso y Futuro

Los interesados pueden interactuar con Qwen2.5-Max a través de Qwen Chat o acceder a su API mediante Alibaba Cloud. También se puede probar una versión 7B de 1 millon de Tokens en LM Studio, que está disponible desde hace 5 días.

Para utilizar la API, es necesario registrar una cuenta en Alibaba Cloud, activar el servicio Model Studio y generar una clave API. Cabe destacar que la API es compatible con la de OpenAI, facilitando su integración en aplicaciones existentes.

Finalmente, el equipo de Qwen planea continuar ampliando el tamaño de los datos y del modelo para mejorar las capacidades de razonamiento y pensamiento de los modelos de lenguaje. Mediante la aplicación de técnicas avanzadas de aprendizaje por refuerzo, buscan desarrollar modelos que puedan superar la inteligencia humana y explorar nuevos horizontes en el conocimiento y la comprensión.

Darío "Kentaro Darkdox" Pérez
Darío "Kentaro Darkdox" Pérez
Director de Alerta Geek. Creador de contenido y especialista en cultura geek, tecnología, cine, videojuegos y anime.

Próximos eventos

¡Siguenos!

50,000FansMe gusta
2,000SeguidoresSeguir
1,000SeguidoresSeguir
1,000SeguidoresSeguir
1,000SeguidoresSeguir

Últimas noticias

Te recomendamos leer: