Alibaba lanza el modelo de IA que dice supera a DeepSeek

BEIJING, 29 ene (Reuters) - Empresa tecnológica china Alibaba (9988.HK, abre nueva pestaña el miércoles lanzó una nueva versión de su Modelo de inteligencia artificial Qwen 2.5 que afirmó superó al altamente aclamado DeepSeek-V3.

El momento inusual del lanzamiento de Qwen 2.5-Max, el primer día del Año Nuevo Lunar cuando la mayoría de los chinos están fuera del trabajo y con sus familias, apunta a la presión de la startup china de IA El ascenso meteórico de DeepSeek en las últimas tres semanas se ha colocado no solo en rivales extranjeros, sino también en su competencia nacional.

"Qwen 2.5-Max supera a ... casi en todos los ámbitos GPT-4o, DeepSeek-V3 y Llama-3.1-405B", dijo la unidad en la nube de Alibaba en un anuncio publicado en su cuenta oficial de WeChat, refiriéndose a los modelos de IA de código abierto más avanzados de OpenAI y Meta.

El lanzamiento en enero 10 del asistente de IA de DeepSeek, impulsado por el modelo DeepSeek-V3, así como el lanzamiento en enero 20 de su modelo R1, ha conmocionado a Silicon Valley y ha provocado que las acciones tecnológicas se desplomen, con la startup china supuestamente bajos costos de desarrollo y uso lo que llevó a los inversores a cuestionar enormes planes de gasto de las principales empresas de IA en los Estados Unidos.

Pero el éxito de DeepSeek también ha llevado a una lucha entre sus competidores nacionales para actualizar sus propios modelos de IA.

Dos días después del lanzamiento de DeepSeek-R1, el propietario de TikTok, ByteDance lanzó una actualización de su modelo insignia de IA, que según afirmó superó al o1 de OpenAI respaldado por Microsoft en AIME, una prueba de referencia que mide qué tan bien los modelos de IA entienden y responden a instrucciones complejas.

Esto se hizo eco de la afirmación de DeepSeek de que su modelo R1 rivalizaba con el o1 de OpenAI en varios puntos de referencia de rendimiento.

DEEPSEEK VERSUS COMPETIDORES NACIONALES

El predecesor del modelo V3 de DeepSeek, DeepSeek-V2, activó un AI modelo de guerra de precios en China después de su lanzamiento en mayo pasado.

El hecho de que DeepSeek-V2 fuera de código abierto y sin precedentes barato, solo 1 yuan ($0.14) por 1 millón de tokens, o unidades de datos procesados por el modelo AI, llevó a la unidad de nube de Alibaba anunciando recortes de precios de hasta el 97% en una gama de modelos.

Otras compañías tecnológicas chinas hicieron lo mismo, incluido Baidu (9888.HK, abre nueva pestaña, que liberado El primer equivalente de China a ChatGPT en marzo de 2023, y la compañía de Internet más valiosa del país, Tencent (0700.HK, abre nueva pestaña.

Liang Wenfeng, El enigmático fundador de DeepSeek'', dijo en una rara entrevista con el medio de comunicación chino Waves en julio que a la startup "no le importaban" las guerras de precios y que lograr AGI (inteligencia general artificial) era su objetivo principal.

OpenAI define AGI como sistemas autónomos que superan a los humanos en la mayoría de las tareas económicamente valiosas.

Mientras que las grandes compañías tecnológicas chinas como Alibaba tienen cientos de miles de empleados, DeepSeek opera como un laboratorio de investigación, atendido principalmente por jóvenes graduados y estudiantes de doctorado de las mejores universidades chinas.

Liang dijo en su entrevista de julio que creía que las compañías tecnológicas más grandes de China podrían no ser adecuadas para el futuro de la industria de la IA, contrastando sus altos costos y estructuras de arriba hacia abajo con la operación lean de DeepSeek y el estilo de gestión suelto.

"Los grandes modelos fundamentales requieren una innovación continua, las capacidades de los gigantes tecnológicos tienen sus límites", dijo.

Published on: 29/1/25 14:33