Alibaba пусна изкуствен интелект, за който твърди, че надминава DeepSeek-V3.

На живо
На живо: Протестът на "Боец" пред МВР

Alibaba пусна изкуствен интелект, за който твърди, че надминава DeepSeek-V3.

Alibaba пусна изкуствен интелект, за който твърди, че надминава DeepSeek-V3.
Reuters
Китайската технологична компания "Алибаба" (Alibaba) пусна в сряда нова версия на своя модел с изкуствен интелект Qwen 2.5, за който твърди, че надминава високо оценения конкурент DeepSeek-V3.
Необичайното време на пускане на пазара на Qwen 2.5-Max - в първия ден от Лунната нова година, когато повечето китайци не са на работа и са със семействата си - се смята за олицетворение на натиска, оказан от шеметния възход на китайския AI стартъп DeepSeek през последните три седмици. И то не само спрямо чуждестранни съперници, но и вътрешната конкуренция.
"Qwen 2.5-Max превъзхожда ... почти навсякъде GPT-4o, DeepSeek-V3 и Llama-3.1-405B", каза облачното звено на Alibaba в съобщение, публикувано в официалния му канал в WeChat. Цитираните модели са най-модерните на OpenAI и Meta с отворен код.
Пускането от 10 януари на асистента за изкуствен интелект на DeepSeek, задвижван от модела DeepSeek-V3, както и премиерата на 20 януари на модела R1, шокира Силициевата долина и предизвика спад на акциите на технологичните компании поради съмнения на инвеститорите в огромните планирани разходи на водещи фирми за изкуствен интелект в САЩ.
Но успехът на DeepSeek доведе до битка и сред китайските конкуренти за надграждане на техните собствени модели на AI.
Два дни след пускането на DeepSeek-R1 компанията ByteDance (собственик на TikTok) пусна актуализация на своя водещ AI модел, за който твърди, че надминава поддържания от Microsoft OpenAI o1 в AIME - сравнителен тест, измерващ колко добре AI моделите разбират и реагират на сложни инструкции.
Alibaba пусна изкуствен интелект, за който твърди, че надминава DeepSeek-V3.
Reuters
Това е на практика същото твърдение като това на DeepSeek, че неговият модел R1 съперничи на o1 на OpenAI по няколко показателя за ефективност.
DeepSeek-V2 (предшественикът на модела V3) предизвика ценова война на AI модели в Китай, след като беше пуснат миналия май.
  • Фактът, че DeepSeek-V2 е с отворен код и безпрецедентно евтин - само 1 юан ($0.14) за 1 милион токени (единици данни, обработени от AI модела) - принуди облачното звено на Alibaba да обяви намаления на цените до 97% за няколко модела.
  • Други китайски технологични компании последваха примера, включително Baidu, която пусна първия китайски еквивалент на ChatGPT през март 2023 г., и най-високо оценената интернет компания в страната Tencent.
Лян Уънфън, енигматичният основател на DeepSeek, каза в едно от много малкото си интервюта за китайската медия Waves през юли, че стартъпът "не се интересува" от ценовите войни и че постигането на AGI (изкуствен общ интелект) е основната му цел. (OpenAI определя AGI като автономни системи, които превъзхождат хората в повечето икономически значимите задачи.)
Докато големите китайски технологични компании като Alibaba имат стотици хиляди служители, DeepSeek работи като изследователска лаборатория, в която работят предимно млади висшисти и докторанти от водещи китайски университети.
Лян каза в интервюто си от юли, че вярва, че най-големите технологични компании в Китай може да не са подходящи за бъдещето на AI индустрията. Той противопостави техните високи разходи и структури, организирани да работят с нареждания отгоре, с доста по-леката организация на DeepSeek и свободния стил на управление.
"Големите базови модели изискват непрекъснати иновации, възможностите на технологичните гиганти имат своите предели", каза той.