Alibaba пусна изкуствен интелект, за който твърди, че надминава DeepSeek-V3.

Китайската технологична компания "Алибаба" (Alibaba) пусна в сряда нова версия на своя модел с изкуствен интелект Qwen 2.5, за който твърди, че надминава високо оценения конкурент DeepSeek-V3.

Необичайното време на пускане на пазара на Qwen 2.5-Max - в първия ден от Лунната нова година, когато повечето китайци не са на работа и са със семействата си - се смята за олицетворение на натиска, оказан от шеметния възход на китайския AI стартъп DeepSeek през последните три седмици. И то не само спрямо чуждестранни съперници, но и вътрешната конкуренция.

"Qwen 2.5-Max превъзхожда ... почти навсякъде GPT-4o, DeepSeek-V3 и Llama-3.1-405B", каза облачното звено на Alibaba в съобщение, публикувано в официалния му канал в WeChat. Цитираните модели са най-модерните на OpenAI и Meta с отворен код.

Пускането от 10 януари на асистента за изкуствен интелект на DeepSeek, задвижван от модела DeepSeek-V3, както и премиерата на 20 януари на модела R1, шокира Силициевата долина и предизвика спад на акциите на технологичните компании поради съмнения на инвеститорите в огромните планирани разходи на водещи фирми за изкуствен интелект в САЩ.

Но успехът на DeepSeek доведе до битка и сред китайските конкуренти за надграждане на техните собствени модели на AI.

Два дни след пускането на DeepSeek-R1 компанията ByteDance (собственик на TikTok) пусна актуализация на своя водещ AI модел, за който твърди, че надминава поддържания от Microsoft OpenAI o1 в AIME - сравнителен тест, измерващ колко добре AI моделите разбират и реагират на сложни инструкции.

Alibaba пусна изкуствен интелект, за който твърди, че надминава DeepSeek-V3.

Това е на практика същото твърдение като това на DeepSeek, че неговият модел R1 съперничи на o1 на OpenAI по няколко показателя за ефективност.

DeepSeek-V2 (предшественикът на модела V3) предизвика ценова война на AI модели в Китай, след като беше пуснат миналия май.

Фактът, че DeepSeek-V2 е с отворен код и безпрецедентно евтин - само 1 юан ($0.14) за 1 милион токени (единици данни, обработени от AI модела) - принуди облачното звено на Alibaba да обяви намаления на цените до 97% за няколко модела.

Други китайски технологични компании последваха примера, включително Baidu, която пусна първия китайски еквивалент на ChatGPT през март 2023 г., и най-високо оценената интернет компания в страната Tencent.

Лян Уънфън, енигматичният основател на DeepSeek, каза в едно от много малкото си интервюта за китайската медия Waves през юли, че стартъпът "не се интересува" от ценовите войни и че постигането на AGI (изкуствен общ интелект) е основната му цел. (OpenAI определя AGI като автономни системи, които превъзхождат хората в повечето икономически значимите задачи.)

Докато големите китайски технологични компании като Alibaba имат стотици хиляди служители, DeepSeek работи като изследователска лаборатория, в която работят предимно млади висшисти и докторанти от водещи китайски университети.

Лян каза в интервюто си от юли, че вярва, че най-големите технологични компании в Китай може да не са подходящи за бъдещето на AI индустрията. Той противопостави техните високи разходи и структури, организирани да работят с нареждания отгоре, с доста по-леката организация на DeepSeek и свободния стил на управление.

"Големите базови модели изискват непрекъснати иновации, възможностите на технологичните гиганти имат своите предели", каза той.

Дневник лого

Дневник лого

Alibaba пусна изкуствен интелект, за който твърди, че надминава DeepSeek-V3.

На живо: Протестът на "Боец" пред МВР

Alibaba пусна изкуствен интелект, за който твърди, че надминава DeepSeek-V3.

На живо: Протестът на "Боец" пред МВР

Сподели

Какво е DeepSeek и защо предизвика трус в AI сектора

Борсите се възстановяват след историческа загуба на Nvidia и искат отговори за DeepSeek

Не може вечно да следваме САЩ, казва основателят на DeepSeek

Плащате 9, четете 18 месеца.