"Алибаба" вдигна залога в китайската надпревара с ново поколение конкурент на "Дийпсийк"

Китайската платформа за електронна търговия Alibaba представи трето поколение модели за изкуствен интелект Qwen, които въвеждат нов начин на мислене за въпроси, изискващи по-задълбочено разсъждение и оптимизирани с възможности на агенти. Според компанията тя се конкурира с DeepSeek в няколко аспекта, включително математика и програмиране, отбелязва "Ел Паис".
Този модел има 235 млрд. параметъра, 22 млрд. от които са активирани, както е описано подробно от технологичната компания в GitHub. Има и друг по-малък модел, Qwen3-30B-A3B, с 30 млрд. параметъра и 3 млрд. активирани параметъра.
И двата са разработени с архитектура на смес от експерти (MoE), която има способността да разделя модел на малки невронни мрежи, така че те да действат отделно, сякаш са различни експерти; така задачите се решават по-ефективно, разходите за внедряване в работа намаляват.
