Новата индустриализация: България се готви да отвори Фабрика за изкуствен интелект


Пускането на изкуствения интелект за масова употреба промени много неща, а още повече промени се очакват - видимо с просто око не само за лаиците, но и за заетите в сферите, в които това научно достижение потенциално ще направи ненужни редица работни места.
Възможностите му предстои да се видят и когато бъдат внедрени в суперкомпютъра "Дискавърър" (Discoverer), с който България разполага и с който се хвалят някои политици. Не без основание, ако става дума за възможностите на машината. В края на месеца по план се очаква да приключи надграждането им и това се очаква с нетърпение в Европа, която държи 50% от проектите, за които суперкомпютърът прави изчисления.
Какво ще се промени
"Дискавърър" е част от европейската система EuroHPC - публично-частна организация в рамките на ЕС, която има за цел да подпомогне развитието на паневропейска инфраструктура от суперкомпютри. Той идва в България след опит с други две мощни машини - Blue Gene и "Авитохол" в БАН.
През юли 2024 г. беше обявен проектът за надграждането на машината, който сега е в самия си край. Това включва инсталирането на графични процесори и памет, които ще подобрят работата на машината и ще й дадат възможност да предоставя допълнителни специализирани услуги на компании, които работят в областта на изкуствения интелект.
Европейските проекти се планират на 6-месечна база и партньорите на България в мрежата очакват приключването на процеса, за да изпратят одобрените вече за изпълнение, разказа пред "Дневник" Кирил Кирилов, оперативният директор на консорциума "Петаксейл суперкомпютър - България", който управлява "Дискавърър". В очакване са и 2 проекта от България.
Надграждането, финансирано по проект от Euro HPC JU, включва инсталирането на графичния процесор Н200 на NVIDIA - в Европа има недостиг на мощности с такива процесори. В България и в тази част на Европа това е първият такъв процесор.
Чрез него ще може да се тренират невронни мрежи, което има пряко приложение в обучението на изкуствения интелект при работа с малки езикови модели като българския. При тях интелектът е изостанал с обучението си за разлика от случая с английския език, например.

Моделите за малките езици ще могат да се ползват от реалния бизнес. Например, ще дават възможност да се дава гласова заявка за услуга в хотел докато клиентът шофира към него - без да се налага да използва пръстите си за целта. Точно по примера на гласовите команди, които приемат компютрите на всички съвременни автомобили.
Допълнително поле за работа ще се отвори в областта на машинното самообучение (Machine learning), което намира приложение в автономните автомобили. "Когато невронната мрежа вече е тренирана, тя позволява мигновена реакция на тези автомобили - в рамките на милисекундата", посочва Кирилов. Освен това така се свалят разходите на енергия, което е ключово за тези превозни средства.
Изкуственият интелект непрекъснато трябва да се обучава тъкмо за да може да работи с модели за малки езици, за да не халюцинира. Под този термин, който бе обявен през 2023 г. за дума на годината от речника на "Кеймбридж", се разбира способността на големите езикови модели да генерират правдоподобни текстове, но често го правят, използвайки неверни, подвеждащи или измислени "факти".

Речникът на "Кеймбридж" обяви Думата на годината
Кирилов посочва, че голямото предизвикателство с днешна дата е, че изкуственият интелект е използвал вече всички налични данни за обучението си и започва да ползва собствените си, наричани синтетични, за самообучение, което може да доведе до изкривявания. "Ще видим като се смесят истинските данни със синтетичните накъде ще отидат нещата", казва той.
Фабрика за изкуствен интелект в България
Екипът на суперкомпютъра - около 10 специалисти, се готви да кандидатства с проект за създаването на фабрика за изкуствен интелект, базирана в България. В случая, тъй като става дума за голям проект, това се прави съвместно и с учени от ИНСАИТ - водещ институт в областта на изкуствения интелект.
Наскоро се разбра, че държавата няма готовност на този етап да осигури съфинансиране за фабриката. От отговор на служебния министър на иновациите и растежа Росен Карадимов през декември на въпрос на депутата от "Продължаваме промяната - Демократична България" Ивайло Мирчев се вижда, че ведомството насърчава да се участва в конкурса на ЕuroHPC JU за създаване на Фабрика за изкуствен интелект, но няма предвиден бюджет за това. Сметките на ведомството показват, че за изпълнението на проекта ще са нужни 45 млн. евро национално съфинансиране. Все пак е пратено до Министерството на финансите писмо по въпроса, но към средата на декември процедурата не е завършила.

Кирилов обяснява, че работата, която трябва да се свърши, за да се кандидатства по програмата, и която включва ангажимент за много хора, е да се покаже наличието на знания у екипа, да се посочат реални фирми, с които ще се работи, конкретни проекти, които ще се изпълняват и бюджети, описани до ниво заплата и т. н.
Целта на фабриката отново ще е да изпълнява задачи за целия регион, не само за български проекти. Кирилов посочва, че тя първо трябва да произведе обучени хора, да произвежда знания, а след това и готови обучени модели, които бизнесът да може да ползва. На следващ етап ще е задачата да произвежда изкуствен интелект, който да направи роботите мислещи, а не просто изпълняващи заложени им функции.
Липсата на такава фабрика Кирилов сравнява с липсата на предприятия като "Кремиковци" или АЕЦ в миналото. "Ако ние в момента не участваме, ще се окажем в миналия век. Това е новата индустриализация".
Когато финансирането свърши
"Дискавърър" е с изчислителна мощ 4.5 петафлопа, което означава, че може да прави означава 4.5 милиона милиарда изчисления в секунда.Той е в световната класация за високопроизводителни машини TOP 500 като към края на 2024 г. е на 166 позиция. При инсталирането му е бил на доста по-предна позиция, а изпадането по-надолу показва, че глобално са влезли в употреба още също много мощни машини.
По задание суперкомпютърът, чието създаване и оперативна дейност се финансират поравно от ЕС и от националния бюджет, трябва да ползва 65% от капацитета си за български проекти и 35% за европейски. В същото време 80% от дейността му е безплатна за одобрените проекти и има право на 20% търговска дейност, при която не се формира печалба, а поръчителите плащат разходите по направеното изчисление.
В системата на Euro HPC - съвместното предприятие за европейски високопроизводителни изчислителни технологии, в момента има 5 петаскейл компютъра като "Дискавърър", 3 преекзаскейл и още 3 екзаскейл, които се изграждат.

По силата на условията по създаването му дейността на суперкомпютъра е обезпечена финансово за още около 2 г., когато се навършват 5 г. от създаването му. Екипът му вече мисли как да продължи финансирането. В допълнение дотогава ще има много по-мощни компютри в действие и "Дискавърър" ще падне още в глобалната класация.
Това, разбира се, не го прави неизползваем, но поддръжката му вече ще е по-трудна защото ще е следгаранционна с всички особености на това, които знае всеки притежател на техника. Тоест, рентабилността му ще се понижи. По-новите машини харчат по-малко ток, а неговите разходи ще останат високи. Годишната сметка само за ток е около 1.2 млн. лв.
Добрата новина е, че след тези 5 г. отпада изискването финансирането да идва само от източниците, които са заложени със създаването и ще може, вероятно, в издръжката да се включат и частни фирми. Екипът се оглежда и за различни програми, по които може да кандидатства за финансиране.
"Хубавото е, че сме малък екип и сме много прагматични. Тоест, не можем да си позволим нещо, което не носи полза", обяснява Кирилов.
До 100% от капацитета
Натовареността на суперкомпютъра варира като средно се ползват 60-70% от капацитета му. Причината е, че проектите са с различна дължина. Мнението на работещия с него екип е, че възможностите му не се използват достатъчно най-вече от бизнеса, който има нужда да бъде обучен за целта.
"Софтуерът, писан за малките и средните предприятия, е със сериен код, докато кодът в суперкомпютъра е паралелен", обяснява Кирилов. Това налага преработване на софтуера на бизнеса като понякога е по-лесно да бъде пренаписан.
Консорциумът, който управлява суперкомпютъра, е спечелили проект за 600 хил. евро, съфинансиран наполовина от държавата, за да помага безплатно на бизнеса. "Европейската комисия разбира, че няма достатъчно знания в бизнеса, за да използва суперкомпютъра", посочва Кирилов.
Проектите, които са безплатни за авторите, преминават през няколко степени на оценка като се преценява и дали ще има полза от тях. Тези, които се подават през Европа, се планират за 6 месеца напред, докато тези, с които се кандидатства от България, се разглеждат за около седмица и при първа възможност започват нужните по тях изчисления.
На такава предварителна оценка не подлежат проектите, за които се плаща изчислението, но и никой не би плащал за безполезен проект. "Целта ни е да стимулираме българските учени, да не ги бавим да чакат 3 месеца и едва след това да започнат работа", посочва Кирилов.
Единственият ангажимент на изпълнителите на проекти е да направят после научна публикация за проекта, изпълнен благодарение на изчисленията, направени от суперкомпютъра.
Лечение на туморни клетки, зелен водород в бита и още проекти
През изтеклата 2024 г. суперкомпютърът е ползван в 10 български проекта. Сред тях е такъв за движението на флуидите, който има за цел да намери приложение в спирателните кранове, чиято устойчивост на пропускане намалява с времето.
Друг е работа с туморни клетки, от които да се създадат иРНК модели, които да възстановят засегнатите след химиотерапия.
Проект за предизвестяване на горски пожари, който се базира на исторически данни за температурите и други обстоятелства е сред изпълнените. Той има и потенциално продължение, което да обхване изхвърляните при горски пожари вещества във въздуха.
Друг проект е свързан с употребата в бита на зеления водород. За да гори, към него трябва да се добави газ, но смесването им връща струя към горелката, което създава условия за взрив. Затова се прави симулация на процесите, за да се намери безопасно ползване.
В момента пък се работи по проект на института "Бен Гурион", който цели да се създаде модел за предвиждане на трусовете в разлома по дъното на Мъртво море. При успех моделът ще може да се прилага и за други подобни разломи.
С НИМХ се работи по проект за създаване на дългосрочни прогнози - за 10-15 г. Моделът вече се ползва от института и данните не са обнадеждаващи за количеството води, на които може да разчита България предвид климатичните промени. Такъв проект може да даде насоки на държавата какви мерки да взима. Кирилов дава пример с Испания, където вече се работи по изграждането на подземна инфраструктура, която да отвежда водите от проливни валежи, които водят до бедствия като това в района на Валенсия.
Целогодишно и без почивка се правят изчисленията със суперкомпютъра. Най-честите му - четири пъти дневно, са тези за целите на РВД. При тях на основата на данни от Европейския метеорологичен институт се правят изчисления, нужни за прогнозата над пистата на летище София.