Отвъд ChatGPT: изкуственият интелект променя приложенията
Кой е казал, че жираф не може да ръководи оркестър? Или че Джон Ленън нямаше да е добър крал на Саудитска Арабия?
Изображенията в този текст може да се харесват, а може и човек бързо да открие, че в тях има нещо нередно, и работата в технологичния свят, която ще ги усъвършенства, да предстои.
Тази ситуация обобщава пазара на приложенията с изкуствен интелект в средата на годината.
Преди седмица световноизвестният бот ChatGPT за пръв път се появи като приложение за Android, осем месеца след като OpenAI го сподели със света. Оттогава се появиха и много други чатботове, които отнеха от блясъка на задъхващата се под тежестта на милионите заявки програма.
За това време, в което изкуственият интелект се радва на сериозен публичен интерес, но и открива границите си, неспирно се увеличават приложенията, построени на използването му или просто допълващи работата си с нови функционалностите.
Отвъд работата на чатботове и генериране на забавни (или полезни) разговори, сферите, в които изкуственият интелект навлиза в потребителски приложения, се увеличават; в други пробивът тепърва предстои. Ето няколко примера и от двете категории.
Генератори на изображения: от MidJourney до Dall-Е 2
Създаването на образи с изкуствен интелект е сред по-известните проявления в последно време. И преди ChatGPT разнообразието от продукти бе започнало да се разраства: от общодостъпния Crayon до Dall-E 2 на OpenAI и Midjourney, достъпен през Discord.
Сравненията в качеството на изображенията засега са в полза на Midjourney, използван и през май за възпроизвеждането на фалшив арест на Доналд Тръмп. Образите могат да са реалистични, могат да са и в избран стил и макар пресъздаването на хора понякога да е изпитание, част от работата му може дори да носи награди.

Недостатъкът и на този продукт, и на Dall-E 2 е, че са платени. Midjourney изисква и работа с Discord, което може да отблъсне някои потребители, но другите могат да открият интересни изображения - и подход към създаването им - в публично достъпните сървъри.
Ако целта е не създаване, а редактиране на изображения, по-подходяща е програмата Lensa. С инструменти за изкуствен интелект тя допълва ръчното редактиране, може автоматично да ретушира лица или да премахва нежелани обекти. Разбира кой е фонът в снимката и може добре да го заличи, може дори да синхронизира музика с видеоклипове (но безплатната версия също е силно ограничена).
С учебна цел
Учебната дейност не се нуждае непременно от изкуствен интелект, включително при изучаване на езици. Известното приложение Duolingo предоставя упражнения за слушане, четене и говорене на десетки езици по света - и то с игрови елемент, за да бъдат задържани потребителите. Така език може да се учи по малко всеки ден.
Изкуствен интелект се оказа подходящо допълнение за нагаждане на уроците към нуждата на всеки учещ се според представянето му. Чрез машинно самообучение Duolingo подобрява и курсовете.
Новото в последните месеци е абонаментният план Duolingo Max. Той стъпва на GPT-4 на OpenAI, за да позволи две нови функционалности: разговор за грешките с чатбот или дори за случайно познатите отговори (Explain My Answer) и разговор с бот в симулация на избрания език, с опция за напътствия (Roleplay).
Учебна цел" може да се тълкува и по-буквално и не само защото ChatGPT бе масово използван от американски и други ученици, за да пишат домашните си.
Помощ за същата цел - но не за възпроизвеждане на цял текст - дава Socratic, приложение, замисленое тъкмо за домашни. Учениците правят снимка на това, върху което работят, с телефона си. Изкуственият интелект предлага визуални обяснения, за да могат да го завършат, като предоставя съдействие по различни предметии - от литература и физика до тригонометрия. "Гугъл" притежава това приложение от 2018 г.
На същия принцип работи Gauthmath, макар и основно за математика: децата могат да снимат или да напишат въпроса си, от алгебра до вероятност и статистика и логика.

От звук към текст
Otter.ai е сред известните решения за транскрибиране на аудио. Лични и виртуални срещи оттук нататък може да бъдат и "прочетени", като се посочват участниците в разговора, с времеви маркери: сякаш човек чете работен чат. Достъпна е както в уеб версия, така и като приложение, и огранииченията отпадат с абонамент.
За по-точна (но без удобствата на маркерите) се смята програмата Speechmatics на базираната в Кембридж едноименна компания. Тя се занимава с разпознаване на глас от 2006 г., а езиците, на които работи, продължават да се увеличават (заедно с по-нюансирано разпознаване на гласове). Сега се е насочила към превод в реално време между 69 езикови двойки.
Помощ при нужда
Друга ниша, в която изкуственият интелект допълва съществуваща услуга: през далечната 2015 г. Be My Eyes е по-скоро комуникационно приложение. То позволява на хора с лошо зрение да се свързват със зрящ потребител чрез видеообаждане, за да получат помощ с всякакви ежедневни предизвикателства.
Създаването на GPT-4 на OpenAI отвори нови хоризонти: в бета версия е функционалност, която може да ограничи нуждата от обаждания. С инструмента Virtual Volunteer потребителите могат да направят снимка на своя проблем и чрез изкуствен интелект самата програма може да разчете и да се опита да помогне. Пример е снимка на продуктите в хладилник; човек със зрителни затруднения може да я подаде на Be My Eyes и да попита какви съставки се виждат вътре и какво може да се направи с тях за вечеря. Ако ботът не се справи, на линия все пак би бил доброволец. Колко успешен ще е крайният резултат, предстои да се разбере.
Приложения за всичко
Много от появилите се приложения с етикет "базирано на изкуствен интелект" или стари с добавени "функционалности с изкуствен интелект" все още не постигат успехите, с които биват рекламирани. Пример е базираният на GPT асистент Monica, който подрежда задачи, но трудно се справя с резюмиране на текст, по-дълъг от две страници. Не спират да се увеличават и програмите на ръба на етичните стандарти - такива, които се самопредставят за "правещи компания", събеседници за психологическа помощ, допълваща лекарската.
Не може да се каже, че тази технология не е полезна точно в момента, но "всъщност все още не знаем за какво ще е най-полезна", пише Джъстин Пот за сп. Wired.
Насред сегашната "треска за злато" технологията още е в ранния етап от живота си, все още възпроизвежда и неточно, несъществено или нежелано съдържание. При бурния растеж обаче не е известно дали и колко дълго тези недостатъци ще останат факт.