Онтотекст представи възможностите на отворените данни (Open Data) на среща в София
Българската софтуерна компания "Онтотекст" АД представи възможностите на отворените данни в рамките на третата софийска среща, посветена на отворените и свързаните данни (Open Data and Linked Data).
Събитието, което се проведе на 16 юни в Академията на Телерик, беше организирано от Sofia Open Data & Linked Data Group – неформална организация имаща за цел популяризирането на отворени и свързани данни (Open Data / Linked Data), заедно със Data Science Society – неформална българска организация, посветена на развитието на науката за данните и подкрепата на споделянето на знание, образованието и бизнеса в тази сфера.
Отворените данни представляват концепция за масиви от данни, които са публично достъпни и могат да бъдат използвани от всеки желаещ. Днес този подход се използва все по-често за създаването на нови платформи в областта на градоустройството, икономиката, науката, културното наследство, различни географски системи и др.
В различни градове по света платформите за отворени данни позволяват оптимизиране на градския транспорт, прогнозиране на потенциални проблеми като честотата на извършване на престъпления или на пожари, замърсяването на въздуха и др.
Като един от водещите разработчици на семантични технологии в света "Онтотекст" работи по редица проекти, включващи отворени данни. "Онтотекст" е част от групата на "Сирма Груп Холдинг" АД, която планира скорошно първоначално публично предлагане (IPO) на Българската фондова борса (БФБ-София).
По време на събитието Димитрис Контокостас, който е главен технически директор на Асоциацията DBpedia и изследовател в един от най-големите в света изследователски центрове за сцързани данни – Agile Knowledge & Semantic Web Group (част от университета в Лайпциг), разказа как е създаден международният проект за извличане на структурирани отворени данни от Wikipedia - dbpedia.org и представи актуалните тенденции в сферата на свързаните и отворени данни.
Проектът, който съществува от 2007 г., позволява извличане на данни от Wikipedia и използването им за отговор на комплексни въпроси като например: "Кои са всички футболисти, които са играли на позицията вратар, за клубове със стадион с над 40 000 места и които са родени в страна с над 10 милиона души население?". Към момента платформата има локализирани версии на 125 езика и предоставя данни за почти 40 милиона обекта (хора, организации, географски локации).
Владимир Алексиев, главен експерт в "Онтотекст" в сферата на онтологичния инженеринг и свързаните отворени данни представи в рамките на срещата развитието на българската версия на DBpedia - bg.dbpedia.org, която работи у нас от малко повече от година.
Към декември 2014 г. тя включва 12 853 939 факти, 272 600 страници с информация, както и данни за 34 800 хора, 5700 организации и 15 621 места. В рамките на презентацията си Алексиев обясни, че в момента се търсят и ентусиасти, които имат желание да работят по неговото подобряване.
Серги Сергиев, един от основателите на Data Science Society, от своя страна представи организацията, която е единствената у нас, фокусирана върху развитието на иновативни технологии като Deep Learning, Natural Language Processing, Machine Learning for Music, Computer Vision и др. Създадена преди около година, тя стимулира сътрудничество между науката, бизнеса и образованието с цел споделяне на знание в сферата на отворените данни, популяризирането на този сегмент, откриването на възможности за бизнес и за обществени проекти в него. Проектите на организацията са насочени към анализ на данни от образователната сфера, медийния бранш, създаването на библиотеки с отворен код и др.
Самото събитие беше записано и излъчено на живо в интернет – можете да видите видео записа тук:
Повече за Онтотекст
Онтотекст е водещ доставчик на интелигентни бази от данни и системи за управление на документи и съдържание. Продуктите на Онтотекст стъпват на изследвания и иновации в няколко области: анализ на текст (NLP), бази от знания (knowledge bases), семантичен уеб (Semantic Web, Linked Open Data), графови бази данни (NoSQL), пълнотекстово търсене.
Решенията, създавани с технологиите на Онтотекст, пестят значително време и финансови ресурси в процеса на достъп и обработка на текст и данни от множество източници в сферата на науките за живота (фармацевтика, медицина, биология), издателската дейност, анализ на данни (Business Intelligence), телекомуникациите, набирането на персонал и други.
Сред клиентите на Онтотекст са организации като BBC, Financial Times, Press Association, Euromoney, AstraZeneca, John Wiley & Sons, Oxford University Press, , Korea Telecom, telekom Italia, , Организация на Обединените Нации, Британския Парламент, Британския музей, Getty Trust и други. През последните десет години Онтотекст се е наложила и като важен участник в редица значими проекти с отворен код, като GATE и Sesame. Компанията е една от най-иновативните и успешни български софтуерни фирми и е част от Сирма Груп Холдинг.
Повече за "Сирма Груп Холдинг" АД (Sirma Group Holding)
"Сирма Груп Холдинг" АД е холдингова компания с над 23 годишна история и е една от най-големите софтуерни групи в Югоизточна Европа. В групата работят над 300 опитни софтуерни специалисти, които са реализирали стотици успешни проекти на пет континента. Сирма има експертиза и дългосрочни клиенти в някои от най-иновативните сфери на софтуерната индустрия: семантични технологии, мобилни приложения, ERP (Enterprise Resource Planning), BI (Business Intelligence), финансови, банкови и разплащателни услуги, електронно правителство.