Изследване хвърля светлина върху случаите и модерацията на реч на омразата на български

Изследване на Агенцията на Европейския съюз за основните права (FRA), публикувано в края на ноември 2023 г., представя, анализира и категоризира съдържание, открито в четири социални медии на четири езика - български, немски, шведски и италиански, оценено като реч на омраза.
Изследването показва, че в онлайн платформите "Редит", X, "Телеграм" и "Ютюб" е лесно да се открие значително количество публикации, съдържащи език на омраза, насочен към момичетата и жените и към хора от африкански произход, евреи и роми, чрез използването на избрани ключови думи.
Целта на доклада на FRA е да анализира дали и доколко стандартните инструменти за справяне с речта на омразата онлайн са ефективни, като се разгледат проявите на такава реч, след като платформите за социални медии са приложили своите механизми за контрол на съдържанието. Въпросните механизми се свеждат до премахване в момента на публикуването чрез алгоритмично оценяване и сваляне на съдържание, което също се извършва по ключови думи, или до премахване след докладване и преглед от човек модератор, който оценява съдържанието според специфичните правила и процедури на съответната платформа. Проактивно премахнатото съдържание така или иначе не може да бъде открито и анализирано от външни изследователи.
Докладът има за цел направи целенасочен преглед и анализ на онлайн проявите на (реч на) омраза към жените (мизогиния - омраза и презрение към женския пол) и срещу хора от африкански произход, евреите и ромите.
В него са представени констатации, обхващащи четири платформи за социални медии - "Телеграм", X (до средата на 2023 г. "Туитър"), "Редит" и "Ютюб". Той не включва платформи, които имат само национална или регионална потребителска база, предвид обхвата на този доклад. Платформите са избрани въз основа на тяхната достъпност за целите на изследването, популярността им (т.е. обхвата на аудиторията) и предполагаемия мащаб на речта на омразата в тях. Важно е да се има предвид, че анализът на X е може би най-малко меродавен за настоящата картина в платформата, тъй като е извършен преди преминаването на платформата във владение и управление на настоящия ѝ собственик Илон Мъск.

Тези категории са избрани въз основа на нивото на онлайн омраза срещу определени групи, както е посочено в съществуващата литература и експертните оценки, извършени в рамките на това проучване. При събирането на данните изследователският консорциум, ръководен от RAND Europe, е взел предвид и съпоставимостта между държавите, в които определени групи са обект на посегателство. Обхванати са случаи на омраза към групи и на други основания, включително омраза към други етнически групи и по отношение на политическото мнение и уврежданията.
Въз основа на анализ на данни от публикации в социалните медии за идентифициране на потенциални случаи на език на омраза онлайн, която вече е преминала през системите за модериране на съдържанието на онлайн платформите, докладът предлага критична оценка на ограниченията на инструментите за модериране на онлайн съдържание при откриването на онлайн омраза срещу конкретни групи. В същото време докладът подчертава именно тези предизвикателства, свързани с изследването и измерването на омразата онлайн.
Проучването събира публикации в социалните медии в продължение на 6 месеца - от 25 януари до 25 юли 2022 г., като използва конкретни ключови думи, които биха могли да показват потенциална проява на онлайн омраза срещу тези целеви групи. То се основава на данни, събрани от четирите онлайн платформи на четири езика - български, немски, италиански и шведски език - и обхваща четири държави - членки на ЕС: България, Германия, Италия и Швеция.
Тези държави са избрани поради съображения, свързани с техните национални политически реалности, потенциални прилики и разлики, които биха могли да обогатят сравнителния анализ, както и с възможността за провеждане на изследването. При избора им е взето предвид и включването на езици, които по-рядко са изследвани във връзка с онлайн омразата и нейното модериране, какъвто е случаят най-вече с българския език.
Четирите платформи са избрани въз основа на тяхната значимост в четирите държави и съображения за осъществимост по отношение на достъпа до данни. Събраните данни включват само публично достъпни публикации от страници, канали или групи. Важно е да отбележи още, че в изследването за проявите на омраза онлайн на български език не е включена платформата с най-много потребители в България - "Фейсбук" - поради предизвикателства при достъпа до данни от "Фейсбук", както и от "Инстаграм" (също собственост на "Мета").

Малко над 344 хил. онлайн публикации и коментари са събрани от четирите платформи чрез откриване и филтриране на публикации и коментари, които съдържат конкретни ключови думи. Експерти от четирите държави членки са подпомогнали съставянето на списъци с ключови думи за събирането на онлайн омраза, използвайки за основа The Weaponized Word - речник, включващ списъци с думи, които изразяват омраза и злонамерена реч.
При изработването на инструментариума за изследването са диференцирани два вида изказвания - дискриминационни и обидни. Дискриминационните изказвания са изказвания, отнасящи се до (възприемани) характеристики на дадена целева група. Оскърбителните думи и изрази са обидни в широк смисъл, независимо от самоличността на получателя, и могат да се срещнат в комбинация с дискриминационни думи и изрази. Включването на тези ключови думи може да показва наличието на реч на омразата. Събирането на данни обхваща оригинални публикации и коментари в отговор/реакция на други публикации, включително коментари на видеоклипове в "Ютюб".
Публикациите са класифицирани въз основа на това дали съдържат език, свързан с четирите целеви групи. Това не означава, че те съдържат реч на омраза, насочена към някоя от тези групи, а че съдържат ключови думи, които потенциално свидетелстват за такава реч. От събраните малко над 344 хил. публикации 36% (около 124 хил.) съдържат дискриминационни думи, насочени към жените. Над 90% от тези публикации (около 112 хил. от 124 хил.) са публикувани в X. "Телеграм" е с най-голям съдържателен дял в останалите 10%.

В изследването се разграничават пет основни категории реч на омраза онлайн:
- подбуждане към насилие, дискриминация или омраза
- очерняне
- обидни думи и изрази
- негативни стереотипи
- друго съдържание, пораждащо омраза.
България има както по-малък брой релевантни публикации, така и по-ниско ниво на реч на омразата, като само 35% от всички кодирани (анализирани чрез попълване по предварително създадена анкетна карта и топология) публикации са категоризирани като враждебни (169 от 399 публикации).
От тях на случаен принцип са избрани близо 400 публикации за всяка от четирите държави членки. При подбора е използвана стратифицирана извадка по платформи и целеви групи, което гарантира, че всяка платформа и целева група е представена в публикациите (общо 1573 публикации). Хора, обучени да разпознават потенциални форми на онлайн омраза, са анализирали и оценили публикациите, разпределяйки ги в следните видове категории враждебен език; очерняне; негативни стереотипи; подбуждане към насилие, дискриминация и/или омраза.
От 1573 публикации, извършилите анализа на съдържанието са определили 1050 публикации (67%) като подходящи за целите на изследването на речта на омразата онлайн. Останалата една трета са оценени като ирелевантни, въпреки че са попаднали в извадката чрез търсенето (филтрирането) по ключови думи.

Малка група от публикациите (семпъл) е оценена и от правни експерти, за да определят дали те биха отговаряли на правното определение за подбуждане. Повече от половината от 1573-те релевантни и ръчно анализирани публикации са оценени като подбуждащи към омраза, в смисъл че попадат в поне една от определените категории. Те включват елементи на подбуждане към насилие, дискриминация или омраза; очерняне; обиден език; негативни стереотипи; или всяко друго съдържание, пораждащо омраза, като например подкрепа на идеологии, пораждащи омраза.
От всички публикации, кодирани като враждебни, почти 85% са оценени като съдържащи обиден език. Според хората, извършили анализа, 55% от публикациите, съдържащи омраза, изразяват омраза към хора въз основа на защитени характеристики. Те са бяха помолени да посочат доколко са сигурни в своите кодове. Нивото на сигурност е най-ниско в България, където главният кодиращ е посочил, че е (сравнително) сигурен само за 66% от анализираното и категоризирано съдържание.

Изследването на Агенцията на Европейския съюз за основните права (FRA) анализира само публикации, които вече са преминали през собствените процеси на модериране на съдържанието на платформите. Това дава основание да се очаква, че значителна част от съдържанието, пораждащо омраза, вече е било премахнато в съответствие с общите условия на платформите, включително забраната на речта на омразата и тормоза.
Изглежда, че тези процеси на модериране работят до известна степен, но много публикации все още се промъкват през тях и след по-задълбочена проверка може да бъдат оценени и категоризирани като реч на омраза.
Фактът, че изследването успява да отбележи публикации, които потенциално биха могли да бъдат категоризирани като реч на омраза, показва, че системите за модериране в тези четири платформи не улавят всички форми на език на омраза. Особено голям е делът на пропуснатото съдържание, категоризирано като език на омразата срещу момичета и жени.

Изброените категории не са взаимно изключващи се. Изразяването на омраза онлайн може да попада и често се позиционира в няколко категории.
Подбуждане към насилие, дискриминация или омраза.
Различните държави - членки на ЕС, тълкуват подбуждането по различен начин. Въпреки това се признава, че подбуждането включва създаване или разпространение на материали, които подбуждат към насилие или омраза.
В настоящото проучване е използвано определение за подбуждане, основано на препоръката на Европейската комисия срещу расизма и нетолерантността (ЕКРН).
То се отнася до съдържание, което ясно насърчава или призовава аудиторията да:
- извършване на насилие
- да действа по дискриминационен начин, което означава да третира някого по различен начин поради (възприеман) защитен признак/характеристика
- да действа по враждебен начин, включително като говори или пише.
Важно е да се има предвид също, че
- различната техника за изготвяне на извадката за "Телеграм" може да означава, че броят на публикациите в "Телеграм" не е наистина или в необходимата степен показателен за наличието на дискриминационни и обидни думи в онлайн публикациите
- публикациите в актива на Германия може да произхождат от Австрия, Швейцария, Люксембург или друга държава, в която немският език е широко разпространен.

Сред останалите тенденции и специфики, уловени от изследователите в този доклад на FRA, са:
- X е доминиращият източник на събрани публикации, който съставлява 65% от всички публикации. В Германия и Швеция X е основният източник на източник на публикации, съставляващ съответно 87% (119 хил. от 136 хил.) и 86% (5796 от 6745) от всички публикации.
- За България и Италия обаче "Телеграм" играе по-важна роля. "Телеграм" е основният източник на публикации (69 %, или 694 от 1005 публикации) в българския език, а X и "Телеграм" са еднакво представени в италианския език (50% или окол 100 хил. и 49% или 98 хил. от 200 хил. публикации).
- България и Италия следват сходни профили на език на омраза, с подобни нива на дела публикации, категоризирани като очерняне в публикациите от извадката. В Италия 60% от публикациите са класифицирани като очернящи.
- За България 47% от публикациите са класифицирани като очернящи. И в двете страни очернянето е значително по-често срещано, отколкото в данните за Германия и Швеция.

- В България, Италия и Швеция между 50% и 60% от всички публикации, съдържащи омраза, могат да бъдат класифицирани като тормоз, докато в Германия само 30% от публикациите могат да бъдат класифицирани по този начин.
- Горните констатации може да са свързани и с факта, че в България, Италия и Швеция публикациите, насочени към жени, са относително по-разпространени, а тормозът е по-разпространен именно в публикации, насочени към жени.
- Броят на публикациите, класифицирани като контрареч, е малък и в четирите платформи. Като цяло само 61 публикации, или 4% от всички кодирани публикации, са категоризирани като контрареч.
- Нивото на контраречта е най-ниско за "Телеграм" - само две публикации са категоризирани като контрареч. Това може да се обясни с естеството на "Телеграм", тъй като платформата организира онлайн взаимодействието около групи с общи интереси, което предполага по-голяма вероятно за създаване на т.нар. ехо камери (или още филтърни балони). В подобни пространства проявленията на критична реч са по-редки.

Значителна част от речта на омразата остава онлайн дори след като мине през "ситото" на платформите за модериране на съдържанието, показва емпиричният анализ на екипа, работил по това изследване.
По-голямата част от него вероятно не е незаконно съдържание, а нивото на възприеманата враждебност може да варира значително при различните хора. Това подчертава трудностите при анализа и категоризирането на онлайн омразата и значението на контекста, за да може да се направи такава оценка.
Оценяването на всяка от публикациите в пълния контекст на изразяването, като например информация за позициите на говорещия и получателя, е извън обхвата на това изследване, което по своята методология и тип анализ е количествено, а не качествено.