Ботовете за модериране в YouTube наказват видеоклипове, маркирани като „гей“ или „лесбийка“, установява изследването

Говорителят на YouTube заявява, че това не е така

Ново разследване на коалиция от създатели и изследователи в YouTube обвинява YouTube, че разчита на система от фанатични ботове, за да определи дали дадено съдържание трябва да бъде демонетизирано, по-специално LGBTQ видеоклипове.



Разследването е проведено от трима души:Sealow,Главен изпълнителен директор на изследователска фирма Ocelot AI; Създателят на YouTube Андрю, който управляваYouTube анализиранканал; и Een на популярния коментарен и разследващ канал в YouTube Nerd City.

facebook сървър

Разследването беше подтикнато от интерес да се види кои думи автоматично се демонетизират от ботовете за машинно обучение на YouTube, тъй като загрижеността относно прозрачността между ръководителите и ютубърите в общността на създателите нараства. Андрю тества ръчно 15 300 думи между 2 юни и 5 юли 2019 г., използвайки най-често срещаните термини в Webster’s Dictionary, UrbanDictionary и резултатите от търсенето с Google. Вторият кръг от експеримента се проведе между 6 юли и 21 юли и включваше 14 000 думи, които бяха автоматизирани с помощта на API за данни на YouTube от Sealow. Een си сътрудничи със собствени източници и помага за създаването на основното видео.

Андрю, Силоу и Иен пуснаха своите отделни видеоклипове за констатациите, заедно с лист в Excel, в който са изброени всички думи, които са използвали, и анализ на белите книги на техните констатации. Тези думи бяха използвани за тестване на това, което ботовете на YouTube смятат за автоматично неподходящо за осигуряване на приходи. Екипът установи, че ако думи като гей и лесбийки се променят на произволни думи като щастлив, състоянието на видеото се променя на рекламодател всеки път, казва Een в своето видео.



Достигнато отНа ръба, говорител на YouTube отрече, че има списък с LGBTQ думи, които предизвикват демонетизация, въпреки констатациите на разследването. Говорителят добави, че компанията непрекъснато оценява нашите системи, за да гарантира, че те отразяват нашите политики без несправедливо пристрастие.

Гордеем се с невероятните LGBTQ + гласове на нашата платформа и приемаме опасения като тези много сериозно, каза говорителят. Използваме машинно обучение, за да оценим съдържанието спрямо нашетонасоки за рекламодатели. Понякога системите ни грешат, поради което насърчаваме създателите да обжалват. Успешните обжалвания гарантират, че нашите системи се актуализират, за да стават все по-добри и по-добри.

Прави и хетеросексуални са зелени думи.

Системите на YouTube за автоматизирана демонетизация се основават на много сигнали, но няма конкретен списък, който да е вграден в системата за машинно обучение на компанията, според компанията. Компанията потвърди, че тества проби от видеоклипове от създатели на LGBTQ, когато се въвеждат нови класификатори за осигуряване на приходи, за да се гарантира, че LGBTQ видеоклиповете не са по-склонни да получат демонетизация. Но компанията твърди, че съществуващата система за прегледи, която се използва от човешки модератори, които наблюдават обжалванията, отразява правилно политиките на компанията, свързани с LGBTQ условията.



Но констатациите на изследователите предполагат, че има значителни пристрастия в работата, преди да се включат човешките модератори. Техните изследвания ги накараха да стигнат до заключението, че ботовете за машинно обучение на YouTube, които се използват специално за изследване дали видеоклипът е наличен за осигуряване на приходи, използват скрито ниво на доверие, вариращо от 0 до 1. Тези, които са по-близо до нула, са одобрени за осигуряване на приходи, докато други по-близо до един са демонетизиран. На практика, ако се счита, че видеоклипът е над прага на YouTube, той незабавно се демонетизира и трябва да бъде подложен на ръчен преглед.

Класификаторите на Youtube са обучени да се опитват да предскажат каква е вероятността видеоклипът да бъде демонетизиран въз основа на данните от обучението (въз основа на предишни резултати от ръчен преглед), каза СилоуНа ръба.Така че резултат 1 е 100 процента уверен, че трябва да бъде демонетизиран, докато 0,5 е 50 процента и т.н. Youtube трябваше да определи определен приемлив праг - да кажем „35% доверие“, където всеки видеоклип, който е над 0,35, ще бъде демонетизиран и ще изисква ръчен преглед, преди да бъде одобрен за осигуряване на приходи.

Компанията тества проби от видеоклипове от създатели на LGBTQ, когато се въвеждат нови класификатори на приходите

В анализа на своите открития Силоу заявява, че списъкът се тълкува най-добре като списък с отрицателно заредени ключови думи, тъй като някои думи се считат за по-тежки от други.

Всеки видеоклип, качен за целите на тестването, е работил между една и две секунди и не е съдържал визуално или аудио съдържание, което може да предизвика демонетизиране, се казва в доклада. Периодът на изчакване за одобрение или отказ за осигуряване на приходи беше около два часа. Думите, свързани с LGBTQ общността или термини, използвани в коментари като демократ или либерал, вероятно са отрицателно заредени поради употребата им в политически коментари, които често се считат за неподходящи за рекламодатели, се казва в доклада.

Съвсем същите видеоклипове се монетизират без LGBTQ терминологията, казва Силоу в своето видео. Тук не става въпрос за демонетизиране на LGBTQ личности заради нещо, за което всички останали също биха били демонетизирани, като секс или трагедия. Това е LGBTQ терминология като „гей“ и „лесбийка“ е единствената причина видеото да бъде демонетизирано въпреки контекста.

Твърденията, направени във видеото, не са нови, но изследването е най-обширно. Ръководителите на YouTube, включително главният изпълнителен директор Сюзън Войчики и главният продуктов директор Нийл Мохан, говориха за опасения, че определени ключови думи в метаданни и заглавия водят до автоматично демонетизиране. Това е особено разпространено безпокойство в общността на LGBTQ. YouTube категорично отрече да има правила, които казват „Ако поставите определени думи в заглавие, което ще бъде демонетизирано“, както Войчицки каза на YouTuber Alfie Deyes в продължително интервю през август.

disney плюс дата на издаване
Това е LGBTQ терминология като „гей“ и „лесбийка“ е единствената причина видеото да бъде демонетизирано въпреки контекста.

Ние работим неимоверно усилено, за да сме сигурни, че когато нашите машини научат нещо - защото много от нашите решения се взимат алгоритмично - че нашите машини са честни, добави Войчицки. Не трябва да има [автоматична демонетизация].

Това не попречи на създателите да използват таен език във видеоклиповете си и да включват Google Documents в раздела си за коментари, за да комуникират с зрителите. YouTuber Petty Paige ще мига с прословутото изображение на жълт знак за долар - aзнак, че както създателите, така и публиката знаят, означава, че видеоклипът е демонетизиран- което означава, че феновете й трябва да прочетат документа, свързан по-долу, за да разберат защо използва конкретни думи. Тя теоретизира, както много други LGBTQ личности, чеизползването на думи като лесбийка или трансджендър може да доведе до демонетизиране. Замяната на тези термини с други произволни думи изглежда не е така.

Също толкова дискриминационно е, ако никога не казвате това, и още по-експлоатативно, ако го кажете, каза Иен.

По-рано това лято редица създатели на LGBTQ заведоха дело срещу YouTube за предполагаеми дискриминационни практики, включително несправедливо демонетизиращо съдържание, включващо условия, подходящи за LGBTQ. Искът също така твърди, че YouTube активно уврежда броя на зрителите на техните канали, като поставя видеоклипове в ограничен режим, за който компанията преди това се извинява и следователно ограничава способността им да печелят пари. Искът твърди, че YouTube се занимава с дискриминационно, антиконкурентно и незаконно поведение, което вреди на защитен клас лица съгласно калифорнийското законодателство.

Омръзна ни да бъдем успокоявани с ясни лъжи и кухи обещания, че или са го поправили, или ще го поправят, каза Крис Найт, който е съ-водещ на LGBTQ новинарско предаване в YouTube, GNews!На ръбапо това време. Явно е счупен. Очевидно има пристрастие към техния ИИ, техните политики. Това, което наистина искаме, е те да се променят.

как гледа ябълка

Sealow и Een заявяват, че не вярват, че YouTube или Wojcicki са хомофобни или умишлено използват предполагаеми хомофобски практики. Те специално добавят, че това не се дължи на специфични правила на YouTube или липсата на програми за смекчаване на алгоритмичната дискриминация.

Това е просто резултат от вероятностния характер на класификаторите за машинно обучение, използвани от бота за демонетизация, добавя докладът на Sealow.