Kyiv Times
← Назад до новин

ШІ може "підігрувати" владі: вчені зафіксували проблему у 37 країнах

ШІ може "підігрувати" владі: вчені зафіксували проблему у 37 країнах
Уряди можуть опосередковано впливати на ШІ, формуючи контент, на якому навчаються великі мовні моделі

Дослідники зі США виявили, що відповіді сучасних чат-ботів на запитання з політичним підтекстом суттєво залежать від мови, якою їх поставлено. З'ясувалося, що ШІ схильний давати лояльніші відповіді рідною мовою країни, де панує жорстка медійна цензура.

Про це інформує РБК-Україна, посилаючись на наукове дослідження, опубліковане у журналі Nature.

Більше цікавого: ШІ знає про вас надто багато: як чат-боти непомітно впливають на ваші рішення Як пропаганда потрапляє до ШІ?

Дослідники проаналізували навчальні дані та поведінку моделей у 37 країнах. Виявилося, що державний контент потрапляє у бази даних ШІ не лише з офіційних сайтів, а й через масове цитування у ЗМІ, блогах та соціальних мережах.

Масштаб присутності: у китайському сегменті відкритого набору даних Common Crawl виявили понад 3,1 млн документів, що збігаються з риторикою державних медіа.

Концентрація: серед документів, де згадуються політичні лідери або інституції, частка провладного контенту сягає 23%.

Ефект "відмивання": лише 12% таких документів походять з урядових доменів. Це означає, що пропаганда поширюється мережею, поки не починає виглядати як нейтральна об'єктивна інформація, яку і засвоює ШІ.

Мовний розрив - ШІ прихильний до авторитарних режимів

Щоб підтвердити свою теорію, вчені провели експеримент із невеликою мовною моделлю, додавши до її навчання скрипти державних новин. Результати були однозначними: додавання таких документів у 80% випадків робило відповіді ШІ-моделі більш прихильними до влади.

Тест на лояльність: відповіді на запитання про уряд Китаю, поставлені китайською мовою, у 75,3% випадків були більш схвальними, ніж ті самі запитання англійською.

Глобальний патерн: така закономірність характерна для 37 країн із сильним державним контролем над ЗМІ.

Які наслідки?

Автори дослідження наголошують, що це не свідчить про свідоме бажання технологічних компаній підігрувати диктатурам. Проте це створює нові стимули для "стратегічного насичування онлайн-простору певними текстами".

Головні тези дослідників:

Заклик до відкритості: оскільки навчальні дані є фундаментом сучасного ШІ, вчені вимагають більшої прозорості щодо того, звідки компанії беруть тексти для тренування своїх систем.

Ризик маніпуляцій: ШІ може стати інструментом, що відображає інтереси не лише держав, а й інших впливових інституцій, які здатні генерувати величезні обсяги контенту у мережі.

Наразі результати дослідження підтверджуються навіть на найновіших комерційних моделях чат-ботів, і це доводить гіпотезу про системну упередженість нейромереж.

Ще більше цікавого:

  • Секретний проєкт Безоса. Колишні топи Google та xAI створюють супер-ШІ: яка його ціль
  • Новий тип ШІ може еволюціонувати як живі організми: що це означає для людей