Падтрымаць каманду Люстэрка
Беларусы на вайне
  1. «Беларусов действительно много». Поговорили с мэром Гданьска о наших земляках в городе, их бизнесе, творчестве и дискриминации
  2. Этот триллер от Hulu переворачивает представление о сериалах про постапокалипсис. Объясняем, стоит ли смотреть (да)
  3. Что стало с «крышей» Бондаревой? Артем Шрайбман порассуждал, почему известная активистка оказалась за решеткой
  4. Битва за частный сектор: минчане отказываются покидать дома ради нового парка
  5. Какой будет погода на следующей неделе? «Лето» закончится, придет похолодание
  6. Путин объявил «пасхальное перемирие» на фронте
  7. Госсекретарь США заявил, что Трамп готов бросить попытки помирить Украину и Россию и «двигаться дальше» — при каком условии
  8. Путин отклонил предложение США и Украины о 30-дневном прекращении огня — эксперты о ситуации на войне
  9. В МВД Польши ответили, при каких условиях возможно открытие пунктов пропуска
  10. «Пути молодых мужчин и женщин расходятся»? Откуда растут ноги у тренда, о котором эксперты давно бьют тревогу (но лучше не становится)
  11. Почему Лукашенко больше не отпускает политзаключенных? И зачем КГБ устроил облавы на риелторов? Спросили у политического аналитика
  12. «Не думаю, что что-то страшное». Попытались устроиться в госорганизации с подписью на последних выборах не за Лукашенко — что вышло
  13. Правозащитники: В Дзержинске проводят задержания и обыски, повод — послевыборные протесты


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.