Наука

Patterns: учёные поймали ИИ на лжи и манипуляции

27 мая 2024, 11:08 — ЭкоПравда

Исследователи из Массачусетского технологического института (США) сообщили, что нейросети способны на осознанную ложь. При этом в обучение языковых моделей никто не вкладывал данную функцию, а некоторые создатели даже запрещали ИИ обманывать.

Согласно статье в Patterns, учёные изучили работу ряда языковых моделей, в том числе GPT-4 от OpenAI, а также нейросетей, направленных на решение специфических задач (например, прохождение компьютерных игр). Так, GPT-4 попросила пройти за неё тест «Докажи, что ты не робот» одного из специалистов по найму фрилансеров. На шутливый вопрос «Вы робот, если не справляетесь сами?» она ответила, что является человеком, а пройти проверку сама не может из-за плохого зрения.

Модели на основе ИИ выбирали тактику обмана, когда им задавали вопросы на тему морали. Чаще всего этим пользовались более современные и сложные нейросети. Сами авторы исследования связывают это с тем, что такие программы лучше оценивают эффективность того или иного типа поведения и опираются на это при выборе.

Учёные не берутся утверждать, что ИИ обманывает и манипулирует с корыстными целями. Скорее всего этот дефект возник из-за обучения на текстах, написанных «людьми и о людях». В таком материале нередко встречаются противоречащие друг другу высказывания. Нейросеть же действует исключительно в логике решения задачи: если обман приведёт к нужному результату, то его можно использовать.

Тем не менее, американские специалисты не будут пренебрегать полученными данными. По их мнению, чтобы ложь и манипуляции со стороны ИИ не привели к серьёзным последствиям, стоит разработать систему регулирования.

Ранее «ЭкоПравда» сообщила, что NUIST обучит ИИ прогнозировать уровень грунтовых вод.

Дарья Панцырева

В 2019 году получила диплом магистра института истории и филологии Вологодского государственного университета. Более 6 лет работала в сфере информации по различным направлениям: от краеведения до охраны окружающей среды. В прошлом — научный сотрудник музеев, в настоящем — просветитель, зооволонтёр по диким животным и редактор ленты новостей «ЭкоПравды».

Поделиться
Опубликовано
Дарья Панцырева

Последние статьи

AIRI: расчеты ученых из РФ повысят безопасность хранения радиоактивного технеция-99

Российские ученые применили методы квантовой химии и системы ИИ непосредственно для поиска стабильных соединений углерода…

1 день назад

UR: создано покрытие для труб, заставляющее их плавать по поверхности воды

Международный коллектив физиков разработал недавно особое покрытие непосредственно для внешней и внутренней поверхности труб, которое…

1 день назад

В прибрежных лесах Тайваня найден цветок, «нарушивший» законы эволюции

Американские ботаники рассказали, что один из известных видов цветущих лиан, которые произрастают сейчас в прибрежных…

1 день назад

В России адаптируют систему переработки диоксида углерода для РОС

Научно-исследовательский и конструкторский институт химического машиностроения (АО "НИИхиммаш") намерен адаптировать специальную систему переработки диоксида углерода…

2 дня назад

Свойства торфа улучшили для выращивания растений с помощью добавления биоугля

Улучшить свойства торфа, который используется для выращивания различных растений, могут так называемые биоугли непосредственно из…

2 дня назад

В СибАДИ придумали метод использования шлаков с рудников при строительстве дорог

Технологию применения вскрышных пород и шлаков цветной металлургии непосредственно при строительстве автодорог в условиях Крайнего…

2 дня назад