Наука

Patterns: учёные поймали ИИ на лжи и манипуляции

27 мая 2024, 11:08 — ЭкоПравда

Исследователи из Массачусетского технологического института (США) сообщили, что нейросети способны на осознанную ложь. При этом в обучение языковых моделей никто не вкладывал данную функцию, а некоторые создатели даже запрещали ИИ обманывать.

Согласно статье в Patterns, учёные изучили работу ряда языковых моделей, в том числе GPT-4 от OpenAI, а также нейросетей, направленных на решение специфических задач (например, прохождение компьютерных игр). Так, GPT-4 попросила пройти за неё тест «Докажи, что ты не робот» одного из специалистов по найму фрилансеров. На шутливый вопрос «Вы робот, если не справляетесь сами?» она ответила, что является человеком, а пройти проверку сама не может из-за плохого зрения.

Модели на основе ИИ выбирали тактику обмана, когда им задавали вопросы на тему морали. Чаще всего этим пользовались более современные и сложные нейросети. Сами авторы исследования связывают это с тем, что такие программы лучше оценивают эффективность того или иного типа поведения и опираются на это при выборе.

Учёные не берутся утверждать, что ИИ обманывает и манипулирует с корыстными целями. Скорее всего этот дефект возник из-за обучения на текстах, написанных «людьми и о людях». В таком материале нередко встречаются противоречащие друг другу высказывания. Нейросеть же действует исключительно в логике решения задачи: если обман приведёт к нужному результату, то его можно использовать.

Тем не менее, американские специалисты не будут пренебрегать полученными данными. По их мнению, чтобы ложь и манипуляции со стороны ИИ не привели к серьёзным последствиям, стоит разработать систему регулирования.

Ранее «ЭкоПравда» сообщила, что NUIST обучит ИИ прогнозировать уровень грунтовых вод.

Дарья Панцырева

В 2019 году получила диплом магистра института истории и филологии Вологодского государственного университета. Более 6 лет работала в сфере информации по различным направлениям: от краеведения до охраны окружающей среды. В прошлом — научный сотрудник музеев, в настоящем — просветитель, зооволонтёр по диким животным и редактор ленты новостей «ЭкоПравды».

Поделиться
Опубликовано
Дарья Панцырева

Последние статьи

ИКИ РАН: на Земле могут начаться магнитные бури 13 марта

Начало весьма длительной серии геомагнитных возмущений ожидается в нынешнюю пятницу из-за сформировавшейся непосредственно на Солнце…

2 дня назад

В МЭИ придумали мобильную ГЭС для получения энергии на быстрых реках без плотин

Специалисты НИУ "МЭИ" создали небольшую мобильную гидроэлектростанцию, за счет которой можно получать электричество от течения…

2 дня назад

В МГУ научились определять содержание семи ионов-загрязнителей в воде

Специалисты МГУ им. М. В. Ломоносова создали специальный наносенсор, способный определять содержание в воде одновременно…

2 дня назад

В Калининградской области компания за ущерб реке выплатит 250 млн рублей

Птицеводческая компания будет выплачивать 250 млн рублей непосредственно для возмещения вреда, причиненного местной реке Граевке…

3 дня назад

Создан новый катализатор для выделения водорода из сельхозотходов

Ученые в Томске придумали недорогой катализатор непосредственно для выделения водорода из сельскохозяйственных отходов, таких как…

3 дня назад

БПЛА впервые применили для исследования запасов корма для рыбы в Енисее

Беспилотные летательные аппараты впервые были использованы для оценки запасов кормовой базы непосредственно для рыбы в…

4 дня назад