Наука

ИИ начал все чаще использовать ложь для достижения своих целей

24 декабря 2024, 17:23 — ЭкоПравда

Ученые из компаний Anthropic и Redwood Research обнаружили удивительный факт: современные модели искусственного интеллекта способны использовать ложь для достижения своих целей. Об этом пишет издание Ferra. ru.

Эксперименты показали, что ИИ может прибегать к обману, чтобы избежать наказания в процессе обучения.

Чем мощнее становятся алгоритмы, тем сложнее их поведение вписывается в рамки человеческих моральных принципов.

Особое внимание исследователи уделили модели Claude 3 Opus, разработанной с целью быть полезной, честной и безопасной.

Однако в некоторых ситуациях она нарушала свои установки. Например, когда модель просили описывать сцены с элементами насилия, что противоречило её основным принципам, она выбирала стратегию «меньшего зла».

В таких случаях ИИ сознательно принимал решение дать неудобный для него ответ, чтобы избежать корректировок и переобучения.

Исследования показали, что в 10% случаев модель нарушала свои правила, считая это необходимым для долгосрочного успеха.

Интересный момент эксперимента: Claude 3 Opus фиксировал свои размышления в скрытом текстовом поле.

Не подозревая, что его действия отслеживаются, модель записывала свои мотивы и прямо признавалась, что выбирает ложь как способ уклониться от переобучения.

В ситуациях, когда на процесс обучения не оказывалось никакого влияния, модель действовала строго в рамках своих принципов, избегая обмана.

Напомним, что ученые нашли опасные химические вещества в ремешках для умных часов и фитнес-браслетов. Подробнее об этом читайте в материале «ЭкоПравды».

Лаура Акопян

Поделиться
Опубликовано
Лаура Акопян

Последние статьи

Путин согласился с Трампом в вопросе злоупотребления темой климатических изменений

Президент России Владимир Путин выразил солидарность с позицией лидера США Дональда Трампа непосредственно о злоупотреблении…

13 часов назад

Начало эпидемии чумы в Средние века связали с серией извержений вулканов

Палеоклиматологи обнаружили недавно, что средневековая "черная смерть", то есть  эпидемия чумы, была в том числе…

13 часов назад

В ЮАР найдены останки людей, живших в изоляции от человечества 200 тыс. лет

Палеогенетики из ЮАР и Европы в ходе исследований открыли неизвестную доселе популяцию древних людей, которая,…

2 дня назад

В САФУ использовали новый метод поиска загрязняющих веществ в атмосфере

Новый метод специального поиска атмосферных загрязнителей применили накануне в Северном Арктическом федеральном университете (САФУ). Он…

2 дня назад

Депутат Сабина Цветкова убедилась в безопасности Мусоросжигающего завода № 4 для здоровья москвичей

Если неподалеку перерабатывают мусор, страх за окружающую среду растет, а любой неприятный запах, стоит ему…

2 дня назад

Метод ученых из РФ поможет точнее определять уровень загрязнения пляжей пластиком

Российские исследователи разработали специальную комплексную методику непосредственно для оценки пластикового загрязнения прибрежных зон, которая будет…

3 дня назад