Новое исследование, проведенное учеными из корпорации Apple в области искусственного интеллекта, выявило значительные недостатки в способности больших языковых моделей к базовому рассуждению. Как сообщает портал Esport.ru, результаты эксперимента показали, что существующие языковые модели, в том числе ChatGPT от OpenAI, сталкиваются с серьезными трудностями в выполнении математических задач.
В рамках тестирования научная команда Apple обнаружила, что даже незначительные изменения в числовых значениях или формулировках задач могут существенно повлиять на результаты выполнения моделью этих задач. Исследование подчеркивает, что производительность всех анализируемых моделей падает, если в вопросе меняются лишь числовые данные. Более того, хрупкость их математических рассуждений демонстрирует, что эффективность работы моделей значительно ухудшается с увеличением количества предложений в вопросе.
Ученые также отмечают, что на текущем этапе развития крупных языковых моделей им недостает навыков формального рассуждения. Вместо этого они, по сути, ориентируются на сопоставление шаблонов, что ограничивает их способность решать более сложные задачи. Эти выводы подчеркивают необходимость дальнейших исследований и улучшений в области разработки искусственного интеллекта, чтобы преодолеть существующие ограничения и повысить уровень рассуждения моделей.
Ранее «ЭкоПравда» информировала о том, что в Бразилии нашли одни из древнейших окаменелостей динозавроморфа.
Президент России Владимир Путин выразил солидарность с позицией лидера США Дональда Трампа непосредственно о злоупотреблении…
Палеоклиматологи обнаружили недавно, что средневековая "черная смерть", то есть эпидемия чумы, была в том числе…
Палеогенетики из ЮАР и Европы в ходе исследований открыли неизвестную доселе популяцию древних людей, которая,…
Новый метод специального поиска атмосферных загрязнителей применили накануне в Северном Арктическом федеральном университете (САФУ). Он…
Если неподалеку перерабатывают мусор, страх за окружающую среду растет, а любой неприятный запах, стоит ему…
Российские исследователи разработали специальную комплексную методику непосредственно для оценки пластикового загрязнения прибрежных зон, которая будет…