Учёные представили революционную иерархическую модель рассуждения, созданную по аналогии с принципами работы человеческого мозга. Эта технология уже демонстрирует превосходство над популярными LLM-системами вроде ChatGPT в сложных задачах, требующих гибкости мышления и глубокой аналитики.
Как устроена иерархическая модель рассуждения
Новый тип искусственного интеллекта — иерархическая модель рассуждения (HRM) — вдохновлён тем, как человеческий мозг обрабатывает информацию на разных временных интервалах: от долей секунды до минут. Такая архитектура позволяет системе эффективно комбинировать данные, обеспечивая более точное понимание и вывод.
Иерархическая модель рассуждения (HRM) — это искусственный интеллект, построенный по принципу работы человеческого мозга, который анализирует информацию на разных уровнях и временных интервалах для более эффективного рассуждения.
Разработкой HRM занимается сингапурская компания Sapient, специализирующаяся на передовых ИИ-решениях. Исследователи подчёркивают, что технология отличается высокой результативностью при меньших вычислительных затратах. Для её работы требуется меньше параметров и обучающих примеров, что делает модель не только мощной, но и более экономичной по сравнению с традиционными LLM.
Сравнение с крупными языковыми моделями
По данным препринта, опубликованного 26 июня в базе arXiv, HRM насчитывает всего 27 миллионов параметров и обучалась на 1000 выборках.
Для контраста — современные лидеры в области больших языковых моделей оперируют миллиардами или даже триллионами параметров. К примеру, по оценкам специалистов, GPT-5 может включать от трёх до пяти триллионов параметров.
Тестирование и результаты
Особое внимание исследователи уделили проверке HRM на экзамене ARC-AGI — одном из самых сложных тестов, измеряющих прогресс в направлении искусственного общего интеллекта (AGI). Результаты оказались впечатляющими:
- HRM показал 40,3% в тесте ARC-AGI-1, превзойдя OpenAI o3-mini-high (34,5%), Claude 3.7 от Anthropic (21,2%) и Deepseek R1 (15,8%).
- В более усложнённом варианте ARC-AGI-2 новая модель достигла 5%, тогда как конкуренты показали значительно более низкие результаты: 3% у o3-mini-high, 1,3% у Deepseek R1 и 0,9% у Claude 3.7.
Новый взгляд на рассуждения в ИИ
Большинство передовых LLM используют подход «цепочка мыслей» (Chain of Thought, CoT), когда сложные задачи разбиваются на последовательность небольших шагов, представленных в форме естественного языка. Такой метод помогает имитировать человеческий стиль рассуждений.
Однако HRM демонстрирует иной, более универсальный способ анализа, позволяющий системе достигать качественно новых результатов.
Подпишитесь на наш Telegram и будьте в курсе всех новостей 📲
Подписаться Telegram 🔔
