Qwen3-Next: гибридная модель нового поколения от Alibaba

Компания Alibaba продолжает активно развивать линейку своих языковых моделей. На этот раз инженеры представили Qwen3-Next — гибридную модель нового поколения, которая уже успела привлечь внимание специалистов благодаря своей эффективности и необычной архитектуре. Главное здесь даже не в том, что она демонстрирует приросты по бенчмаркам, а в том, что она меняет сам подход к созданию и обучению ИИ.

Что представляет собой Qwen3-Next

Новая модель насчитывает около 80 миллиардов параметров, однако в работе используется лишь 3 миллиарда — остальные «спят» и подключаются только при необходимости. Такой принцип делает систему одновременно мощной и экономичной. Alibaba подготовила две версии: Thinking (для задач рассуждения и логики) и Instruct (универсальная, для диалогов и инструкций).

🚀 Конвертируйте изображения
без загрузки файлов на сервер

Бесплатный сервис Конвертус переведет JPG, JPEG, PNG, WEBP и AVIF в нужный формат
без потери качества.

👉 Начать бесплатно →

В обычных сценариях Qwen3-Next показывает результат на уровне куда более крупной Qwen3-235B, а в режиме рассуждений даже превосходит модели вроде Gemini 2.5 Flash Thinking. Однако самое важное преимущество — это архитектура, которая обеспечивает колоссальную экономию ресурсов.

Архитектура и нововведения

Разработчики внедрили гибридное внимание — сочетание Gated DeltaNet и Gated Attention, что позволяет эффективно обрабатывать большие объёмы текста. Дополняет её модуль Mixture-of-Experts (MoE): десятки «экспертов» работают выборочно, и на каждый токен активируются лишь несколько, что значительно снижает затраты на вычисления.

Отдельное внимание уделено работе с длинными контекстами. Qwen3-Next способен обрабатывать до 260 тысяч токенов, что открывает новые возможности для анализа книг, больших кодовых баз или юридических документов. Кроме того, используется технология Multi-Token Prediction, ускоряющая генерацию за счёт предсказания сразу нескольких токенов.

Эффективность и производительность

Alibaba подчёркивает, что обучение Qwen3-Next обошлось в 10 раз дешевле, чем в случае с Qwen3-32B. При этом модель демонстрирует в 10 раз большую пропускную способность на длинных контекстах. Это означает, что задачи, которые раньше требовали колоссальных ресурсов, теперь можно решать гораздо быстрее и доступнее.

В бенчмарках Qwen3-Next уверенно превосходит предыдущие модели компании и конкурентов в задачах на рассуждение, а в стандартных сценариях показывает стабильные результаты на уровне флагманских решений.

Ограничения Qwen3-Next и вызовы

Как и любая MoE-архитектура, Qwen3-Next сталкивается с проблемами балансировки нагрузки между экспертами. Кроме того, несмотря на эффективное использование параметров, полная модель всё равно остаётся «тяжёлой» и требует серьёзной инфраструктуры. Также её преимущества особенно ярко проявляются именно на длинных контекстах, тогда как в простых задачах выигрыш может быть не столь заметным.

Почему это важно

Qwen3-Next демонстрирует, что эра «чем больше, тем лучше» постепенно уходит в прошлое. Новый подход Alibaba доказывает: можно создавать модели, которые приближаются к возможностям сверхкрупных систем, но при этом требуют в разы меньше ресурсов.

Это открывает перспективы как для крупных компаний, так и для исследователей, которым раньше было сложно работать с гигантскими ИИ-архитектурами. Возможность обрабатывать сотни тысяч токенов делает модель особенно интересной для аналитики, науки, права и программирования.

Попробовать Qwen3-Next можно бесплатно в Qwen Chat, что также подчёркивает стремление Alibaba к открытости и доступности своих технологий.

👍 4 ❤️ 2 🙂+

👁 3.5k