Во вступлении важно сразу дать ощущение масштаба: Gemini 3 Pro стала крупнейшим обновлением в линейке Google и одним из самых заметных ИИ-релизов года. Модель подняла планку и уверенно обошла ближайших конкурентов, задав новый ориентир для всей индустрии. Что именно изменилось и почему её называют абсолютным лидером — об этом расскажет обзор Gemini 3 Pro.
Почему Gemini 3 Pro привлёк так много внимания
Слухи подтвердились. Gemini 3 Pro уверенно вышла в лидеры, оставив позади GPT-5.1, Claude Sonnet 4.5 и другие флагманские системы.
На платформе LMArena, где пользователи голосуют вслепую, модель мгновенно заняла первое место, сместив Grok 4.1 от xAI — тот продержался на вершине меньше суток.
Google подчёркивает, что Gemini 3 стала наиболее сильной моделью за всё время. Прорыв особенно заметен в тестах на абстрактное мышление — ARC-AGI-2 и «Последнем экзамене человечества».
Она демонстрирует глубокие знания уровня PhD в естественных науках и математике, превосходит альтернативы в программировании и уверенно ведёт себя в агентных задачах.
Главное отличие — настоящий мультимодальный подход. Модель одинаково хорошо работает с текстом, изображениями и видео.
При этом она не пытается подстраиваться под желания пользователя — выдаёт полезный ответ, даже если он не совпадает с ожиданиями. В Google DeepMind подчёркивают: «Она говорит то, что нужно, а не то, что приятно».
Версии Gemini и сравнение с другими моделями
Google представила три версии: стандартную Gemini 3, Pro и Deep Think. И хотя вокруг бенчмарков с каждой новой моделью поднимается шум, Pro-версия действительно показывает заметные улучшения.
Компания сравнила Gemini 3 Pro с Gemini 2.5 Pro, Claude Sonnet 4.5 и GPT-5.1 по 20 метрикам — и 19 из них оказались в пользу новинки. Такое доминирование встречается крайне редко.
Особенно показательны результаты, связанные с практическими задачами.
• В Vending-Bench 2, где оценивают способность ИИ вести долгосрочный прибыльный бизнес, Gemini 3 Pro заработала около 5,5 тысяч долларов — намного больше, чем Sonnet 4.5.
• В SimpleQA Verified разрыв достигает порядка 40%. Это тест на достоверность ответов, и такие показатели важны для снижения уровня галлюцинаций.
• В Индексе искусственного интеллекта модель заняла первое место, обойдя GPT-5.1 на три пункта — для индустрии с минимальными разрывами это колоссальный результат.
Для пользователей API есть один нюанс: модель довольно дорогая, но при этом остаётся быстрее большинства альтернатив, что компенсирует стоимость.
Архитектура, возможности и сценарии использования
Gemini 3 создавали не как продолжение линейки — а как новую модель, сразу ориентированную на мультимодальность.
Это разреженная смесь экспертов (Mixture of Experts), стандарт для современных крупных систем. Она обрабатывает до миллиона токенов на входе, использует собственное оборудование Google — TPU — и работает на данных из открытых и лицензированных источников.
В агентном режиме модель способна самостоятельно планировать и выполнять сложные задачи:
- писать и проверять код,
- управлять многоэтапными процессами,
- бронировать услуги,
- сортировать почту,
- структурировать информацию из разных типов данных.
Она способна создать электронную кулинарную книгу из рецептов, написанных от руки или сделать интерактивные карточки и визуализации по научным статьям и лекциям.
Google подчёркивает, что новая система сочетает глубокие рассуждения с более уверенным использованием инструментов, что делает её эффективнее в длительных проектах.
ARC-AGI-2 — главный показатель прорыва
Но даже на фоне всех успехов больше всего впечатляет результат в ARC-AGI-2.
Gemini 3 Pro и Deep Think набрали 31,1% и 45,1% — в два и три раза выше ближайшего конкурента GPT-5.1 Thinking, который показал 17,6%.
Бенчмарк ARC-AGI создан как тест на гибкое мышление. Он прост для человека, но очень сложен для моделей ИИ.
И если большинство систем годами поднимаются от 0% к 15%, Google внезапно показывает результат под 45%.
Такой скачок почти не встречается в современной ИИ-разработке.
При этом Gemini 3 Pro всё равно проваливает часть заданий ARC-AGI 1, которые кажутся лёгкими человеку — это подчёркивает разницу между человеческим и машинным восприятием.
Но именно Google сейчас максимально близка к тому, чтобы преодолеть этот разрыв.
Разработчики ARC Prize отмечают, что эффективность Gemini 3 приближается к средней человеческой скорости выполнения визуальных задач — особенно с учётом того, что модели используют не зрительное восприятие, а токены.
Обзор Gemini 3 Pro: куда движется развитие модели
Gemini 3 Pro уже доступна в Google AI Studio (нужен иностранный IP).
Теперь сообщество с интересом ждёт результатов на ARC-AGI 3 — более сложном и современном наборе задач.
Большинство старых бенчмарков уже потеряли актуальность, так как модели специально обучают под них. Но ARC-AGI остаётся объективной проверкой гибкого мышления, и Gemini 3 в этом направлении очевидно лидирует.
Google не раскрывает всех технических деталей, но по словам Ориола Виньялса, вице-президента Google DeepMind, секрет прост:
они улучшили каждую составляющую модели — архитектуру, обучение, мультимодальность и инструменты рассуждения.
Подпишитесь на наш Telegram и будьте в курсе всех новостей 📲
Подписаться Telegram 🔔

Кира Титова
Савва Волков