ИИ для науки: кто окажется умнее?

Институт искусственного интеллекта Пола Аллена представил SciArena — специализированную платформу, созданную по аналогии с Chatbot Arena, но ориентированную исключительно на научные задачи. Здесь любой желающий может бесплатно получить два полноценных ответа от разных нейросетей — каждый снабжён достоверными ссылками на научные публикации, что делает SciArena идеальным помощником для учёных и студентов.

Как устроена система оценки?

Механизм SciArena построен на базе AI2 ScholarQA, выполняющего интеллектуальный поиск по коллекции Semantic Scholar.. После нахождения релевантных публикаций платформа отправляет одинаковый запрос двум случайным моделям. Их задача — на основе найденной литературы сформулировать развёрнутый, обоснованный ответ, снабдив каждое утверждение ссылкой на источник.

Чтобы избежать любых намёков на предвзятость, оформление текста унифицируют, убирая стилистические отличия между ответами. Пользователю остаётся только прочесть оба варианта и проголосовать за тот, который показался наиболее убедительным.

Лидеры интеллектуального марафона

В гонке ИИ для науки участвуют 23 модели, разработанные ведущими технологическими компаниями — включая OpenAI, Anthropic, Google, Alibaba и других. Перед официальным стартом платформы было проведено более 13 тысяч сравнительных тестов, в которых приняли участие 102 независимых эксперта — это позволило выстроить первичный рейтинг нейросетей.

На сегодняшний день первое место стабильно удерживает OpenAI o3: она демонстрирует уверенное превосходство практически во всех дисциплинах — от молекулярной биологии до машиностроения. В лидирующей тройке также закрепились Claude 4 Opus и Gemini 2.5 Pro.

➡️ Попробовать возможности платформы может каждый — перейдите по ссылке и введите интересующий вопрос. Интерфейс поддерживает русский язык, однако стоит учитывать, что часть моделей пока отвечает исключительно на английском.

Кира Титова
Кира Титова
Статей: 449

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *