Подразделение Alibaba Group, специализирующееся на искусственном интеллекте, представило обновленную флагманскую модель Qwen2.5-Max. По данным компании, разработка демонстрирует более высокие показатели в сравнении с рядом популярных решений, включая GPT-4o от OpenAI, DeepSeek-V3, Llama-3.1-405B и Claude 3.5 Sonnet. В отличие от предыдущих релизов, выход новинки не спровоцировал резких колебаний на технологическом рынке.
Как следует из технической документации, Qwen2.5-Max обучалась на массиве данных объемом свыше 20 триллионов токенов. Для оптимизации модели применялись методы контролируемой тонкой настройки (SFT) и обучения с подкреплением, основанного на обратной связи (RLHF). Тестирование проводилось на таких платформах, как MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard, где система показала "значительное превосходство в большинстве дисциплин".
"Текущие результаты подтверждают потенциал базовой архитектуры, — заявили разработчики. — Дальнейшее совершенствование посттренировочных алгоритмов позволит вывести следующую версию модели на качественно новый уровень".
Доступ к Qwen2.5-Max уже открыт через интерфейс Qwen Chat, а интеграция с внешними сервисами возможна через облачную