Подразделение Alibaba Group, специализирующееся на искусственном интеллекте, представило обновленную флагманскую модель Qwen2.5-Max. По данным компании, разработка демонстрирует более высокие показатели в сравнении с рядом популярных решений, включая GPT-4o от OpenAI, DeepSeek-V3, Llama-3.1-405B и Claude 3.5 Sonnet. В отличие от предыдущих релизов, выход новинки не спровоцировал резких колебаний на технологическом рынке.

Как следует из технической документации, Qwen2.5-Max обучалась на массиве данных объемом свыше 20 триллионов токенов. Для оптимизации модели применялись методы контролируемой тонкой настройки (SFT) и обучения с подкреплением, основанного на обратной связи (RLHF). Тестирование проводилось на таких платформах, как MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard, где система показала "значительное превосходство в большинстве дисциплин".

"Текущие результаты подтверждают потенциал базовой архитектуры, — заявили разработчики. — Дальнейшее совершенствование посттренировочных алгоритмов позволит вывести следующую версию модели на качественно новый уровень".

Доступ к Qwen2.5-Max уже открыт через интерфейс Qwen Chat, а интеграция с внешними сервисами возможна через облачную

Читать на mignews.net

Все новости от mignews.net

Об этом же в других СМИ

Президент Ильхам Алиев: Мы придаем большое значение всестороннему развитию построенного на прочной основе сотрудничества с Китаем trend.az /1 день назад

Бывший министр: Галант и Халеви ответственны за то, что ХАМАС еще существует mignews.net /1 день назад

OpenAI: китайские компании пытаются заработать на моделях, разработанных в США mignews.net /1 день назад

Сайт israelan.com - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.