Qwen-VL (Qwen Large Vision Language Model)

Продукт

Разработчики:	Alibaba Group
Дата премьеры системы:	август 2023 г.
Отрасли:	Информационные технологии

Содержание

2025: Анонс версии Qwen 2.5-Max
2023: Запуск нейросети
Примечания

2025: Анонс версии Qwen 2.5-Max

29 января 2025 года компания Alibaba Cloud, облачное подразделение китайской корпорации Alibaba, представила большую языковую модель Qwen 2.5-Max. Утверждается, что эта нейросеть по возможностям превосходит мощную открытую модель искусственного интеллекта DeepSeek V3, которая, в свою очередь, опережает большинство открытых и закрытых аналогов, включая ChatGPT.

Qwen 2.5-Max использует архитектуру Mixture-of-Experts (MoE). Она предполагает применение множества подмоделей (экспертов), каждая из которых специализируется на разных аспектах входных данных или типов задач. Такой подход позволяет значительно увеличить скорость, а также повысить качество обработки запросов и генерируемых результатов.

Alibaba Cloud выпустила бесплатную нейросеть, которая мощнее DeepSeek

Нейросеть Qwen 2.5-Max предварительно обучена на более чем 20 трлн токенов. Дополнительно проведены контролируемая тонкая настройка (SFT) и обучение с подкреплением на основе отзывов людей (RLHF). Модель Qwen 2.5-Max, как утверждается, превосходит DeepSeek V3 в таких бенчмарках, как Arena-Hard, LiveBench, LiveCodeBench и GPQA-Diamond, а также демонстрирует конкурентоспособные результаты в других оценках, включая MMLU-Pro.

Qwen 2.5-Max превосходит почти по всем показателям GPT-4o, DeepSeek V3 и Llama-3.1-405B. Наши базовые модели продемонстрировали значительные преимущества в большинстве тестов, и мы с оптимизмом ожидаем, что усовершенствования в методах постобучения выведут следующую версию Qwen на новый уровень, — заявляет Alibaba.

Модель Qwen 2.5-Max доступна через сервис Qwen Chat, который можно использовать для тестирования возможностей нейросети, оценки ее эффективности и пр. В дальнейшем Alibaba Cloud планирует интегрировать Qwen 2.5-Max в свои облачные сервисы, что позволит расширить их функциональность.^[1]

2023: Запуск нейросети

25 августа 2023 года китайская корпорация Alibaba представила две модели искусственного интеллекта — Qwen-VL^[2] (Qwen Large Vision Language Model) и Qwen-VL-Chat, которые обеспечивают расширенные возможности в плане анализа изображений и ведения диалогов на естественном языке.

Вышедшие решения имеют открытый исходный код, а это означает, что независимые исследователи, научные организации и компании по всему миру смогут использовать их для создания собственных ИИ-приложений без необходимости обучения своих систем. Это позволит экономить аппаратные ресурсы, время и деньги. Кроме того, ускорится выход конечных продуктов на коммерческий рынок.

Китайская корпорация Alibaba представила две модели искусственного интеллекта

Модель Qwen-VL может распознавать изображения и текст. Алгоритм способен обрабатывать запросы, связанные с графическими файлами, генерировать ответы, подписи к изображениям и пр. В свою очередь, модель Qwen-VL-Chat предназначена для более сложного взаимодействия: она может сравнивать несколько графических файлов, отвечать на серии вопросов, а также генерировать повествования. ИИ-алгоритмы дают возможность формировать изображения на основе фотографий, которые предоставляет пользователь, а также решать математические задачи, показанные на картинке. Например, можно задать искусственному интеллекту вопрос о местонахождении той или иной компании, загрузив фото ее вывески.

Анонсированные ИИ-модели, как отмечается, призваны улучшить взаимодействие с пользователем, предоставляя более точную и актуальную информацию. Вместе с тем, отмечают специалисты, существуют вопросы, связанные с обеспечением конфиденциальности. ИИ-алгоритмы с возможностью визуальной локализации теоретически позволяют определять местоположение людей, запечатленных на фотографиях: эти сведения могут использоваться для слежки или в преступных целях.^[3]