Разработчики: | Tencent Holdings |
Дата премьеры системы: | март 2025 г |
Отрасли: | Информационные технологии |
Содержание[Свернуть] |
История
2025: Анонс продукта
В конце марта 2025 года китайская компания Tencent Holdings представила «рассуждающую» ИИ-модель Hunyuan-T1. Она превосходит ChatGPT, а также конкурирует с DeepSeek R1 как по производительности, так и по цене.
Tencent заявляет, что впервые в отрасли использовала гибридный подход, объединяющий архитектуру глубоких нейронных сетей Google Transformer и архитектуру Mamba, разработанную Университетом Карнеги-Меллона и Принстонским университетом. По сравнению с традиционной архитектурой Transformer гибридный подход значительно сокращает затраты на обучение и инференс благодаря снижению требований в отношении памяти.
В большинстве тестов Hunyuan-T1 демонстрирует производительность, сопоставимую с показателями других распространенных ИИ-моделей, таких как DeepSeek R1, GPT-4.5 и GPT-o1. В частности, Hunyuan-T1 набрала 87,2 балла в бенчмарке Massive Multitask Language Understanding (MMLU) Pro, который оценивает знания модели. Для сравнения, у DeepSeek R1 показатель составил 84 балла, у GPT-4.5 — 86,1 балла, а у GPT-o1 — 89,3 балла. В математическом тесте Math-500 модель Hunyuan-T1 получила 96,2 балла. Результат DeepSeek R1, GPT-4.5 и GPT-o1 — соответственно 97,3 балла, 90,7 балла и 96,4 балла.
Как утверждает Tencent, Hunyuan-T1 значительно сокращает потребление ресурсов по сравнению с конкурирующими моделями. Кроме того, Hunyuan-T1 «лучше захватывает большие текстовые фрагменты», что позволяет ей точнее рассуждать и меньше галлюцинировать. Новая модель конкурирует с DeepSeek в плане стоимости использования: за доступ к Hunyuan-T1 взимается 1 юань ($0,14 по курсу на 24 марта 2025 года) за 1 млн входных токенов и 4 юаня за 1 млн выходных. В случае DeepSeek R1 цена составляет соответственно 1 юань (0,25 юаня ночью) и 16 юаней (4 юаня ночью).[1]