企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

qwen2.5-72b-instruct

Qwen2.5-72B-Instruct 是阿里巴巴推出的旗舰级开源语言模型，通过深度优化的推理架构为复杂任务处理提供行业标杆级解决方案

2024-09-19

语言大模型

输入:

$0.58/1M tokens

输出:

$1.72/1M tokens

大额采购联系客户经理享专属优惠

稳定性

稳定

API介绍

Qwen2.5-72B-Instruct 是阿里巴巴推出的开源语言模型级旗舰产品，核心定位为 高性能、长文本处理与结构化输出优化的企业级大模型，支持128K上下文。

性能跃升：72B参数模型在MMLU、MATH等12项权威测试中超越Llama-3.1-70B，推理速度比同类快2倍，成本仅为1/4。
适用场景：适配金融风控、代码生成、多语言翻译等高频交互场景，支持JSON结构化输出与复杂系统指令执行。
多模态能力：支持29+语言（含中英法日韩等），结构化数据（如表格）理解能力提升30%。
竞品对比：HumanEval代码评测达86.6分（CodeQwen1.5为86.0），MBPP任务完成率88.2%（Llama3.1-70B为84.2%）。

───────────────────────────────────────────────────────────────────

核心能力

⚡ 超高速推理：独家优化KV缓存技术，响应延迟＜50ms。

📊 长文本处理：支持128K上下文理解与8K连续生成，复杂报告处理效率提升50%。

🔑 结构化输出：JSON生成准确率92.3%，表格数据解析速度比行业均值快3倍。

🌍 多语言覆盖：29+语言无缝切换，中英混合场景F1评分达89.7（SDXL为85.2）。

🛠️ 工具生态：原生兼容vLLM/Ollama工具调用

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（Qwen2.5）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	官网原价	302.AI价格