
qwen2.5-72b-instruct
Qwen2.5-72B-Instruct 是阿里巴巴推出的旗舰级开源语言模型,通过深度优化的推理架构为复杂任务处理提供行业标杆级解决方案
2024-09-19
输入:
$0.58/1M tokens
输出:
$1.72/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
Qwen2.5-72B-Instruct 是阿里巴巴推出的开源语言模型级旗舰产品,核心定位为 高性能、长文本处理与结构化输出优化的企业级大模型,支持128K上下文。
- 性能跃升:72B参数模型在MMLU、MATH等12项权威测试中超越Llama-3.1-70B,推理速度比同类快2倍,成本仅为1/4。
- 适用场景:适配金融风控、代码生成、多语言翻译等高频交互场景,支持JSON结构化输出与复杂系统指令执行。
- 多模态能力:支持29+语言(含中英法日韩等),结构化数据(如表格)理解能力提升30%。
- 竞品对比:HumanEval代码评测达86.6分(CodeQwen1.5为86.0),MBPP任务完成率88.2%(Llama3.1-70B为84.2%)。
───────────────────────────────────────────────────────────────────
核心能力
⚡ 超高速推理:独家优化KV缓存技术,响应延迟<50ms。
📊 长文本处理:支持128K上下文理解与8K连续生成,复杂报告处理效率提升50%。
🔑 结构化输出:JSON生成准确率92.3%,表格数据解析速度比行业均值快3倍。
🌍 多语言覆盖:29+语言无缝切换,中英混合场景F1评分达89.7(SDXL为85.2)。
🛠️ 工具生态:原生兼容vLLM/Ollama工具调用
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽