
LongCat-Flash-Chat
美团技术团队发布并开源的高效混合专家(MoE)语言模型
2025-09-04
输入:
$0.2/1M tokens
输出:
$1/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
LongCat-Flash-Chat 是美团技术团队正式发布并开源的高效混合专家(MoE)语言模型,核心定位为“动态计算、极速推理、智能体优先”的新一代 AI 基础模型,专为复杂、长时、工具密集型任务设计。
- 超大规模 MoE 架构:总参数达 560B,单 Token 仅激活 18.6B~31.3B 参数(平均约 27B),通过创新的“零计算专家(Zero-Computation Experts)”机制实现算力按需分配
- 行业领先的推理效率:在 NVIDIA H800 上实现 100+ tokens/s 的生成速度,显著快于同规模甚至更小的主流模型
- 智能体能力全面领先:在 τ2-Bench(工具使用)和 VitaBench(复杂场景智能体)中表现优异,尤其适合耗时较长的多步 Agent 应用
───────────────────────────────────────────────────────────────────
核心能力
🧠 强指令遵循能力:在 IFEval(89.65) 中位列第一,在中文指令基准 COLLIE 与 Meeseeks-zh 也斩获最佳成绩
📚 通用知识扎实:MMLU 得分 89.71,CEval 得分 90.44,ArenaHard-V2 得分 86.50,综合性能比肩国内顶尖模型
🧩 Agentic 原生训练:自建 Agentic 评测集,采用多智能体方法生成高质量轨迹数据,全流程优化工具调用与环境交互能力
⚡ 系统级工程优化:引入跨层通信并行、定制底层算子等技术,30 天内完成高效训练,推理延迟极低
───────────────────────────────────────────────────────────────────
相关评测
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽