LongCat-Flash-Chat

LongCat-Flash-Chat

美团技术团队发布并开源的高效混合专家(MoE)语言模型
2025-09-04
语言大模型
输入:
$0.2/1M tokens
输出:
$1/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

LongCat-Flash-Chat 是美团技术团队正式发布并开源的高效混合专家(MoE)语言模型,核心定位为“动态计算、极速推理、智能体优先”的新一代 AI 基础模型,专为复杂、长时、工具密集型任务设计。

  • 超大规模 MoE 架构:总参数达 560B,单 Token 仅激活 18.6B~31.3B 参数(平均约 27B),通过创新的“零计算专家(Zero-Computation Experts)”机制实现算力按需分配
  • 行业领先的推理效率:在 NVIDIA H800 上实现 100+ tokens/s 的生成速度,显著快于同规模甚至更小的主流模型
  • 智能体能力全面领先:在 τ2-Bench(工具使用)和 VitaBench(复杂场景智能体)中表现优异,尤其适合耗时较长的多步 Agent 应用

───────────────────────────────────────────────────────────────────

核心能力

🧠 强指令遵循能力:在 IFEval(89.65) 中位列第一,在中文指令基准 COLLIEMeeseeks-zh 也斩获最佳成绩

📚 通用知识扎实:MMLU 得分 89.71,CEval 得分 90.44,ArenaHard-V2 得分 86.50,综合性能比肩国内顶尖模型

🧩 Agentic 原生训练:自建 Agentic 评测集,采用多智能体方法生成高质量轨迹数据,全流程优化工具调用与环境交互能力

系统级工程优化:引入跨层通信并行、定制底层算子等技术,30 天内完成高效训练,推理延迟极低

───────────────────────────────────────────────────────────────────

相关评测

《追平 DeepSeek-V3?美团 LongCat-Flash-Chat 实测:快,但不够“聪明”》

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(LongCat-Flash-Chat)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

LongCat-Flash-Chat

Chat
128000

输入$0.2 / 1M tokens
输出$1 / 1M tokens

输入$0.2/ 1M tokens
输出$1/ 1M tokens
原价