企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

LongCat-Flash-Chat

美团技术团队发布并开源的高效混合专家（MoE）语言模型

2025-09-04

语言大模型

输入:

$0.2/1M tokens

输出:

$1/1M tokens

大额采购联系客户经理享专属优惠

API介绍

LongCat-Flash-Chat 是美团技术团队正式发布并开源的高效混合专家（MoE）语言模型，核心定位为“动态计算、极速推理、智能体优先”的新一代 AI 基础模型，专为复杂、长时、工具密集型任务设计。

超大规模 MoE 架构：总参数达 560B，单 Token 仅激活 18.6B~31.3B 参数（平均约 27B），通过创新的“零计算专家（Zero-Computation Experts）”机制实现算力按需分配
行业领先的推理效率：在 NVIDIA H800 上实现 100+ tokens/s 的生成速度，显著快于同规模甚至更小的主流模型
智能体能力全面领先：在 τ2-Bench（工具使用）和 VitaBench（复杂场景智能体）中表现优异，尤其适合耗时较长的多步 Agent 应用

───────────────────────────────────────────────────────────────────

核心能力

🧠 强指令遵循能力：在 IFEval（89.65） 中位列第一，在中文指令基准 COLLIE 与 Meeseeks-zh 也斩获最佳成绩

📚 通用知识扎实：MMLU 得分 89.71，CEval 得分 90.44，ArenaHard-V2 得分 86.50，综合性能比肩国内顶尖模型

🧩 Agentic 原生训练：自建 Agentic 评测集，采用多智能体方法生成高质量轨迹数据，全流程优化工具调用与环境交互能力

⚡ 系统级工程优化：引入跨层通信并行、定制底层算子等技术，30 天内完成高效训练，推理延迟极低

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（LongCat-Flash-Chat）	https://api.302.ai/chat/completions	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	官网原价	302.AI价格	官网价差