
Kwaipilot/KAT-Dev
为软件工程任务设计的开源 32B 参数模型
2025-09-27
输入:
$0.143/1M tokens
输出:
$0.572/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
KAT-Dev(32B)是一款专为软件工程任务设计的开源 32B 参数模型。在 SWE-Bench Verified 基准测试中,它取得了 62.4% 的解决率,在所有不同规模的开源模型中排名第五。该模型通过多个阶段进行优化,包括中间训练、监督微调(SFT)与强化微调(RFT),以及大规模智能体强化学习(RL)。该模型基于 Qwen3-32B,其训练过程通过增强工具使用、多轮交互和指令遵循等基础能力,为后续微调和强化学习阶段奠定基础。在微调阶段,模型不仅学习了八种精心策划的任务类型和编程场景,还创新性地引入了强化微调(RFT)阶段,利用人类工程师标注的“教师轨迹”进行指导。最后的智能体强化学习阶段通过多级前缀缓存、基于熵的轨迹修剪和高效架构解决了扩展性挑战
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽