企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

qwen3-coder-flash-2025-07-28

基于Qwen3的代码生成模型，继承Qwen3-Coder-Plus的coding agent能力

2025-07-28

语言大模型

输入:

$0.143/1M tokens起

输出:

$0.58/1M tokens起

大额采购联系客户经理享专属优惠

API介绍

qwen3-coder-flash是阿里通义 Qwen3-Coder 系列推出的轻量型 MoE 架构代码模型，核心定位为 “低门槛高性能编程助手”，以高效参数配置实现强代理式编码能力，适配中小规模开发与本地化部署场景。

MoE 架构高效配置：30.5B 总参数（激活 3.3B），128 个专家层（每 token 激活 8 个），GQA 注意力机制（Q 头 32 个、KV 头 4 个），平衡性能与算力消耗
超长上下文支持：原生 262144 tokens 上下文，经 YaRN 可扩展至 1M tokens，适配仓库级代码理解与长文本编程任务
跨场景编码能力：在 Agentic Coding、Browser-Use、Tool-Use 等任务中表现优异，支持多语言编程、代码生成、调试与工具调用
部署友好特性：支持单卡 H100/A100 运行（需 80GB VRAM），提供 FP8 量化版本（降 70% 显存占用），兼容 transformers、vLLM、llama.cpp 等框架
工具生态兼容：适配 Qwen Code、Cline、Claude Code 等编程工具，支持 OpenAI SDK 调用与阿里云百炼 API，提供自定义函数调用格式

───────────────────────────────────────────────────────────────────

核心能力

💻 专业代码生成：支持多语言代码编写（如快速排序算法）、全栈开发、代码修复，生成可运行代码，Pass@1率接近大参数量模型

🤖 代理式编程：自主规划多步骤开发任务，调用命令行、浏览器工具，处理跨文件重构、CI反馈调试等复杂流程

📚 长代码理解：解析1M token级代码库，精准识别跨文件依赖，适配大规模项目开发与维护

🔧 灵活工具调用：支持自定义工具函数（如数值计算），兼容主流编程工具链，可集成至IDE与开发工作流

🌍 多语言适配：原生支持多语言编程，中文处理能力突出，适配跨境开发与多语言项目需求

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（通义千问）	https://api.302.ai/chat/completions	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	官网原价	302.AI价格

qwen3-coder-flash-2025-07-28	0<Token≤32K	1000000	输入$0.143 / 1M tokens 输出$0.58 / 1M tokens	输入$0.143/ 1M tokens 输出$0.58/ 1M tokens 原价
qwen3-coder-flash-2025-07-28	32K<Token≤128K	1000000	输入$0.22 / 1M tokens 输出$0.86 / 1M tokens	输入$0.22/ 1M tokens 输出$0.86/ 1M tokens 原价
qwen3-coder-flash-2025-07-28	128K<Token≤256K	1000000	输入$0.36 / 1M tokens 输出$1.43 / 1M tokens	输入$0.36/ 1M tokens 输出$1.43/ 1M tokens 原价
qwen3-coder-flash-2025-07-28	256K<Token≤1M	1000000	输入$0.72 / 1M tokens 输出$3.58 / 1M tokens	输入$0.72/ 1M tokens 输出$3.58/ 1M tokens 原价