
qwen3-rerank
基于Qwen LLM底座训练的文本排序模型
2026-01-26
输入:
$0.07/1M tokens
输出:
免费
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
Qwen3-Rerank 是阿里巴巴推出的基于Qwen LLM底座训练的文本排序模型,对输入的Query和候选Docs进行相关性排序,支持100+语种和长文本输入,适用于文本检索、RAG等场景,效果对齐开源Qwen3-Rerank系列模型,核心定位为覆盖全场景、全参数规模的高精度语义重排与检索增强(RAG)解决方案,
- 超长上下文:支持 30k 超长上下文窗口,轻松处理复杂长文档的排序任务,解决传统模型“记不住”长文本的痛点。
- 灵活部署:支持 CPU/消费级 GPU 到专业级显卡的全链路部署,无论是高并发搜索还是深度语义分析,都能找到最优解。
───────────────────────────────────────────────────────────────────
核心能力
📏 超长文本理解
30k 上下文窗口,精准捕捉长文档、长对话中的深层语义逻辑,大幅提升 RAG(检索增强生成)系统的准确率。
⚡ 极致性价比
毫秒级响应,显存占用极低;无论追求速度还是精度,都能实现性能与成本的最佳平衡。
🏆 权威认证
基于强大的 Qwen3 基座模型优化,在重排、多语言理解等核心任务上经过海量数据验证,性能处于行业第一梯队。
API调试台
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽