qwen3-rerank

qwen3-rerank

基于Qwen LLM底座训练的文本排序模型
2026-01-26
输入:
$0.07/1M tokens
输出:
免费
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

Qwen3-Rerank 是阿里巴巴推出的基于Qwen LLM底座训练的文本排序模型,对输入的Query和候选Docs进行相关性排序,支持100+语种和长文本输入,适用于文本检索、RAG等场景,效果对齐开源Qwen3-Rerank系列模型,核心定位为覆盖全场景、全参数规模的高精度语义重排与检索增强(RAG)解决方案,

  • 超长上下文:支持 30k 超长上下文窗口,轻松处理复杂长文档的排序任务,解决传统模型“记不住”长文本的痛点。
  • 灵活部署:支持 CPU/消费级 GPU 到专业级显卡的全链路部署,无论是高并发搜索还是深度语义分析,都能找到最优解。

───────────────────────────────────────────────────────────────────

核心能力

📏 超长文本理解

30k 上下文窗口,精准捕捉长文档、长对话中的深层语义逻辑,大幅提升 RAG(检索增强生成)系统的准确率。

⚡ 极致性价比

毫秒级响应,显存占用极低;无论追求速度还是精度,都能实现性能与成本的最佳平衡。

🏆 权威认证

基于强大的 Qwen3 基座模型优化,在重排、多语言理解等核心任务上经过海量数据验证,性能处于行业第一梯队。

API调试台

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
qwen3-rerank
POST
稳定
查看详情

API价格表

$
模型说明302.AI价格

qwen3-rerank

qwen3-rerank

输入$0.07/ 1M tokens
输出免费
原价