企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

Dots.OCR

Dots.OCR

由302.AI团队自主部署的OCR大模型

2025-08-23

信息处理

价格:

$1/1M Tokens

大额采购联系客户经理享专属优惠

稳定性

稳定

API介绍

dots.ocr 是一款功能强大的多语言文档解析器，它将布局检测与内容识别统一整合到一个视觉-语言模型中，并能有效保持正确的阅读顺序。尽管其基础模型参数仅为17亿，却已达到行业领先（SOTA）的性能水平。

卓越性能：在 OmniDocBench 上，dots.ocr 在文本、表格及阅读顺序的解析任务上均实现了SOTA表现，同时其公式识别效果可媲美规模大得多的Doubao-1.5和Gemini 2.5-Pro等模型。
多语言支持：dots.ocr 展现出对低资源语言的强大解析能力，在我们内部构建的多语言文档基准测试中，无论是在布局检测还是内容识别方面，均取得了显著优势。
统一且简洁的架构：通过采用单一的视觉-语言模型，dots.ocr 提供了比传统依赖复杂多模型流水线的方法更为精简的架构。只需简单调整输入提示，即可轻松切换不同任务，充分证明了VLM模型同样能够实现与DocLayout-YOLO等传统检测模型相媲美的高效检测效果。
高效快速的性能：基于紧凑的17亿参数LLM模型，dots.ocr 的推理速度远超许多其他采用更大基础模型但性能优异的同类产品。

API调试台

登录后，探索更多精彩功能！点击登录

API列表 (2)

API描述	接口地址	请求方法	稳定性	参数说明
创建dots.ocr任务	https://api.302.ai/302/v2/dots_ocr/task	POST	稳定	查看详情
文档详情创建dots_ocr任务价格：1 PTC/M Tokens 请求参数 Header参数 Authorizationstring 必需示例值:`Bearer {{YOUR_API_KEY}}` Body参数 application/json file_urlstring 必需待处理的文件链接示例值:`http://xxx.pdf` prompt_modeenum<string> 必需 `提示模式 1.prompt_layout_all_en: parse all layout info in json format. 2.prompt_layout_only_en: layout detection 3.prompt_ocr: parse ocr text except the Page-header and Page-footer 4.prompt_grounding_ocr: extract text content in the given bounding box` 枚举值: `prompt_layout_all_enprompt_layout_only_enprompt_ocrprompt_grounding_ocr` 示例值:`prompt_layout_all_en` temperatureanyOf 可选温度参数，取值范围0-1，默认为0.1 numbernull `>= 0` `<= 1` 默认值:`0.1` top_panyOf 可选 top_p参数，取值范围0-1，默认为1.0 numbernull `>= 0` `<= 1` 默认值:`1`
查看dots.ocr任务	https://api.302.ai/302/v2/dots_ocr/task	GET	稳定	查看详情
文档详情查看dots_ocr任务价格：免费请求参数 Header参数 Authorizationstring 必需示例值:`Bearer {{YOUR_API_KEY}}` Query参数 task_idstring 必需任务ID

API价格表

$￥円 ₽

模型	说明	302.AI价格

创建dots.ocr任务	-	$1/1M Tokens
查看dots.ocr任务	-	免费

猜你喜欢