企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

claude-3-haiku-20240307

claude-3-haiku-20240307

较快速的视觉文本模型，能以近乎即时的方式提供流畅的人机交互体验

2024-03-07

语言大模型

输入:

$0.25/1M tokens

输出:

$1.25/1M tokens

大额采购联系客户经理享专属优惠

API介绍

基本信息

Claude 3 Haiku 是 Anthropic 在 Claude 3 模型家族（Claude 3 Opus、Sonnet、Haiku）中的 “轻量／极速” 型号。
它定位于最快、最经济的模型选项，在同等级智能水平中拥有极高性价比。
从模型卡来看，它支持高达 200K tokens 的上下文窗口。
在价格上，其输入 token 成本约为 $0.25 / 百万 input tokens，输出 token 成本为 $1.25 / 百万 output tokens。

核心特性

极速响应：Haiku 是 Claude 3 家族中最迅速的模型之一，能在非常短时间内生成回应。官方指出其在处理轻量查询时近乎“实时”响应。
高吞吐量：据报道，Haiku 在特定情况下可以处理约 21,000 tokens/s（比如 prompt 小于 32K tokens 时）。
大上下文理解：拥有 200K token 的上下文容量，允许它处理非常长、密集的信息输入。
视觉能力：尽管是轻量型，Haiku 依然具备处理图像（如图表、照片、技术图示等）的能力。
减少拒答：与早期模型相比，Haiku 对边界提示（guardrail）更具上下文理解能力，更少做出无谓拒绝。

技术亮点

高效成本结构：Haiku 的定价策略使其非常适合大规模、频繁调用的场景，特别是那些对速度和成本敏感的应用。
强记忆能力（Recall）：Claude 3 家族整体在 “长上下文 — 回忆信息” 的能力上表现优异。虽然 Opus 的回忆能力最强，但 Haiku 仍受益于这一架构。
训练与安全机制：借助 Anthropic 的 Constitutional AI 训练方法，以及为减少不当内容设计的安全机制，Haiku（和整个 Claude 3 家族）在可靠性和安全性上都有所强化。
多语言流利性：Haiku 能够较流畅地处理多种语言（如西班牙语、日语、法语等），这使其在多语言应用中更具灵活性。

适用场景

实时客户交互：例如客服聊天机器人，实时 FAQ 回复，或用户支持系统，都可以利用 Haiku 的高速响应能力。
内容审核 / 内容中断检测：由于 Haiku 响应快、成本低，可用于对用户生成内容做实时风险判断（如内容 moderation）。
轻量级文本处理：例如提取非结构化数据、从文档中抽取关键信息（如物流、库存管理）。
翻译与多语交互：适合做快速翻译、跨语言对话或其他多语言任务，因为 Haiku 支持多语言且响应迅速。

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (7)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（聊天）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据
Chat（分析图片）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据
Chat（函数调用）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据
Messages（原始格式）	https://api.302.ai/v1/messages	POST	稳定	查看详情
暂无数据
Messages（函数调用）	https://api.302.ai/v1/messages	POST	稳定	查看详情
暂无数据
Messages（思考模式）	https://api.302.ai/v1/messages	POST	稳定	查看详情
暂无数据
Messages（128k输出）	https://api.302.ai/v1/messages	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	官网原价	302.AI价格

claude-3-haiku-20240307

缓存写入：$0.5 /1M tokens，缓存读取：$0.05 /1M tokens

200000

输入$0.25 / 1M tokens
输出$1.25 / 1M tokens

输入$0.25/ 1M tokens
输出$1.25/ 1M tokens
原价

猜你喜欢