claude-3-haiku-20240307

claude-3-haiku-20240307

较快速的视觉文本模型,能以近乎即时的方式提供流畅的人机交互体验
2024-03-07
语言大模型
Model capability: image
输入:
$0.25/1M tokens
输出:
$1.25/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

基本信息

  • Claude 3 Haiku 是 Anthropic 在 Claude 3 模型家族(Claude 3 Opus、Sonnet、Haiku)中的 “轻量/极速” 型号。
  • 它定位于最快、最经济的模型选项,在同等级智能水平中拥有极高性价比。
  • 从模型卡来看,它支持高达 200K tokens 的上下文窗口。
  • 在价格上,其输入 token 成本约为 $0.25 / 百万 input tokens,输出 token 成本为 $1.25 / 百万 output tokens。

核心特性

  • 极速响应:Haiku 是 Claude 3 家族中最迅速的模型之一,能在非常短时间内生成回应。官方指出其在处理轻量查询时近乎“实时”响应。
  • 高吞吐量:据报道,Haiku 在特定情况下可以处理约 21,000 tokens/s(比如 prompt 小于 32K tokens 时)。
  • 大上下文理解:拥有 200K token 的上下文容量,允许它处理非常长、密集的信息输入。
  • 视觉能力:尽管是轻量型,Haiku 依然具备处理图像(如图表、照片、技术图示等)的能力。
  • 减少拒答:与早期模型相比,Haiku 对边界提示(guardrail)更具上下文理解能力,更少做出无谓拒绝。

技术亮点

  • 高效成本结构:Haiku 的定价策略使其非常适合大规模、频繁调用的场景,特别是那些对速度和成本敏感的应用。
  • 强记忆能力(Recall):Claude 3 家族整体在 “长上下文 — 回忆信息” 的能力上表现优异。虽然 Opus 的回忆能力最强,但 Haiku 仍受益于这一架构。
  • 训练与安全机制:借助 Anthropic 的 Constitutional AI 训练方法,以及为减少不当内容设计的安全机制,Haiku(和整个 Claude 3 家族)在可靠性和安全性上都有所强化。
  • 多语言流利性:Haiku 能够较流畅地处理多种语言(如西班牙语、日语、法语等),这使其在多语言应用中更具灵活性。

适用场景

  • 实时客户交互:例如客服聊天机器人,实时 FAQ 回复,或用户支持系统,都可以利用 Haiku 的高速响应能力。
  • 内容审核 / 内容中断检测:由于 Haiku 响应快、成本低,可用于对用户生成内容做实时风险判断(如内容 moderation)。
  • 轻量级文本处理:例如提取非结构化数据、从文档中抽取关键信息(如物流、库存管理)。
  • 翻译与多语交互:适合做快速翻译、跨语言对话或其他多语言任务,因为 Haiku 支持多语言且响应迅速。

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (7)

API描述接口地址请求方法稳定性参数说明
Chat(聊天)
POST
稳定
查看详情
Chat(分析图片)
POST
稳定
查看详情
Chat(函数调用)
POST
稳定
查看详情
Messages(原始格式)
POST
稳定
查看详情
Messages(函数调用)
POST
稳定
查看详情
Messages(思考模式)
POST
稳定
查看详情
Messages(128k输出)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

claude-3-haiku-20240307

缓存写入:$0.5 /1M tokens, 缓存读取:$0.05 /1M tokens
200000

输入$0.25 / 1M tokens
输出$1.25 / 1M tokens

输入$0.25/ 1M tokens
输出$1.25/ 1M tokens
原价