gemma-2-27b

gemma-2-27b

谷歌高性能且高效的开源模型
2024-06-27
语言大模型
输入:
$0.18/1M tokens
输出:
$0.18/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

基本信息

Gemma-2-27B 是 Google 于 2024 年 6 月 27 日发布的开源大语言模型,属 Gemma 2 系列,总参数 270 亿,训练数据含 13 万亿令牌(涵盖网页文档、代码、科学文本等,以英文为主),上下文窗口 8192 令牌。遵循商业友好的 Gemma 许可证,可免费商用,已在 Google AI Studio、Kaggle、Hugging Face 开放访问,即将支持 Vertex AI 部署,适配单 NVIDIA A100/H100 GPU 或 Google Cloud TPU 主机全精度推理。

核心特性

  • 性能领先,LMSYS Chatbot Arena 中击败 Llama 3 70B 等更大模型,MMLU 5-shot 75.2 分、HumanEval pass@1 51.8%、GSM8K 数学正确率 74.0%,同类规模开源模型中表现突出。
  • 效率优异,全精度推理可在单 GPU/TPU 运行,较前代成本降低,还支持 4/8 位量化,适配游戏本、台式机等设备。
  • 安全性升级,训练数据经 CSAM 与敏感信息过滤,在内容安全、表征伤害等基准测试中符合政策阈值,后续将集成 SynthID 文本水印技术。

技术亮点

  • 采用重新设计的架构,交替使用局部滑动窗口(4096 令牌)与全局注意力(8192 令牌),平衡细节捕捉与全局理解。
  • 支持多框架兼容,可通过 Hugging Face Transformers、JAX、PyTorch、TensorFlow(Keras 3.0)、vLLM 等调用,优化 NVIDIA TensorRT-LLM 适配英伟达硬件。
  • 提供 Gemma Cookbook 示例库与 LLM Comparator 评估工具,支持 Keras、Hugging Face 微调,降低开发门槛。

适用场景

  • 开发领域:中小型项目代码生成、调试,轻量级智能体构建,适配企业低成本开发需求。
  • 科研教育:NLP 研究基础模型,文献总结、知识探索,学术研究者可申请 Google Cloud credits 支持。
  • 商业应用:客服聊天机器人、文本生成(营销文案、邮件)、RAG 知识问答,助力企业快速落地 AI 解决方案。


Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(硅基流动)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

gemma-2-27b

标准定价
8000

输入$0.18 / 1M tokens
输出$0.18 / 1M tokens

输入$0.18/ 1M tokens
输出$0.18/ 1M tokens
原价