
gemma-2-27b
谷歌高性能且高效的开源模型
2024-06-27
输入:
$0.18/1M tokens
输出:
$0.18/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
基本信息
Gemma-2-27B 是 Google 于 2024 年 6 月 27 日发布的开源大语言模型,属 Gemma 2 系列,总参数 270 亿,训练数据含 13 万亿令牌(涵盖网页文档、代码、科学文本等,以英文为主),上下文窗口 8192 令牌。遵循商业友好的 Gemma 许可证,可免费商用,已在 Google AI Studio、Kaggle、Hugging Face 开放访问,即将支持 Vertex AI 部署,适配单 NVIDIA A100/H100 GPU 或 Google Cloud TPU 主机全精度推理。
核心特性
- 性能领先,LMSYS Chatbot Arena 中击败 Llama 3 70B 等更大模型,MMLU 5-shot 75.2 分、HumanEval pass@1 51.8%、GSM8K 数学正确率 74.0%,同类规模开源模型中表现突出。
- 效率优异,全精度推理可在单 GPU/TPU 运行,较前代成本降低,还支持 4/8 位量化,适配游戏本、台式机等设备。
- 安全性升级,训练数据经 CSAM 与敏感信息过滤,在内容安全、表征伤害等基准测试中符合政策阈值,后续将集成 SynthID 文本水印技术。
技术亮点
- 采用重新设计的架构,交替使用局部滑动窗口(4096 令牌)与全局注意力(8192 令牌),平衡细节捕捉与全局理解。
- 支持多框架兼容,可通过 Hugging Face Transformers、JAX、PyTorch、TensorFlow(Keras 3.0)、vLLM 等调用,优化 NVIDIA TensorRT-LLM 适配英伟达硬件。
- 提供 Gemma Cookbook 示例库与 LLM Comparator 评估工具,支持 Keras、Hugging Face 微调,降低开发门槛。
适用场景
- 开发领域:中小型项目代码生成、调试,轻量级智能体构建,适配企业低成本开发需求。
- 科研教育:NLP 研究基础模型,文献总结、知识探索,学术研究者可申请 Google Cloud credits 支持。
- 商业应用:客服聊天机器人、文本生成(营销文案、邮件)、RAG 知识问答,助力企业快速落地 AI 解决方案。
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽