企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

gemma-2-27b

谷歌高性能且高效的开源模型

2024-06-27

语言大模型

输入:

$0.18/1M tokens

输出:

$0.18/1M tokens

大额采购联系客户经理享专属优惠

稳定性

稳定

API介绍

基本信息

Gemma-2-27B 是 Google 于 2024 年 6 月 27 日发布的开源大语言模型，属 Gemma 2 系列，总参数 270 亿，训练数据含 13 万亿令牌（涵盖网页文档、代码、科学文本等，以英文为主），上下文窗口 8192 令牌。遵循商业友好的 Gemma 许可证，可免费商用，已在 Google AI Studio、Kaggle、Hugging Face 开放访问，即将支持 Vertex AI 部署，适配单 NVIDIA A100/H100 GPU 或 Google Cloud TPU 主机全精度推理。

核心特性

性能领先，LMSYS Chatbot Arena 中击败 Llama 3 70B 等更大模型，MMLU 5-shot 75.2 分、HumanEval pass@1 51.8%、GSM8K 数学正确率 74.0%，同类规模开源模型中表现突出。
效率优异，全精度推理可在单 GPU/TPU 运行，较前代成本降低，还支持 4/8 位量化，适配游戏本、台式机等设备。
安全性升级，训练数据经 CSAM 与敏感信息过滤，在内容安全、表征伤害等基准测试中符合政策阈值，后续将集成 SynthID 文本水印技术。

技术亮点

采用重新设计的架构，交替使用局部滑动窗口（4096 令牌）与全局注意力（8192 令牌），平衡细节捕捉与全局理解。
支持多框架兼容，可通过 Hugging Face Transformers、JAX、PyTorch、TensorFlow（Keras 3.0）、vLLM 等调用，优化 NVIDIA TensorRT-LLM 适配英伟达硬件。
提供 Gemma Cookbook 示例库与 LLM Comparator 评估工具，支持 Keras、Hugging Face 微调，降低开发门槛。

适用场景

开发领域：中小型项目代码生成、调试，轻量级智能体构建，适配企业低成本开发需求。
科研教育：NLP 研究基础模型，文献总结、知识探索，学术研究者可申请 Google Cloud credits 支持。
商业应用：客服聊天机器人、文本生成（营销文案、邮件）、RAG 知识问答，助力企业快速落地 AI 解决方案。

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（硅基流动）	https://api.302.ai /chat/completions	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	官网原价	302.AI价格

gemma-2-27b

标准定价

8000

gemma-2-27b

API介绍

基本信息

核心特性

技术亮点

适用场景

Playground

API统计

API列表 (1)

API价格表

gemma-2-27b

输入$0.18 / 1M tokens
输出$0.18 / 1M tokens

输入$0.18/ 1M tokens
输出$0.18/ 1M tokens
原价

猜你喜欢

快捷访问

帮助与支持

法律声明

gemma-2-27b

API介绍

基本信息

核心特性

技术亮点

适用场景

Playground

API统计

API列表 (1)

API价格表

gemma-2-27b

输入$0.18 / 1M tokens输出$0.18 / 1M tokens

输入$0.18/ 1M tokens输出$0.18/ 1M tokens原价

猜你喜欢

输入$0.18 / 1M tokens
输出$0.18 / 1M tokens

输入$0.18/ 1M tokens
输出$0.18/ 1M tokens
原价