企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

推理模式

推理模式

为任何大模型增加推理能力

2024-02-01

语言大模型

价格:

根据模型收取

大额采购联系客户经理享专属优惠

API介绍

为任何大模型增加推理能力

API调试台

登录后，探索更多精彩功能！点击登录

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（推理模式）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
文档详情为所有模型增加推理能力，有两种打开的方法，任选其一即可：在所有模型后缀加上-fusion，例如gpt-4o-fusion（方便用于第三方软件）在模型请求时加上参数"-fusion":true（方便用于API）在模型请求时加上参数”thinking-model“并填入自选模型，此时会融合两个模型的回答。（注意：如果自选模型为推理模型，则会融合推理的部分；如果自选模型为普通模型，则会融合回答的部分）灵感来自于Deepclaude，原理是将用户的问题先询问DeepSeek-R1，获得思考过程，再将思考过程和问题拼接在一起，给到原有模型。这是一种多模型融合的方式，在302平台适用于任何模型此功能可以和图片分析或联网搜索一起使用例如：gpt-4o-fusion-web-search 价格：在原有模型基础上+Deepseek-v3.1模型的费用请求参数 Header参数 Content-Typestring 必需示例值:`application/json` Acceptstring 必需示例值:`application/json` Authorizationstring 必需示例值:`Bearer {{YOUR_API_KEY}}` Body参数 application/json modelstring 必需要使用的模型的 ID。有关哪些模型适用于聊天 API 的详细信息，请参阅模型端点兼容性表。 messagesarray[object] 必需以聊天格式生成聊天完成的消息。 rolestring 可选 contentstring 可选 temperatureinteger 可选使用什么采样温度，介于 0 和 2 之间。较高的值（如 0.8）将使输出更加随机，而较低的值（如 0.2）将使输出更加集中和确定。我们通常建议改变这个或`top_p`但不是两者。 top_pinteger 可选一种替代温度采样的方法，称为核采样，其中模型考虑具有 top_p 概率质量的标记的结果。所以 0.1 意味着只考虑构成前 10% 概率质量的标记。我们通常建议改变这个或`temperature`但不是两者。 ninteger 可选为每个输入消息生成多少个聊天完成选项。 streamboolean 可选如果设置，将发送部分消息增量，就像在 ChatGPT 中一样。当令牌可用时，令牌将作为纯数据服务器发送事件`data: [DONE]`发送，流由消息终止。有关示例代码，请参阅 OpenAI Cookbook 。 stopstring 可选 API 将停止生成更多令牌的最多 4 个序列。 max_tokensinteger 可选聊天完成时生成的最大令牌数。输入标记和生成标记的总长度受模型上下文长度的限制。 presence_penaltynumber 可选 -2.0 和 2.0 之间的数字。正值会根据到目前为止是否出现在文本中来惩罚新标记，从而增加模型谈论新主题的可能性。查看有关频率和存在惩罚的更多信息。 frequency_penaltynumber 可选 -2.0 和 2.0 之间的数字。正值会根据新标记在文本中的现有频率对其进行惩罚，从而降低模型逐字重复同一行的可能性。查看有关频率和存在惩罚的更多信息。 logit_biasnull 可选修改指定标记出现在完成中的可能性。接受一个 json 对象，该对象将标记（由标记器中的标记 ID 指定）映射到从 -100 到 100 的关联偏差值。从数学上讲，偏差会在采样之前添加到模型生成的 logits 中。确切的效果因模型而异，但 -1 和 1 之间的值应该会减少或增加选择的可能性；像 -100 或 100 这样的值应该导致相关令牌的禁止或独占选择。 userstring 可选代表您的最终用户的唯一标识符，可以帮助 OpenAI 监控和检测滥用行为。了解更多。

API价格表

$￥円 ₽

模型	说明	302.AI价格

服务

在原有模型基础上+DeepSeek-R1模型的费用

根据模型收取

猜你喜欢