文本生成模型-j9九游会登录
将文本对话的输入和输出转化为token计费。调用文本生成模型时,内容生成成功会计费,内容生成失败不计费。
按token计费
在调用模型推理服务的过程中,输入内容首先会被分词(tokenize),转换为模型可识别的token。在调用maas预置服务时,将根据实际使用的tokens数量进行计费。具体价格请以maas控制台为准。
|
模型名称 |
计费子项 |
单价(元/千tokens) |
计费项说明 |
计费公式 |
||
|---|---|---|---|---|---|---|
|
deepseek-r1 |
输入 |
0.004 |
用于模型推理的token输入、输出。 具体费用请参见。 |
费用 = 输入token使用数量 * 输入token单价 输出token使用数量 * 输出token单价 |
||
|
输出 |
0.016 |
|||||
|
deepseek-v3 |
输入 |
0.002 |
||||
|
输出 |
0.008 |
|||||
|
deepseek-v3.1 |
输入 |
0.004 |
||||
|
输出 |
0.012 |
|||||
|
deepseek-v3.2 |
输入 |
0.002 |
||||
|
输出 |
0.003 |
|||||
|
deepseek-v3.2-exp |
输入 |
0.002 |
||||
|
输出 |
0.003 |
|||||
|
qwen3-235b-a22b |
输入 |
0.002 |
||||
|
输出 |
思考模式 |
0.02 |
||||
|
非思考模式 |
0.008 |
|||||
|
qwen3-30b-a3b |
输入 |
0.00075 |
||||
|
输出 |
思考模式 |
0.0075 |
||||
|
非思考模式 |
0.003 |
|||||
|
qwen3-coder-480b-a35b |
单次请求的输入token数 |
0 |
输入 |
0.006 |
||
|
输出 |
0.024 |
|||||
|
32k |
输入 |
0.009 |
||||
|
输出 |
0.036 |
|||||
|
qwen3-32b |
输入 |
0.002 |
||||
|
输出 |
思考模式 |
0.02 |
||||
|
非思考模式 |
0.008 |
|||||
|
kimi-k2 |
输入 |
0.004 |
||||
|
输出 |
0.016 |
|||||
|
longcat-flash-chat |
输入 |
0.002 |
||||
|
输出 |
0.008 |
|||||
|
qwen3-coder-480b-a35b |
单次请求的输入token数 |
0 |
输入 |
0.006 |
用于模型推理的token输入、输出。具体费用请参见。 该模型调用时,会根据请求的输入token长度所在区间计费。 例如:输入token长度为20k,则输入和输出分别按照0.006元/千tokens和0.024元/千tokens计费。 |
|
|
输出 |
0.024 |
|||||
|
32k |
输入 |
0.009 |
||||
|
输出 |
0.036 |
|||||
按套餐包/资源包计费
您可以在先购买套餐包,在调用maas预置服务时,将根据实际使用的tokens数量进行计费。
|
模型名称 |
套餐包额度(tokens) |
有效期 |
原价(元) |
支持抵扣的模型服务 |
价格 |
|---|---|---|---|---|---|
|
deepseek-v3.1 |
100万 |
1个月 |
5.6 |
购买deepseek-v3.1模型的套餐包,可抵扣deepseek-v3.1模型的token用量。 |
具体价格、优惠信息和约束限制请以活动页和购买页面显示为准。 |
|
1000万 |
1个月 |
56 |
|||
|
1亿 |
3个月 |
558 |
|||
|
10亿 |
3个月 |
5598 |
|||
|
deepseek-v3.2 |
100万 |
1个月 |
2.2 |
购买deepseek-v3.2模型的套餐包,可抵扣deepseek-v3.2、deepseek-v3.2-exp模型的token用量。 |
|
|
1000万 |
1个月 |
22 |
|||
|
1亿 |
3个月 |
219 |
|||
|
10亿 |
3个月 |
2199 |
套餐包的使用范围、计费规则、使用区域等信息说明如下:
- 使用范围
套餐包仅支持抵扣使用或功能,对deepseek模型进行在线体验或api调用所消耗的输入tokens和输出tokens。
- 计费规则
为保证业务正常,计费时将优先使用套餐包的额度,超出部分将自动根据使用模型的token量按正常价格收费。如需终止计费,请及时停止服务调用,不使用服务则不会产生费用。关于如何按照按tokens使用量计费,请参见计费示例。
- 使用区域
套餐包和购买时选定的区域绑定,套餐包只能使用于购买时选定的区域。
- 套餐包抵扣顺序
对于同一模型的多个套餐包,计费时将按照以下顺序依次抵扣:失效时间最早>生效时间最早>创建时间最早。
- 有效期
套餐包的额度为购买日起,有效期内的可使用的tokens量。
- 账单查询
您可以在费用中心的页面,查看已购买的资源包列表及其用量(1 token = 1抵扣点数)。
您也可以在左侧导航栏,选择,进入费用中心的资源包页面。
- 退订声明
已购买套餐包不支持退订,请您购买前请确认。
- 用户须知
- 用户不得将华为云产品和服务用于任何违法违规或侵犯第三方合法权益的用途,如因此产生的法律责任,由用户自行承担责任,与华为云无关。
- 用户应遵守《》相关协议及页面使用规则(包括但不限于产品服务等级协议、使用规范、产品服务条款等)。
计费示例
以下案例中出现的费用价格仅供参考,实际价格请参见maas控制台价格详情。
假设用户调用deepseek r1的预置服务,输入tokens数300万,输出tokens数700万,总费用 = 300万 ÷ 1000 * 0.004 700万 ÷ 1000 * 0.016 = 124元。
相关文档
意见反馈
文档内容是否对您有帮助?
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨