文本生成模型-j9九游会登录

将文本对话的输入和输出转化为token计费。调用文本生成模型时，内容生成成功会计费，内容生成失败不计费。

计费方式

支持以下两种计费方式。

按token计费

在调用模型推理服务的过程中，输入内容首先会被分词（tokenize），转换为模型可识别的token。在调用maas预置服务时，将根据实际使用的tokens数量进行计费。具体价格请以maas控制台为准。

表1 计费项
模型名称	计费子项			单价（元/千tokens）	计费项说明	计费公式
deepseek-r1	输入			0.004	用于模型推理的token输入、输出。具体费用请参见。	费用 = 输入token使用数量 * 输入token单价输出token使用数量 * 输出token单价
deepseek-r1	输出			0.016
deepseek-v3	输入			0.002
deepseek-v3	输出			0.008
deepseek-v3.1	输入			0.004
deepseek-v3.1	输出			0.012
deepseek-v3.2	输入			0.002
deepseek-v3.2	输出			0.003
deepseek-v3.2-exp	输入			0.002
deepseek-v3.2-exp	输出			0.003
qwen3-235b-a22b	输入			0.002
	输出	思考模式		0.02
	输出	非思考模式		0.008
qwen3-30b-a3b	输入			0.00075
	输出	思考模式		0.0075
	输出	非思考模式		0.003
qwen3-coder-480b-a35b	单次请求的输入token数	0	输入	0.006
		0	输出	0.024
		32k	输入	0.009
		32k	输出	0.036
qwen3-32b	输入			0.002
	输出	思考模式		0.02
	输出	非思考模式		0.008
kimi-k2	输入			0.004
kimi-k2	输出			0.016
longcat-flash-chat	输入			0.002
longcat-flash-chat	输出			0.008
qwen3-coder-480b-a35b	单次请求的输入token数	0	输入	0.006	用于模型推理的token输入、输出。具体费用请参见。该模型调用时，会根据请求的输入token长度所在区间计费。例如：输入token长度为20k，则输入和输出分别按照0.006元/千tokens和0.024元/千tokens计费。
		0	输出	0.024
		32k	输入	0.009
		32k	输出	0.036

按套餐包/资源包计费

您可以在先购买套餐包，在调用maas预置服务时，将根据实际使用的tokens数量进行计费。

模型名称	套餐包额度（tokens）	有效期	原价(元)	支持抵扣的模型服务	价格
deepseek-v3.1	100万	1个月	5.6	购买deepseek-v3.1模型的套餐包，可抵扣deepseek-v3.1模型的token用量。	具体价格、优惠信息和约束限制请以活动页和购买页面显示为准。
	1000万	1个月	56
	1亿	3个月	558
	10亿	3个月	5598
deepseek-v3.2	100万	1个月	2.2	购买deepseek-v3.2模型的套餐包，可抵扣deepseek-v3.2、deepseek-v3.2-exp模型的token用量。
	1000万	1个月	22
	1亿	3个月	219
	10亿	3个月	2199

套餐包的使用范围、计费规则、使用区域等信息说明如下：

使用范围
套餐包仅支持抵扣使用“模型推理 > 在线推理 > 预置服务”或“模型推理 > 在线推理 > 自定义接入点”功能，对deepseek模型进行在线体验或api调用所消耗的输入tokens和输出tokens。
- 调用预置服务时，需要先在“模型推理 > 在线推理 > 预置服务”页面进行开通。关于如何开通和调用预置服务，请参见开通预置服务。
- 关于如何创建和调用自定义接入点，请参见创建自定义接入点。
计费规则
为保证业务正常，计费时将优先使用套餐包的额度，超出部分将自动根据使用模型的token量按正常价格收费。如需终止计费，请及时停止服务调用，不使用服务则不会产生费用。关于如何按照按tokens使用量计费，请参见计费示例。
使用区域
套餐包和购买时选定的区域绑定，套餐包只能使用于购买时选定的区域。
套餐包抵扣顺序
对于同一模型的多个套餐包，计费时将按照以下顺序依次抵扣：失效时间最早>生效时间最早>创建时间最早。
有效期
套餐包的额度为购买日起，有效期内的可使用的tokens量。
账单查询
您可以在费用中心的页面，查看已购买的资源包列表及其用量（1 token = 1抵扣点数）。

您也可以在左侧导航栏，选择“管理与统计 > 资源包管理”，进入费用中心的资源包页面。
退订声明
已购买套餐包不支持退订，请您购买前请确认。
用户须知
- 用户不得将华为云产品和服务用于任何违法违规或侵犯第三方合法权益的用途，如因此产生的法律责任，由用户自行承担责任，与华为云无关。
- 用户应遵守《》相关协议及页面使用规则（包括但不限于产品服务等级协议、使用规范、产品服务条款等）。

计费示例

以下案例中出现的费用价格仅供参考，实际价格请参见maas控制台价格详情。

假设用户调用deepseek r1的预置服务，输入tokens数300万，输出tokens数700万，总费用 = 300万 ÷ 1000 * 0.004 700万 ÷ 1000 * 0.016 = 124元。

父主题：在线推理模型服务价格

上一篇：在线推理模型服务价格

下一篇：视频生成模型

意见反馈

文档内容是否对您有帮助？

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨