更新时间:2026-02-05 gmt 08:00
修改模型服务qps-j9九游会登录
流量限制qps是评估模型服务处理能力的关键指标,它指示系统在高并发场景下每秒能处理的请求量。这一指标直接关系到模型的响应速度和处理效率。不当的qps配置可能导致用户等待时间延长,影响满意度。因此,能够灵活调整模型的qps对于保障服务性能、优化用户体验、维持业务流畅及控制成本至关重要。
modelarts studio大模型即服务平台支持手动修改模型服务的实例流量限制qps,该操作不会影响部署服务的正常运行。
约束限制
仅当模型服务处于这几个状态下才能修改qps:运行中、告警。
修改qps
- 登录,在顶部导航栏中选择目标区域。
- 在左侧导航栏,选择。
- 在“在线推理”页面,单击“我的服务”页签,在目标模型服务右侧,单击操作列的“更多 > 设置qps”,在弹窗中修改数值,单击“提交”启动修改任务。
图1 修改qps
在“我的服务”页签,单击服务名称,进入服务详情页,可以查看修改后的qps是否生效。
相关文档
意见反馈
文档内容是否对您有帮助?
提交成功!非常感谢您的反馈,我们会继续努力做到更好!
您可在查看反馈及问题处理状态。
系统繁忙,请稍后重试
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨