查看应用指标统计信息-j9九游会登录
应用指标统计界面提供自动化数据统计功能,实时收集应用的性能指标和资源使用情况。这使运维人员能够快速识别性能瓶颈,从而提升系统的稳定性和可靠性,并实现资源的高效利用和成本优化。
查看应用指标统计信息
- 登录,在左侧导航栏“个人空间”区域,选择目标空间。
- 在左侧导航栏中选择“运营运维 > 观测”,在“应用指标统计”页签中可以查看智能体和工作流上报的指标信息。
图1 应用指标统计
应用指标统计信息说明
应用指标统计界面包含以下信息,如图1所示。
|
参数 |
说明 |
示例 |
|---|---|---|
|
使用次数 |
所选应用中上报的root span的总数。 |
473次 |
|
模型调用错误率 |
model span的状态错误率,即错误状态的model span数量占总model span数量的比例。 |
0.00% |
|
span错误率 |
span的状态错误率,即错误状态的span数量占总span数量的比例。 |
1.56% |
|
模型调用平均耗时 |
模型调用的平均耗时,即model span的总耗时除以model span的总数量。 |
12.96s |
|
模型tokens消耗 |
model span数据里输入和输出所消耗tokens的总量。 |
517.67千tokens |
|
tokens消耗 |
tokens消耗分为以下两种类型:
在界面中可以选择以下单位显示tokens消耗:个tokens、千tokens、百万tokens。 |
input tokens:369.71千tokens output tokens:147.96千tokens |
|
trace上报量 |
显示上报的root span的总数,反映系统中请求的总体规模和趋势。 |
443条 |
|
模型调用平均耗时 |
显示模型调用的平均耗时,反映模型调用的性能和稳定性。 |
12.96s |
|
链路整体耗时 |
显示root span的耗时,反映整个请求的处理时长。 在界面中可以选择以下单位显示链路整体耗时消耗:avg、max、min、p50、p90、p99。 avg(average,平均值):表示一组数据的平均值,即所有数据值相加后除以数据的总数。 max(maximum,最大值):表示一组数据中的最大值。 min(minimum,最小值):表示一组数据中的最小值。 p50(50th percentile,第50百分位数,也称为中位数):表示一组数据按从小到大排序后,位于中间位置的数值,有50%的数据小于或等于它,50%的数据大于它的数值。 p90(90th percentile,第90百分位数):表示一组数据按从小到大排序后,有 90% 的数据小于或等于它,10% 的数据大于它的数值。 p99(99th percentile,第99百分位数):表示一组数据按从小到大排序后,有 99% 的数据小于等于它,1% 的数据大于等于它的数值。 |
9.12s |
|
服务请求成功率 |
显示成功状态的root span数量占总root span数量的占比,反映服务的整体可用性和稳定性。 |
100% |
|
模型请求成功率 |
大模型调用过程中,成功状态的model span数量占总model span数量的占比,反映模型调用的成功率和稳定性。 |
100% |
使用过滤器筛选信息
应用指标统计界面支持多维度灵活筛选,帮助运维人员快速定位和分析目标数据。
|
过滤条件 |
说明 |
|---|---|
|
数据来源 |
按照数据来源过滤数据。支持以下三种分类:
|
|
agent应用 |
支持在选择了数据来源之后,可以在筛选条件下进一步选择不同的应用。 |
|
时间 |
支持根据上报的时间筛选数据记录。 |
相关文档
意见反馈
文档内容是否对您有帮助?
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨