基本概念-j9九游会登录

agent核心概念

术语概念	解释
智能体（agent）	一个能够感知环境、进行推理、决策并采取行动以实现特定目标的智能系统。通常以大语言模型（llm）为核心大脑，具备自主性。
大语言模型（llm）	智能体的“大脑”。负责处理信息、逻辑推理、任务规划和生成响应。智能体的智力水平很大程度上取决于其背后的大语言模型能力。
规划 (planning)	智能体将复杂目标拆解为可管理的子任务或步骤的能力。包括任务分解和路径规划。
记忆 (memory)	智能体存储和检索信息的能力。分为短期记忆（当前的上下文窗口）和长期记忆（通常存储在向量数据库中，用于持久化知识）。
工具使用 (tool use / tooling)	智能体调用外部api、软件或硬件来执行操作的能力（如搜索网页、运行代码、查询数据库）。
行动 (action)	智能体在规划后执行的具体操作，例如发送邮件、修改文件或调用一个函数。
推理与行动框架 (react / reason act)	智能体提示框架，要求模型在执行动作前先生成推理轨迹（即“先思考，再行动”），并在行动后观察结果，形成闭环。
思维链 (chain of thought - cot)	思维链是一种提示词急速，可以引导模型一步步展示其推理过程，有助于提高处理复杂逻辑任务的准确性，是智能体进行规划的基础。
函数调用 (function calling)	函数调用是智能体的一种运行机制，允许大模型输出结构化的数据（如json），以触发预定义的代码函数或api。通过函数调用实现“工具使用”。
检索增强生成 (retrieval-augmented generation - rag)	允许智能体在生成回答之前，先从外部知识库检索相关信息。这相当于给智能体配备了一个“图书馆”供随时查阅。
向量数据库 (vector database)	用于存储文本嵌入（embedding）的数据库，是智能体实现长期记忆的核心组件，支持通过语义相似度快速检索信息。
嵌入 (embedding)	嵌入是将文本、图片等数据转化为数值向量的过程。智能体利用它来理解不同数据之间的语义关联，用于记忆检索。
感知 (perception)	感知是智能体接收外部信息的过程，可以是文本输入，也可以是多模态输入（如视觉、听觉），使其能理解当前环境状态。
反思/自修正 (reflection / self-correction)	智能体在执行任务后，检查自己的输出或行为是否符合预期，并进行自我批评和修正的能力，以提高最终结果的质量。
多智能体系统 (multi-agent system - mas)	多智能体由多个拥有不同角色、技能和权限的智能体组成的协作网络。它们像团队一样分工合作（如一个负责写代码，一个负责测试）。
编排者/调度器 (orchestrator)	在多智能体系统中，负责理解用户意图、分发任务给子智能体、协调流程并汇总结果的“管理者”角色。
标准作业程序 (standard operating procedure - sop)	在智能体工作流中预定义的固定流程或规范。通过sop，可以让智能体遵循人类的最佳实践来执行任务，提高稳定性。
人设/角色 (persona / role)	通过提示词赋予智能体的特定身份（如“资深 python 工程师”），使其行为、语气和专业知识聚焦于特定领域。
人机协同 (human-in-the-loop - hitl)	智能体在关键决策点需要人类的确认或反馈才能继续执行，这种运作形式可以确保高风险操作的安全性。
环境 (environment)	智能体所处并与之交互的数字或物理空间（如操作系统、浏览器、游戏世界）。
零样本/少样本学习 (zero-shot / few-shot learning)	指智能体在没有示例（zero-shot）或仅有少量示例（few-shot）的情况下完成任务的能力，常用于测试智能体的泛化能力。
幻觉 (hallucination)	大模型生成看似合理但实际上错误或不存在的信息的现象。在开发中需要通过rag或工具验证来抑制幻觉。
上下文窗口 (context window)	大模型一次能处理的最大token数量。限制了智能体的短期记忆容量（即它能同时“看到”多少信息）。
任务分解 (task decomposition)	将一个模糊的高层指令（如“写一个贪吃蛇游戏”）拆解为一系列具体的、可执行的小步骤（如“生成界面”、“编写逻辑”、“调试代码”）。

工作流核心概念

术语概念	解释
画布/工作流编排页面 (canvas)	可视化编排工作流的界面。用户通过拖拽节点、连线来定义业务流程。
节点 (node / step / block)	工作流中的基本执行单元。一个节点代表一个动作，例如“发送邮件”、“调用大模型”、“运行python代码”。
连线 (edge / connector)	连接两个节点的线，代表执行的顺序（从a到b），也代表数据流动的方向。
结束/终点 (end / terminate)	工作流运行结束的节点。通常用于输出最终结果（如返回给用户的回答）或标记流程状态为“完成”。
变量 (variable)	变量用于在工作流的节点之间进行信息存储和传递数据。输入变量：用户填写的表单信息。输出变量：某个节点处理完产生的结果。
全局变量 / 上下文 (global variable / context)	在整个工作流的生命周期内都有效的变量。任何节点都可以读取或修改它（例如：user_id，conversation_history）。
参数映射 / 引用 (reference / mapping)	将上一个节点的输出（output）填入下一个节点的输入（input）的过程。例如：将“搜索节点”的结果，引用填入“大模型节点”的提示词中。
硬编码 (hardcoding)	在节点参数中直接使用固定的值，而不是引用变量。
分支 / 条件 (branch / conditional / if-else)	逻辑判断节点。根据变量的值决定走哪条路。例如：如果分数 > 60，则走“及格”路径；否则走“不及格”路径。
迭代 / 循环 (iterator / loop / for-each)	用于处理列表（list）数据的节点。循环会遍历列表中的每一项，重复执行相同的操作。例如：输入一个包含10个网址的列表，循环节点会运行10次“爬取网页”的操作。
并行分支 (parallel branch)	同时执行多条路径，互不等待。常用于提高效率，最后通常接一个“聚合”节点。
聚合 / 汇聚 (merge / join)	等待多个并行分支全部执行完毕后，将结果汇总，再继续执行后续步骤。

插件/mcp核心概念

术语概念	解释
插件 (plugin)	一种软件组件，允许智能体连接外部应用程序或数据源。它通常由api接口或函数代码构成，使模型能够理解并调用外部api能力（如查询天气、预订机票），或者执行预设好的代码功能。
工具 (tool)	在插件中，指模型可以调用的具体功能。与被动的数据资源不同，工具可以执行操作（如“运行代码”、“发送消息”）。模型经过推理后决定是否调用工具以及使用什么参数。
mcp 模型上下文协议 (model context protocol - mcp)	一个开放标准协议，旨在标准化大模型与外部数据/工具之间的连接。解决了不同大模型连接不同数据源时需要重复开发“适配器”的问题，被比作 "ai 时代的 usb 接口"。
清单文件 (manifest)	插件的“身份证”。通常是一个json文件（如 ai-plugin.json），包含插件的元数据（名称、描述、logo）、鉴权方式以及api定义文件的位置。模型通过阅读它来了解插件是干什么的。
函数调用 (function calling)	许多插件和mcp工具背后的底层机制。指大模型输出特定格式的json（而非自然语言），以触发编程函数或api请求的能力。
openapi 规范 (openapi specification)	用于描述restful api的标准格式（通常是yaml或json）。在插件开发中，它告诉模型这个api有哪些域名、需要什么参数、返回什么数据结构。
描述模式 (schema)	用于定义数据结构的规范（如json schema）。在插件中，它用来告诉模型工具需要的输入参数必须是“数字”还是“字符串”，以及是否“必填”。
mcp 主机 (mcp host)	运行ai模型的应用程序。它是发起请求的一方，负责管理与各种mcp服务器的连接。
mcp 客户端 (mcp client)	负责与mcp服务器建立连接。它将请求转换为mcp协议消息发送给服务器。
mcp 服务器 (mcp server)	提供数据或能力的独立服务程序。它通过mcp协议向host暴露自己的资源、工具和提示词。
传输层 (transport)	mcp用于在客户端和服务器之间发送消息的通信机制。主要有两种标准：stdio（标准输入输出，用于本地进程通信）和sse（server-sent events，用于远程http通信）。
npx (node package execute)	node.js生态的mcp服务器运行工具。它是node.js的包执行器。mcp中许多官方或社区的mcp服务是用 typescript/javascript 写的。
uvx (uv execute)	python生态的mcp服务器运行工具。它是高性能python包管理器 uv 的一部分。mcp中大量mcp服务是用python写的。
stdio (standard input/output)	标准输入输出，是npx/uvx 运行mcp服务时的默认通信管道。当通过npx或uvx启动mcp服务时，它们并不通过网络端口通信，而是直接通过命令行窗口的“输入”和“输出”文本流来交换json消息。这是本地mcp最常见的连接方式。
uv	uv是一个极速的python包管理器。mcp官方推荐使用它来管理python环境和运行uvx命令。
pypi/npm	mcp服务器的分发仓库。 mcp协议本身不提供“应用商店”。开发者将写好的服务发布到npm（js/ts版）或 pypi（python版）。用户通过npx或uvx来拉取这些资源。
environment variables (env)	环境变量。在使用npx或uvx运行mcp服务时，通常需要传递敏感信息（如api key）。在mcp客户端配置中，通常有一个env字段，用于将这些密钥安全地传递给由npx/uvx启动的进程。

知识库核心概念

术语概念	解释
检索增强生成 (rag - retrieval-augmented generation)	指在大模型生成回答之前，先从外部数据库检索相关信息，并将其作为上下文输入给模型。这解决了大模型知识滞后和幻觉问题。
向量数据库 (vector database)	知识库的“物理载体”，是一种专门存储高维向量数据的数据库。它不存文本本身（或仅存副本），核心存的是文本的“语义坐标”，支持通过语义相似度快速找回信息。
倒排索引 (inverted index)	传统搜索引擎（如elasticsearch）的核心技术。通过关键词（keyword）映射文档位置。在agent中，常与向量检索结合使用，以弥补语义检索对专有名词（如产品型号）匹配不准的问题。
混合搜索 (hybrid search)	同时使用关键词搜索（精确匹配）和向量搜索（语义匹配），并通过算法合并结果。这是目前企业级知识库的标准配置。
多路召回 (multi-stage retrieval)	指通过多种策略（如向量、关键词）分别检索信息，汇聚成一个候选池，再进行筛选的过程。
切片 / 分块 (chunking)	将长文档（如pdf、wiki）切分成小的文本块（chunk）的过程。切片策略（按字符数、按段落、按语义）直接决定了检索的精准度。切得太碎丢失上下文，切得太大包含噪音。
嵌入 (embedding)	知识库的核心“翻译”过程。将文本块转化为一串数字向量（vector），使其能被计算机进行数学计算。意思相近的句子，在向量空间距离更近。
重排序 (re-ranking)	检索优化的“精修”环节。在向量数据库粗排召回多个结果后，使用一个更精准的重排序模型对这些结果进行打分，最终只选出质量最高的搜索结果传递给大模型。

上一篇：与其他服务的关系

意见反馈

文档内容是否对您有帮助？

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

基本概念-j9九游会登录

agent核心概念

工作流核心概念

插件/mcp核心概念

知识库核心概念

相关文档

意见反馈

文档内容是否对您有帮助？