更新时间:2026-02-11 gmt 08:00

基本概念-j9九游会登录

agent核心概念

术语概念

解释

智能体(agent)

一个能够感知环境、进行推理、决策并采取行动以实现特定目标的智能系统。通常以大语言模型(llm)为核心大脑,具备自主性。

大语言模型(llm)

智能体的“大脑”。负责处理信息、逻辑推理、任务规划和生成响应。智能体的智力水平很大程度上取决于其背后的大语言模型能力。

规划 (planning)

智能体将复杂目标拆解为可管理的子任务或步骤的能力。包括任务分解和路径规划。

记忆 (memory)

智能体存储和检索信息的能力。分为短期记忆(当前的上下文窗口)和长期记忆(通常存储在向量数据库中,用于持久化知识)。

工具使用 (tool use / tooling)

智能体调用外部api、软件或硬件来执行操作的能力(如搜索网页、运行代码、查询数据库)。

行动 (action)

智能体在规划后执行的具体操作,例如发送邮件、修改文件或调用一个函数。

推理与行动框架 (react / reason act)

智能体提示框架,要求模型在执行动作前先生成推理轨迹(即“先思考,再行动”),并在行动后观察结果,形成闭环。

思维链 (chain of thought - cot)

思维链是一种提示词急速,可以引导模型一步步展示其推理过程,有助于提高处理复杂逻辑任务的准确性,是智能体进行规划的基础。

函数调用 (function calling)

函数调用是智能体的一种运行机制,允许大模型输出结构化的数据(如json),以触发预定义的代码函数或api。通过函数调用实现“工具使用”。

检索增强生成 (retrieval-augmented generation - rag)

允许智能体在生成回答之前,先从外部知识库检索相关信息。这相当于给智能体配备了一个“图书馆”供随时查阅。

向量数据库 (vector database)

用于存储文本嵌入(embedding)的数据库,是智能体实现长期记忆的核心组件,支持通过语义相似度快速检索信息。

嵌入 (embedding)

嵌入是将文本、图片等数据转化为数值向量的过程。智能体利用它来理解不同数据之间的语义关联,用于记忆检索。

感知 (perception)

感知是智能体接收外部信息的过程,可以是文本输入,也可以是多模态输入(如视觉、听觉),使其能理解当前环境状态。

反思/自修正 (reflection / self-correction)

智能体在执行任务后,检查自己的输出或行为是否符合预期,并进行自我批评和修正的能力,以提高最终结果的质量。

多智能体系统 (multi-agent system - mas)

多智能体由多个拥有不同角色、技能和权限的智能体组成的协作网络。它们像团队一样分工合作(如一个负责写代码,一个负责测试)。

编排者/调度器 (orchestrator)

在多智能体系统中,负责理解用户意图、分发任务给子智能体、协调流程并汇总结果的“管理者”角色。

标准作业程序 (standard operating procedure - sop)

在智能体工作流中预定义的固定流程或规范。通过sop,可以让智能体遵循人类的最佳实践来执行任务,提高稳定性。

人设/角色 (persona / role)

通过提示词赋予智能体的特定身份(如“资深 python 工程师”),使其行为、语气和专业知识聚焦于特定领域。

人机协同 (human-in-the-loop - hitl)

智能体在关键决策点需要人类的确认或反馈才能继续执行,这种运作形式可以确保高风险操作的安全性。

环境 (environment)

智能体所处并与之交互的数字或物理空间(如操作系统、浏览器、游戏世界)。

零样本/少样本学习 (zero-shot / few-shot learning)

指智能体在没有示例(zero-shot)或仅有少量示例(few-shot)的情况下完成任务的能力,常用于测试智能体的泛化能力。

幻觉 (hallucination)

大模型生成看似合理但实际上错误或不存在的信息的现象。在开发中需要通过rag或工具验证来抑制幻觉。

上下文窗口 (context window)

大模型一次能处理的最大token数量。限制了智能体的短期记忆容量(即它能同时“看到”多少信息)。

任务分解 (task decomposition)

将一个模糊的高层指令(如“写一个贪吃蛇游戏”)拆解为一系列具体的、可执行的小步骤(如“生成界面”、“编写逻辑”、“调试代码”)。

工作流核心概念

术语概念

解释

画布/工作流编排页面 (canvas)

可视化编排工作流的界面。用户通过拖拽节点、连线来定义业务流程。

节点 (node / step / block)

工作流中的基本执行单元。一个节点代表一个动作,例如“发送邮件”、“调用大模型”、“运行python代码”。

连线 (edge / connector)

连接两个节点的线,代表执行的顺序(从a到b),也代表数据流动的方向。

结束/终点 (end / terminate)

工作流运行结束的节点。通常用于输出最终结果(如返回给用户的回答)或标记流程状态为“完成”。

变量 (variable)

变量用于在工作流的节点之间进行信息存储和传递数据。

输入变量:用户填写的表单信息。

输出变量:某个节点处理完产生的结果。

全局变量 / 上下文 (global variable / context)

在整个工作流的生命周期内都有效的变量。任何节点都可以读取或修改它(例如:user_id,conversation_history)。

参数映射 / 引用 (reference / mapping)

将上一个节点的输出(output)填入下一个节点的输入(input)的过程。例如:将“搜索节点”的结果,引用填入“大模型节点”的提示词中。

硬编码 (hardcoding)

在节点参数中直接使用固定的值,而不是引用变量。

分支 / 条件 (branch / conditional / if-else)

逻辑判断节点。根据变量的值决定走哪条路。

例如:如果分数 > 60,则走“及格”路径;否则走“不及格”路径。

迭代 / 循环 (iterator / loop / for-each)

用于处理列表(list)数据的节点。循环会遍历列表中的每一项,重复执行相同的操作。

例如:输入一个包含10个网址的列表,循环节点会运行10次“爬取网页”的操作。

并行分支 (parallel branch)

同时执行多条路径,互不等待。常用于提高效率,最后通常接一个“聚合”节点。

聚合 / 汇聚 (merge / join)

等待多个并行分支全部执行完毕后,将结果汇总,再继续执行后续步骤。

插件/mcp核心概念

术语概念

解释

插件 (plugin)

一种软件组件,允许智能体连接外部应用程序或数据源。它通常由api接口或函数代码构成,使模型能够理解并调用外部api能力(如查询天气、预订机票),或者执行预设好的代码功能。

工具 (tool)

在插件中,指模型可以调用的具体功能。与被动的数据资源不同,工具可以执行操作(如“运行代码”、“发送消息”)。模型经过推理后决定是否调用工具以及使用什么参数。

mcp 模型上下文协议 (model context protocol - mcp)

一个开放标准协议,旨在标准化大模型与外部数据/工具之间的连接。解决了不同大模型连接不同数据源时需要重复开发“适配器”的问题,被比作 "ai 时代的 usb 接口"。

清单文件 (manifest)

插件的“身份证”。通常是一个json文件(如 ai-plugin.json),包含插件的元数据(名称、描述、logo)、鉴权方式以及api定义文件的位置。模型通过阅读它来了解插件是干什么的。

函数调用 (function calling)

许多插件和mcp工具背后的底层机制。指大模型输出特定格式的json(而非自然语言),以触发编程函数或api请求的能力。

openapi 规范 (openapi specification)

用于描述restful api的标准格式(通常是yaml或json)。在插件开发中,它告诉模型这个api有哪些域名、需要什么参数、返回什么数据结构。

描述模式 (schema)

用于定义数据结构的规范(如json schema)。在插件中,它用来告诉模型工具需要的输入参数必须是“数字”还是“字符串”,以及是否“必填”。

mcp 主机 (mcp host)

运行ai模型的应用程序。它是发起请求的一方,负责管理与各种mcp服务器的连接。

mcp 客户端 (mcp client)

负责与mcp服务器建立连接。它将请求转换为mcp协议消息发送给服务器。

mcp 服务器 (mcp server)

提供数据或能力的独立服务程序。它通过mcp协议向host暴露自己的资源、工具和提示词。

传输层 (transport)

mcp用于在客户端和服务器之间发送消息的通信机制。主要有两种标准:stdio(标准输入输出,用于本地进程通信)和sse(server-sent events,用于远程http通信)。

npx (node package execute)

node.js生态的mcp服务器运行工具。

它是node.js的包执行器。mcp中许多官方或社区的mcp服务是用 typescript/javascript 写的。

uvx (uv execute)

python生态的mcp服务器运行工具。

它是高性能python包管理器 uv 的一部分。mcp中大量mcp服务是用python写的。

stdio (standard input/output)

标准输入输出,是npx/uvx 运行mcp服务时的默认通信管道。

当通过npx或uvx启动mcp服务时,它们并不通过网络端口通信,而是直接通过命令行窗口的“输入”和“输出”文本流来交换json消息。这是本地mcp最常见的连接方式。

uv

uv是一个极速的python包管理器。mcp官方推荐使用它来管理python环境和运行uvx命令。

pypi/npm

mcp服务器的分发仓库。

mcp协议本身不提供“应用商店”。开发者将写好的服务发布到npm(js/ts版)或 pypi(python版)。用户通过npx或uvx来拉取这些资源。

environment variables (env)

环境变量。

在使用npx或uvx运行mcp服务时,通常需要传递敏感信息(如api key)。在mcp客户端配置中,通常有一个env字段,用于将这些密钥安全地传递给由npx/uvx启动的进程。

知识库核心概念

术语概念

解释

检索增强生成 (rag - retrieval-augmented generation)

指在大模型生成回答之前,先从外部数据库检索相关信息,并将其作为上下文输入给模型。这解决了大模型知识滞后和幻觉问题。

向量数据库 (vector database)

知识库的“物理载体”,是一种专门存储高维向量数据的数据库。它不存文本本身(或仅存副本),核心存的是文本的“语义坐标”,支持通过语义相似度快速找回信息。

倒排索引 (inverted index)

传统搜索引擎(如elasticsearch)的核心技术。通过关键词(keyword)映射文档位置。在agent中,常与向量检索结合使用,以弥补语义检索对专有名词(如产品型号)匹配不准的问题。

混合搜索 (hybrid search)

同时使用关键词搜索(精确匹配)和向量搜索(语义匹配),并通过算法合并结果。这是目前企业级知识库的标准配置。

多路召回 (multi-stage retrieval)

指通过多种策略(如向量、关键词)分别检索信息,汇聚成一个候选池,再进行筛选的过程。

切片 / 分块 (chunking)

将长文档(如pdf、wiki)切分成小的文本块(chunk)的过程。切片策略(按字符数、按段落、按语义)直接决定了检索的精准度。切得太碎丢失上下文,切得太大包含噪音。

嵌入 (embedding)

知识库的核心“翻译”过程。将文本块转化为一串数字向量(vector),使其能被计算机进行数学计算。意思相近的句子,在向量空间距离更近。

重排序 (re-ranking)

检索优化的“精修”环节。在向量数据库粗排召回多个结果后,使用一个更精准的重排序模型对这些结果进行打分,最终只选出质量最高的搜索结果传递给大模型。

相关文档

网站地图