在模型广场查看预置模型-j9九游会登录
modelarts studio大模型即服务平台提供了丰富的开源大模型,在“模型广场”页面可以查看。模型详情页可以查看模型的详细介绍,根据这些信息选择合适的模型进行训练、推理,接入到企业j9九游会登录的解决方案中。
前提条件
已注册华为账号并开通华为云,详情请见注册华为账号并开通华为云。
访问模型广场
- 登录,在顶部导航栏中选择目标区域。
- 在左侧导航栏,单击“模型广场”。
- 在“模型广场”页面的“筛选”区域,按需选择模型类型、上下文长度、高级能力、模型系列和支持作业进行筛选,或者直接在搜索框输入模型名称进行搜索。
关于模型系列的介绍,请参见模型介绍。不同区域的筛选项可能不同,请以实际环境为准。下文以西南-贵阳一区域为例进行说明。
表1 模型筛选说明 筛选项
说明
模型类型
支持按照文本生成、图片生成、图像理解、向量模型和重排序类型进行筛选。
如果您同时选择了多个模型类型,页面会显示所选模型类型的合集。
上下文长度
支持按照128k、64k、32k、16k、≤8k进行筛选。
如果您同时选择了多个上下文长度,页面会显示所选上下文长度的模型合集。
高级能力
支持按照function call、深度思考进行筛选。
模型系列
支持按照deepseek、通义千问、chatglm、deepseek coder等进行筛选。不同地域支持的模型系列不同,详情请参见模型介绍。
如果您同时选择了多个模型,页面会显示所选模型系列的合集。
支持作业
支持按照部署、调优进行筛选。
如果您同时选择了多个支持作业,页面会显示所选支持作业的模型交集,例如选择部署和调优,页面会显示同时支持部署与调优的模型。
- 在“模型广场”页面的目标模型卡片,按需选择以下操作。
模型卡片显示了模型的简要信息,例如模型介绍、模型类型、支持的能力、上下文长度、更新时间等信息。
图1 模型卡片示例
- 鼠标悬浮于模型卡片,可以看到操作按钮,您可以按需单击“推理调用”、“在线体验”、“模型部署”等。
模型卡片上只显示该模型支持的操作。不同模型显示的操作可能不同,请以实际环境为准。
- 在线体验:
- 未开通模型服务:单击“在线体验”,会弹出“开通模型服务”对话框,请仔细查看相关信息,勾选“我已阅读并同意上述说明,及《modelarts studio 服务声明》”,单击“确认开通”,跳转至模型对应的体验页面进行在线体验。更多信息,请参见文本对话在线体验。
- 已开通模型服务:单击“在线体验”,会跳转至“文本对话”页面进行在线体验。
- 模型部署:单击“模型部署”,会跳转至“部署模型服务”页面。关于部署模型的具体操作,请参见部署模型服务。
- 推理调用:
- 未开通模型服务:单击“推理调用”,会弹出“调用说明”面板,在“开通模型服务”区域,仔细查看相关信息,勾选“我已阅读并同意上述说明,及《modelarts studio 服务声明》”,单击“立即开通”,参照“调用模型服务”信息,调用模型服务。更多信息,请参见maas api调用规范。
图2 调用说明
- 已开通模型服务:单击“推理调用”,会弹出“调用说明”面板,参照“调用模型服务”信息,调用模型服务。
- 未开通模型服务:单击“推理调用”,会弹出“调用说明”面板,在“开通模型服务”区域,仔细查看相关信息,勾选“我已阅读并同意上述说明,及《modelarts studio 服务声明》”,单击“立即开通”,参照“调用模型服务”信息,调用模型服务。更多信息,请参见maas api调用规范。
- 模型调优:单击“模型调优”,会跳转至“创建调优作业”页面。具体操作,请参见maas调优模型。
- 在线体验:
- 单击模型卡片,进入模型详情页面,可以查看模型的介绍、支持的版本、版本功能信息、备案信息等。不同的模型版本能力和操作可能不同,请以实际环境为准。
- 在模型详情页面右上角,您可以按需单击“模型部署”、“推理调用”等操作(部分操作支持选择版本),使用模型进行训练和推理。
- 在版本卡片右侧,您可以按需单击“部署”、“推理调用”等操作,使用模型进行训练和推理。
- 模型详情页面默认展示模型的最新版本卡片信息。如果模型有多个版本,历史版本卡片默认折叠,您可以在历史版本卡片名称左侧,单击
图标,查看历史版本的详细信息。
图3 查看历史版本信息
- 如果模型涉及计费,版本卡片中会显示推理定价的相关信息。您可以按需单击“切换百万tokens”或“切换千tokens”,调整推理价格的单位。
图4 推理定价
- 鼠标悬浮于模型卡片,可以看到操作按钮,您可以按需单击“推理调用”、“在线体验”、“模型部署”等。
模型介绍
下表列举了modelarts studio大模型即服务平台支持的模型清单。关于模型的详细信息请在“模型详情”页面查看。
|
模型系列 |
模型类型 |
应用场景 |
支持语言 |
支持地域 |
模型介绍 |
|
|---|---|---|---|---|---|---|
|
deepseek |
deepseek-r1 |
文本生成 |
对话问答、文本生成推理 |
中文、英文 |
西南-贵阳一、华北-乌兰察布一、华东二 |
深度求索(deepseek)自主研发的deepseek-r1模型,基于核心技术突破,具备超长上下文理解与高效推理能力,支持多模态交互及api集成,可驱动智能客服、数据分析等场景应用,以行业领先的性价比加速企业智能化升级。 |
|
deepseek-v3 |
文本生成 |
对话问答、翻译 |
中文、英文 |
西南-贵阳一、华北-乌兰察布一 |
deepseek-v3是一个强大的混合专家 (moe) 语言模型,开创了一种无辅助损失的负载平衡策略,并设置了多token预测训练目标以获得更强大的性能。 |
|
|
deepseek-v3.1 |
文本生成 |
对话问答 |
中文、英文 |
西南-贵阳一 |
deepseek-v3.1是一个同时支持思考模式和非思考模式的混合模型,效果与deepseek-r1-0528相当,但响应速度更快,且在工具使用方面进行了优化。 |
|
|
deepseek-v3.2 |
文本生成 |
对话问答 |
中文、英文 |
西南-贵阳一 |
deepseek-v3.2是一款在计算效率与出色推理及代理能力之间实现出色平衡的模型,整体性能达到了gpt-5的水平。 |
|
|
deepseek-v3.2-exp |
文本生成 |
对话问答 |
中文、英文 |
西南-贵阳一 |
v3.2-exp版本在v3.1-terminus的基础上引入了deepseek稀疏注意力机制,探索并验证了针对长文本训练和推理效率的优化方法。 |
|
|
deepseek-r1-distill-qwen-14b |
文本生成 |
对话问答、文本生成推理 |
中文、英文 |
西南-贵阳一、华北-乌兰察布一 |
通过deepseek-r1的输出,蒸馏了qwen-14b, 使得模型在多项能力上实现了对标openai o1-mini的效果。deepseek-r1在数学、代码和推理任务中实现了与openai-o1相当的性能。 |
|
|
deepseek-r1-distill-qwen-32b |
文本生成 |
对话问答、文本生成推理 |
中文、英文 |
西南-贵阳一、华北-乌兰察布一 |
通过deepseek-r1的输出,蒸馏了qwen-32b, 使得模型在多项能力上实现了对标openai o1-mini的效果。deepseek-r1在数学、代码和推理任务中实现了与openai-o1相当的性能。 |
|
|
chatglm |
glm-4 |
文本生成 |
对话问答、长文本推理、代码生成 |
中文、英文 |
西南-贵阳一、华东二 |
glm-4-9b是智谱ai推出的最新一代预训练模型glm-4系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中,glm-4-9b及其人类偏好对齐的版本glm-4-9b-chat均表现出较高的性能。 |
|
chatglm3 |
文本生成 |
对话问答、数学推理、代码生成 |
中文、英文 |
西南-贵阳一、华东二 |
chatglm3-6b是chatglm系列最新一代的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上,chatglm3-6b引入了更强大的基础模型和更完整的功能支持。 |
|
|
deepseek-coder |
文本生成 |
对话问答、文本推理 |
中文、英文 |
西南-贵阳一、华东二 |
deepseek coder由一系列代码语言模型组成,每个模型都从头开始在2t标记上进行训练,其中87%为代码,13%为英文和中文的自然语言。在编码能力方面,deepseek coder在多种编程语言和各种基准测试中均在开源代码模型中取得了较高性能。 |
|
|
yi |
文本生成 |
代码生成、数学推理、对话问答 |
中文、英文 |
西南-贵阳一、华东二 |
yi系列模型是01.ai从零训练的下一代开源大语言模型。yi系列模型是一个双语的语言模型,在3t多语言语料库上训练而成,是全球最强大的大语言模型之一。yi系列模型在语言认知、常识推理、阅读理解等方面表现优异。 |
|
|
通义千问 |
qwen |
文本生成 |
对话问答、智能创作、文本摘要、翻译、代码生成、数学推理 |
中文、英文 |
西南-贵阳一、华东二 |
通义千问-14b(qwen-14b)是阿里云研发的通义千问大模型系列的140亿参数规模的模型。通义千问-72b(qwen-72b)是阿里云研发的通义千问大模型系列的720亿参数规模的模型。通义千问-7b(qwen-7b)是阿里云研发的通义千问大模型系列的70亿参数规模的模型。 |
|
qwq |
文本生成 |
对话问答 |
英文 |
西南-贵阳一 |
qwq是通义千问系列的推理模型。与传统的指令调优模型相比,具有思维和推理能力的qwq在下游任务(尤其是疑难问题)中可以实现显著的性能提升。 |
|
|
qwen2 |
文本生成 |
多语言处理、数学推理、对话问答 |
中文、英文 |
西南-贵阳一、华东二 |
qwen2是阿里云研发的qwen系列的新的大型语言模型。对于qwen2,发布了许多基本语言模型和指令调整的语言模型,参数范围从5亿到720亿,包括专家混合模型,并在一系列针对语言理解,语言生成,多语言能力,编码,数学,推理等的基准测试中表现出对专有模型的竞争力。 |
|
|
qwen2-vl |
图像理解 |
图像理解、对话问答 |
中文、英文 |
西南-贵阳一、华东二 |
qwen2-vl是阿里云推出的具有70亿参数的大型视觉语言模型,专注于图像和文本的多模态理解和生成任务。 |
|
|
qwen2.5 |
文本生成 |
多语言处理、数学推理、对话问答 |
中文、英文 |
西南-贵阳一、华东二 |
qwen2.5是阿里云研发的qwen系列的新的大型语言模型。对于qwen2.5,发布了许多基本语言模型和指令调整的语言模型,参数范围从5亿到720亿。 |
|
|
qwen2.5-vl |
图像理解 |
图像理解、对话问答 |
中文、英文 |
西南-贵阳一 |
通义千问2.5-vl是阿里云通义千问团队开源的多模态视觉语言模型,具备强大的视觉和语言理解能力。 |
|
|
qwen3 |
文本生成 |
对话问答 |
中文、英文 |
西南-贵阳一 |
qwen3是qwen团队研发的大语言模型和大型多模态模型系列,在大规模语言和多模态数据上进行预训练,通过高质量的数据进行后期微调。 |
|
|
通义千问image |
qwen-image |
图像生成 |
文生图 |
中文、英文 |
西南-贵阳一 |
qwen-image的图像生成与编辑通用能力强劲,在文本渲染的场景下表现出色。 |
|
qwen-image-edit |
图像生成 |
文生图、图像编辑 |
中文、英文 |
西南-贵阳一 |
该模型是qwen-image的图像编辑版本,合入了其文本渲染能力,支持精准的图中文字修改。 |
|
|
通义万相2.2 |
wan2.2-t2v |
视频生成 |
文字生成视频 |
中文、英文 |
西南-贵阳一 |
该文生视频模型采用混合专家(moe)架构,视频合成更加稳定,支持了更多样化的风格场景。 |
|
wan2.2-i2v |
视频生成 |
图片生成视频 |
中文、英文 |
西南-贵阳一 |
wan2.2内置丰富的美学数据集,可轻松定制个性化的电影级画面。 |
|
|
kimi |
kimi-k2 |
文本生成 |
对话问答 |
中文、英文 |
西南-贵阳一 |
kimi k2是一款最先进的混合专家(moe)语言模型,拥有320亿激活参数和1万亿总参数。通过muon优化器训练,kimi k2在前沿知识、推理和编程任务上表现出色,同时在智能体能力方面进行了精心优化。 |
|
bge |
bge-m3 |
向量模型 |
文本向量化 |
中文、英文 |
西南-贵阳一 |
bge-m3以其在多语言、多功能和多粒度方面的灵活性而著称。它为超过100种工作语言的语义检索提供了统一的支持,可以同时完成三种常见的检索功能:密集检索、多向量检索和稀疏检索。此外,它还能够处理不同粒度的输入,从短句子到长达8192个token的长文档。 |
|
bge-reranker-v2-m3 |
重排序 |
检索结果再排序 |
中文、英文 |
西南-贵阳一 |
一个轻量级的交叉编码器模型,基于bge-m3模型开发,具有强大的多语言能力,易于部署,具有快速的推理能力。 |
|
|
longcat |
longcat-flash-chat |
文本生成 |
对话问答 |
中文 |
西南-贵阳一 |
一个强大的高效语言模型,总参数量为5600亿,采用创新的专家混合(moe)架构。该模型结合了动态计算机制,根据上下文需求激活186亿至313亿参数(平均约270 亿),优化了计算效率和性能。 |
模型分为量化模型和非量化模型,其中,量化模型又包括smoothquant-w8a8和awq-w4a16两种。
- awq-w4a16量化模型可以由非量化模型压缩后生成,也可以直接使用开源awq权重。
- smoothquant-w8a8量化模型只能由非量化模型压缩生成。
modelarts studio大模型即服务平台已预置非量化模型与awq-w4a16量化模型的模型模板。
- 非量化模型可以支持调优、部署等操作。
- 量化模型仅支持部署操作。当需要获取smoothquant-w8a8量化模型时,则可以通过对非量化模型进行模型压缩获得。
相关文档
- 关于api调用的参数说明,请参见maas api调用规范。
- 关于如何部署模型服务,请参见部署模型服务和调用已部署的模型服务。
- 关于如何调优模型,请参见maas调优模型。
- 关于在线体验的相关说明,请参见文本对话在线体验。
相关文档
意见反馈
文档内容是否对您有帮助?
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨