创建知识数据集-j9九游会登录
功能介绍
该接口用于创建知识数据集,可将原始文档按照一定规则进行处理,用于后续生成知识库。
调用方法
请参见。
uri
post https://aiae.appstage.myhuaweicloud.com/v1/knowledge-datasets
|
参数 |
是否必选 |
参数类型 |
描述 |
|---|---|---|---|
|
data_set |
是 |
string |
参数解释: 创建知识数据集请求体,参数结构请参见“附录 > 知识数据集请求参数说明”。 约束限制: 不涉及。 取值范围: 不涉及。 默认取值: 不涉及。 |
|
file |
否 |
array of strings |
参数解释: 上传的文件。 取值范围: 数量不超过10个。 默认取值: 不涉及。 约束限制:
|
请求参数
|
参数 |
是否必选 |
参数类型 |
描述 |
|---|---|---|---|
|
authorization |
是 |
string |
参数解释: 鉴权信息。获取平台api key,并为api key添加前缀bearer,得到标准鉴权信息,例如bearer sk-74e4157***。api key获取方法请参见创建api key。 约束限制: 不涉及。 取值范围: 不涉及。 默认取值: 不涉及。 |
响应参数
状态码:200
|
参数 |
参数类型 |
描述 |
|---|---|---|
|
data |
string |
参数解释: 正常返回的结果。 取值范围: 不涉及。 |
状态码:400
|
参数 |
参数类型 |
描述 |
|---|---|---|
|
error_code |
string |
参数解释: 异常错误码。 取值范围: 不涉及。 |
|
error_msg |
string |
参数解释: 异常错误信息。 取值范围: 不涉及。 |
请求示例
{
"name" : "测试",
"description" : "测试",
"data_type" : "text",
"tags" : [ "对话问答", "文案生成" ],
"ingestion_config" : {
"data_source" : "file_upload",
"file_types" : [ "txt" ]
},
"schedule_config" : {
"schedule_type" : "once"
},
"preprocess_config" : {
"cleaning_methods" : [ "invisible" ],
"pdf_preprocess_type" : "no_preprocess"
},
"chunk_config" : {
"slicing_configs" : {
"txt" : {
"slicing_method" : "autoslicing"
}
}
},
"extraction_config" : {
"extraction_example" : "今天天气如何?答:还不错哦。",
"extraction_mode" : "rule_extraction",
"rule_extraction_configs" : [ {
"extraction_rule" : "separator",
"field_name" : "question",
"separator_extraction" : {
"contain_separator" : false,
"extraction_code" : 1,
"separator" : "?"
}
}, {
"extraction_rule" : "template",
"field_name" : "answer",
"template_extraction" : {
"contain_end" : true,
"contain_start" : false,
"end_with" : "。",
"extraction_code" : 1,
"start_with" : "答"
}
} ]
},
"index_config" : {
"description" : "索引配置",
"long_text_solution" : "truncate_mode",
"name" : "索引配置",
"rag_type" : "vector_rag",
"retrieval_configs" : [ {
"category" : "full_chunk",
"name" : "chunk",
"retrieval_return" : false,
"text_filter" : false,
"vector_retrieval" : false
}, {
"category" : "chunk_fragment",
"name" : "question",
"retrieval_return" : true,
"text_filter" : true,
"vector_retrieval" : true
}, {
"category" : "chunk_fragment",
"name" : "answer",
"retrieval_return" : true,
"text_filter" : true,
"vector_retrieval" : false
} ],
"vector_model_service_key" : "gpt-4"
}
}
响应示例
状态码:200
操作成功,返回数据集id。
{
"data" : "3f28e62-xxxxxxxx-a15be0d638a2"
}
状态码:400
请求错误。
{
"error_code" : "aiae.40001001",
"error_msg" : "参数xxxx不合法。"
}
状态码
|
状态码 |
描述 |
|---|---|
|
200 |
操作成功,返回数据集id。 |
|
400 |
请求错误。 |
错误码
请参见错误码。
相关文档
意见反馈
文档内容是否对您有帮助?
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨