智能任务流故障排除¶
本文用于识别并解决使用智能任务流过程中的一些问题。
运行 MySQL Writer 算子时出现错误信息:”Duplicate Key Entry”¶
MySQL Writer 算子运行失败,日志文件中出现以下错误信息: Duplicate Key Entry
。
故障原因¶
自动更新当前时间导致 record_time
参数值重复。
解决方案¶
在算子的输入参数中添加 record_time = record_time
,确保 record time 参数值恒定。
Python 算子中 “pip install” 命令运行失败¶
Python 算子运行失败,日志文件中出现 pip install
命令运行失败的错误信息。
故障原因¶
环境依赖缺失导致报错。
解决方案¶
方案 1 :检查网络连接状况后重试。
方案 2 :使用自定义算子。如需了解更多关于自定义算子的信息,可参考 自定义算子。
运行 Python 算子失败并出现错误信息:Request entity too large:limit is 3145728¶
Python 算子运行失败,日志文件出现以下错误信息: request entity too large:limit is 3145728
。
故障原因¶
以 list 或 string 类型引用其他算子的输出参数作为此 Python 算子的输入参数,但参数数据的大小超过 3M。
解决方案¶
方案 1:以 directory 或 file 类型引用该参数。
方案 2: 使用外部存储,例如 S3 或 MySQL。
运行 Model 算子失败并出现错误信息:Error:root:input format parse failed¶
Model 算子运行失败,日志文件出现以下错误信息: Error:root:input format parse failed
。
故障原因¶
该算子的 input_format
参数中未声明 range
信息。
解决方案¶
配置 input_format
参数的 range
信息,例如:
"range": [
0,
440
],
运行 Single Model Deployment 算子失败并出现错误信息:Error:root:miss parameterrange¶
Single Model Deployment 算子运行失败,运行日志中出现以下错误信息:Error:root:miss parameterrange
。
故障原因¶
output_format 或 input_format 的参数值不是 Json 格式。
Solution¶
确保 output_format 和 input_format 的参数值为 Json 格式,例如:
[
{
"annotations": "",
"defaultValue": 300,
"dtype": "int",
"ftype": "continuous",
"name": "i.set",
"range": [
0,
440
],
"repeat": 0
},
]
运行 Model Instance 算子失败并出现错误信息:Modeldeployments.eap.envision.com "xxx-deployment" not found¶
Model Instance 算子运行失败,运行日志中出现以下错误信息:modeldeployments.eap.envision.com \"xxx-deployment\" not found
。
故障原因¶
资源池选择错误导致报错。
解决方案¶
选择以 mmc-
开头的资源池作为 resource_pool
的参数值。正确的资源池名称如下所示:
mmc-o16062946385871018
运行算子时出现错误信息:Failed with exit code 137¶
算子运行失败,运行日志中出现以下错误信息:failed with exit code 137
。
故障原因¶
物理节点内存不足导致报错。
解决方案¶
在智能任务流画布中,打开 任务流设置 > 高级配置。
增加 内存请求值 和 内存上限值的参数值。
运行任务流画布时出现错误信息:Create unit [{operator1}, {operator2}, {operator3}] failed. Create container {container1} failed. Failed to find the operator item param info¶
运行任务流画布运行失败,日志文件中出现以下错误信息:Create unit [{operator1}, {operator2}, {operator3}] failed. Create container {container1} failed. Failed to find the operator item param info
、。
其中:
{Operator1}
,{operator2}
, and{operator3}
指代任务流画布中的算子。{Container1}
指代运行出错的任务流画布。
故障原因¶
引用了不存在的参数作为画布中算子的输入参数。
解决方案¶
检查并修改错误信息中算子的输入参数,确保引用了正确的参数。