智能任务流故障排除


本文用于识别并解决使用智能任务流过程中的一些问题。

运行 MySQL Writer 算子时报错:”Duplicate Key Entry”


MySQL Writer 算子运行失败,日志文件中出现以下错误信息: Duplicate Key Entry

故障原因

自动更新当前时间导致 record time 的参数值重复。

解决方案

在算子的输入参数中添加 record_time = record_time,确保 record time 参数值恒定。

Python 算子中 “pip install” 命令运行失败


Python 算子运行失败,日志文件中出现 pip install 命令运行失败的报错。

故障原因

环境依赖缺失导致报错。

解决方案

  • 方案 1 :检查网络连接状况后重试。

  • 方案 2 :使用自定义算子。如需了解更多关于自定义算子的信息,可参考 自定义算子

运行 Python 算子时报错:Request entity too large:limit is 3145728


Python 算子运行失败,日志文件出现以下错误信息: request entity too large:limit is 3145728

故障原因

以 list 或 string 类型引用其他算子的输出参数作为此 Python 算子的输入参数,但参数数据的大小超过 3M。

解决方案

  • 方案 1:以 directory 或 file 类型引用该参数。

  • Solution 2: 使用外部存储,例如 S3 或 MySQL。

运行 Model 算子时报错:Error:root:input format parse failed


Model 算子运行失败,日志文件出现以下错误信息: Error:root:input format parse failed

故障原因

该算子的 input_format 参数中未声明 range 信息。

解决方案

配置 input_format参数的 range 信息,例如:

"range": [
        0,
        440
    ],

运行 Single Model Deployment 算子时报错:Error:root:miss parameterrange


Single Model Deployment 算子运行失败,运行日志中出现以下错误信息:Error:root:miss parameterrange

故障原因

output_format 或 input_format 的参数值不是 json 格式。

Solution

确保 output_format 和 input_format 的参数值为 Json 格式,例如:

[
    {
      "annotations": "",
      "defaultValue": 300,
      "dtype": "int",
      "ftype": "continuous",
      "name": "i.set",
      "range": [
        0,
        440
      ],
      "repeat": 0
    },
  ]

运行 Model Instance 算子时报错:Modeldeployments.eap.envision.com "xxx-deployment" not found


Model Instance 算子运行失败,运行日志中出现以下错误信息:modeldeployments.eap.envision.com \"xxx-deployment\" not found

故障原因

资源池选择错误导致报错。

解决方案

选择以 mmc- 开头的资源池作为 resource_pool 的参数值。正确的资源池名称如下所示:

mmc-o16062946385871018

运行算子时报错:Failed with exit code 137


算子运行失败,运行日志中出现以下错误信息:failed with exit code 137

故障原因

物理节点内存不足导致报错。

解决方案

  1. 在智能任务流画布中,打开 任务流设置 > 高级配置

  2. 增加 内存请求值内存上限值的参数值。

运行任务流画布时报错:Create unit [{operator1}, {operator2}, {operator3}] failed. Create container {container1} failed. Failed to find the operator item param info


运行任务流画布运行失败,日志文件中出现以下错误信息:Create unit [{operator1}, {operator2}, {operator3}] failed. Create container {container1} failed. Failed to find the operator item param info、。

其中:


  • {Operator1}, {operator2}, and {operator3} 指代任务流画布中的算子。

  • {Container1} 指代运行出错的任务流画布。

故障原因

引用了不存在的参数作为画布中算子的输入参数。

解决方案

检查并修改错误信息中算子的输入参数,确保引用了正确的参数。