企业分析平台已知问题


该文章列出了企业分析平台个产品的已知问题及局限性。

智能集市

问题简述

发现时间

解决时间

由于平台底层镜像仓库资源和权限限制,对新建模型和模型版本的数量做了限制。用户当前OU最多可以管理30个模型,每个模型最多可以上架50个版本。超过上限后,在EAP中将不能创建新的模型和模型版本。需要联系运维人员通过管理员权限在镜像仓库中清理无效模型,释放资源空间后才能继续创建新的模型和模型版本。

2020/12/30

在测试模型时,系统默认测试文件的上限为 3.2Kb,测试资源默认为 1vCore 1GB。如果测试文件和测试资源超出上限,将导致测试不通过。

2020/12/30

模型指标监控最多可以创建10个自定监控报表,超过该数量将导致加载模型时出现明显延时。

2020/12/30

在 MLflow 保存模型时,路径中不支持含有“-”字符,否则在智能集市中上架版本时会报错。

2020/12/30

当前EAP版本不支持 Edge 端部署和边缘计算设备注册。

2020/12/30

当前EAP版本不支持协处理器功能。

2020/12/30

智能实验室

问题简述

发现时间

解决时间

如果OU对应的大数据平台账号为非标准账号(不满足 data_ouid 命名规则),且创建 Notebook 实例时选择了 “挂载Hadoop PVC”,可能会因为在PVC上找不到对应的 keytab 文件而无法正常启动实例。

2020/12/30

私有云环境不支持包安装。

2020/12/30

Notebook 实例选择底层 Azure 存储时,使用 git 异常。

2020/12/30

智能任务流

问题简述

发现时间

解决时间

当任务流运行实例数太多,例如超过上万个运行实例时,实验列表页显示会出现超时异常。如果遇到这类问题,可在 Notebook 中运行以下脚本 runs_cleanup.ipynb 清理。

2020/12/30

任务流中使用了 ParallelFor算子且该算子是整个任务流中最后一个算子时,如果配置了退出算子,运行实例 DAG 图会报内部错误。

2020/12/30

将普通算子拖至自定义算子对应目录下后,不可恢复到原目录。

2020/12/30

任务流中只能使用一个 Recursion 算子。

2020/12/30

资源配置

问题简述

发现时间

解决时间

由于安全管控的原因,当前仅允许管理员用户创建数据源连接而且仅创建者本人可以进行连通性测试、修改及删除操作。

2020/12/30

GitLab 数据源里如果配置了包含空格的项目名称,会报空指针异常。

2020/12/30

当前不支持 SSO 账号创建数据源连接。

2020/12/30

GitHub 数据源连接不支持私有仓库。

2020/12/30

其它

问题简述

发现时间

解决时间

对于升级类的部署,可能会由于安装部署原因导致原有的权限配置丢失,升级后需要重新检查权限。如发现权限丢失,需联系管理员用户添加权限。

2020/12/30