Model Operators


ML生命周期管理提供以下几种与注册和部署机器学习模型的算子:

  • Model(模型注册)

  • Model Version Register(模型版本上架)

  • Model Test(模型测试)

  • Single Model Deployment(模型部署)

Model 算子

Model 算子用于新建模(类似智能集市中的模型注册功能)。

输入参数说明

参数

说明

category

模型类目,可选:

  • model-predictor:模型预测器

  • model-combiner:模型优选器

  • data-transform:数据预转换器

model_name

模型名称,支持小写字母、数字、短横线,不超过32个字符。

input_data_type

输入数据类型,可选:Text、Tabular、或 Image。

scope

模型应用范围,可选:private 或 public。

technique

模型技术归属,可选:

  • classify:分类

  • matching:拟合

  • cluster:聚类

  • other:其他

usecase

模型应用领域,可选:

  • Light field:风电

  • photovoltaic:光伏

  • stored energy:储能

  • factory:工程

  • city:城市

  • other:其他

publisher

模型创建人名称

input_format

以JSON格式的模型特征输入参数,参见示例。

output_format

以JSON格式的模型输出参数,参见示例。

interface

API 类型,默认值为 REST。

error_on_exist

指定在模型名称存在时,是否跳过不报错。当选为 false 时,不报错;当选为 true 时,如果待创建的模型名称已存在,直接报错。

input_format 示例

[
  {
       "name":"X-basic.hour",
       "dtype":"int",
       "ftype":"continuous",
       "range": [
           0,
           23
       ],
       "annotations":"",
       "repeat":null,
       "defaultValue":10
   },
    {
       "name":"X-basic.horizon",
       "dtype":"int",
       "ftype":"continuous",
       "range": [
           0,
           50
       ],
       "annotations":"",
       "repeat":null,
       "defaultValue":8
   }
]

output_format 示例

[
  {
    "name": "test",
    "dtype": "float",
    "ftype": "continuous",
    "range": [
      1,
      11
    ],
    "annotations": null,
    "repeat": 4,
    "defaultValue": 1
  }
]

输出参数说明

参数

说明

model_name_output

输出创建的模型名称,用于 Model Version Register 算子的输入。

Model Version Register 算子

Model Version Register 算子用于上架模型版本操作。

输入参数说明

参数

说明

input_data

模型版本参数输入,参见示例。

version_rule

模型版本名称规则,默认为time,根据当前时间戳进行版本命名。

architecture

运行模型版本的基础硬件,可选:x86 或 arm。

env_param

环境参数,参见示例。

framework

运行模型版本的计算框架,可选:sklearn、tensorflow、pytorch、h2o、spark、或 other。

language

开发模型版本的语言,可选:python3 或 java8。

publisher

模型版本创建人名称

minio_paths

minio路径,参见示例。

git_setting

Git源设置,参见示例。

builder_type

模型版本构建方式,可选:mlflow、docker、s2i、或 thirdparty。

thirdparty_url

自定义第三方导入模型构建文件的URL。

input_data 示例

{
  "data": {
    "names": [
      "AGE",
      "RACE",
      "DCAPS",
      "VOL"
    ],
    "ndarray": [
      [
        68,
        2,
        2,
        0
      ]
    ]
  }
}

env_param 示例

[
  {
    "name": "string",
    "value": "string",
    "annotations": "string"
  }
]

minio_paths 示例

[
  {
    "bucket": "xxx",
    "path": "xxx",
    "destination": "xxx"
  }
]

git_setting 示例

[
  {
    "url": "xxx",
    "user": "xxx",
    "token": "xxx",
    "branch": "xxx",
    "paths": [
      {
        "path": "xxx",
        "destination": "xxx"
      }
    ]
  }
]

输出参数说明

参数

说明

create_model_revision

已上架模型版本ID?

model_revision_name

已上架模型版本名称

model_builder_name

模型构建名称?

Model Test 算子

模型测试算子,用于对已上架的模型版本进行测试。

输入参数说明

参数

说明

input_data

输入模型测试数据

model_builder

模型构建名称?

输出参数说明

参数

说明

create_model_test

创建模型测试?

model_test_output

模型测试结果

Single Model Deployment 算子

模型部署算子,用于部署单个模型版本。

输入参数说明

参数

说明

model_revision

待部署的模型版本名称

resource_pool

部署模型版本的资源池

request_cpu

部署模型版本所需CPU最小值

request_memory

部署模型版本所需内存最小值

limit_cpu

部署模型版本所需CPU最大值

limit_memory

部署模型版本所需内存最大值

输出参数说明

参数

说明

craete_model_deployment

部署的模型版本