配置数据归档任务¶
EnOS支持对来自实时通道的设备采集数据或经流数据处理服务之后的实时数据、来自离线通道的数据、实时告警记录、以及存储在TSDB中的历史数据进行归档,提供灵活的存储配置方式,降低数据存储的成本。
前提条件¶
- 已被授权数据归档模块访问权限
- OU已申请数据归档计算资源
新建数据归档任务¶
对数据进行归档存储,需为资产模型创建归档任务。
登录 EnOS 管理控制台,在 通用资源 下,选择 数据归档。
如OU尚未申请数据归档资源,前往 资源管理 > 公共服务 页面申请。
点击 新建任务,选择待归档数据的数据源:
点击 确定,进入归档任务详细配置页。
注解
单个组织内最多可创建10条数据归档任务。
存储配置¶
填写存储归档数据的详细配置信息,包括选择存储资源、设置存储文件属性等。
选择 资源类型,指定同步归档文件的目标存储系统(支持HDFS和BLOB)。
输入归档数据在存储系统中的 存储路径,路径必须以”/”开始和结尾,并选择存储路径根目录的时间分区格式。对时间分区格式的详细介绍,参见 存储路径分区参数。
选择按事件时间或系统时间生成目录,对按不同时间生成目录的详细介绍,参见 数据归档逻辑。
注解
对于离线消息通道和实时告警记录归档任务,仅支持选择按事件时间生成目录。
输入归档 文件名称,支持英文大小写字母、数字、和中横线,并且不能超过50个字符。文件生成时,系统将自动在文件名后加上”_UTC”时间戳后缀。若选择按事件时间生成目录,则时间戳后缀为数据的事件时间对应的UTC+0时间;若选择按系统时间生成目录,则时间戳后缀为系统时间对应的UTC+0时间;
选择 文件类型,目前支持TEXTFILE格式(.csv)。
选择归档文件 编码格式,默认格式为UTF-8。
选择 列分隔符,默认为逗号。
选择归档文件 压缩格式,默认为非压缩。可选择将归档文件压缩为 GZIP 格式。
注解
若归档任务的目标存储为BLOB时,归档文件的 content type 如下:
- 若选择文件压缩(.gzip),则归档文件的 content type 为 application/octet-stream。 - 若选择文件非压缩(.csv),则归档文件的 content type 为 application/csv。
选择归档文件 大小上限(文件压缩前的大小限制)。如果文件超出上限,系统将对文件进行切分存储。切分后的文件命名规则为
filename_UTC_n
,n
为6位随机字符串。注解
数据归档任务一旦提交,文件类型、编码格式、列分隔符、压缩格式不可再修改。
归档配置¶
选择数据归档任务的 归档周期,若被归档数据处于同一时间窗口内,将被写入同一个文件,然后按文件大小上限进行切分。目前支持数据归档任务以1小时、12小时、24小时为周期归档数据。
选择较长的归档周期,可以有效减少因数据延迟产生的小文件数量。设置不同的归档周期,归档任务的计划开始时间不同,处理的数据区间也不同。每个归档周期,对应的归档数据范围,表示系统时间处于 “前一个归档周期的计划开始时间” 至 “当前归档周期的计划开始时间” 之间的数据。数据归档策略提交之后,归档周期不可再修改。
每个归档周期选项的计划开始时间,以及归档数据的范围,参见 归档周期说明。