飞象网讯 2020年3月20日,在华为开发者大会HDC.Cloud 3月20号直播间,华为网络人工智能数据湖专家周尧,向开发者们正式发布了网络AI范畴10大揭露数据集,处理了网络AI开发缺少工业级数据的难题。
这10大数据集是华为从外场仿真数据和实验室模仿数据,通过解析管理、探究标示之后的,可以直接运用于网络范畴AI运用开发的数据集。分为“反常检测类”、“操控优化类”、和“毛病定界类”三大类:
■ 反常检测类
1) 性能目标反常检测数据集:时刻序列数据集,包括正样本和负样本,可运用于时序序列猜测等算法的练习和验证;样本量100W条,特征维度7维
2)性能目标改变监控测数据集:掩盖4种网络事务改变场景,包括改变成功场景和失利场景,失利场景数据有对应标签;样本量100W条,特征维度40维
3) 硬盘毛病检测数据集:掩盖日立,希捷合计16款硬盘类型,累积标示坏盘数量超2300块,运用于硬盘毛病猜测类问题剖析与研讨;样本量超230W条,特征维度超100维(掩盖厂商揭露SMART目标)
■ 操控优化类
4) 数据中心群控数据集:包括冷塔、冷机、泵等设备的供回水温度、压力、IT机房、冷站设备能耗100+维特征,可运用于数据中心水冷冷冻水场景制冷系统优化模型练习;样本量2W条,特征维度100维
5)数据中心PUE优化数据集:掩盖3种制冷场景、4种结尾空调、冷站群控、IT机房等设备能耗数据,根据冷却系统完结相关,运用于PUE优化、网络范畴操控类模型开发与研讨;样本量2W条,特征维度110维
■ 毛病定界类
6)无线接入毛病数据集:掩盖20种无线接入毛病类型,告警数据与工单数据相关相关,事务专家团队精确标示,可用于告警紧缩和根因定位类模型开发,样本量65w条,特征维度7维
7) 无线&IPRAN毛病数据集:告警数据根据无线接入和IPRAN的设备拓扑进行相关,利用工单数据完结根因告警标示,掩盖37种毛病类型,可用于告警紧缩和毛病定位,样本量700w+条,特征维度24维
8)无线&PTN毛病数据集:告警数据根据无线基站、动力环境、PTN等设备拓扑进行相关,利用工单数据完结根因告警标示,掩盖48种毛病类型,可用于告警紧缩和毛病定位,样本量100w+条,特征维度61维
9)无线&微波毛病数据集:告警数据根据无线基站、动力环境、微波等设备拓扑进行相关,利用工单数据完结根因告警标示,掩盖29种毛病类型,可用于告警紧缩和毛病定位,样本量100w+条,特征维度46维
10) PON光路毛病数据集:PON光路毛病场景数据,包括光纤曲折、连接器松动等毛病场景,掩盖光模块的电压,电流,接纳光功率,发送光功率等特征,样本量4w条,特征维度11维
数据和特征决议了机器学习的上限,华为发布网络范畴10大数据集,不光可以在必定程度上协助网络AI开发者削减90%的数据集准备时刻,更重要的是将会极大进步AI模型精度。现在已验证数据中心数据集助力AI模型达精确率到达89.77%,无线&IPRAN毛病数据集进步高档聚合率到95.4%,查准率到90%。
现在运用华为云账号登录华为云,挑选NAIE服务(途径:EI企业智能—智能体—网络智能体 NAIE),再从AI服务目录挑选数据集服务,即可进入数据集服务页面挑选所需揭露数据集(https:///products/dsi)。
2020年3月-4月华为开发者大会HDC.Cloud上,华为网络人工智能(NAIE)论坛将在线上直播,欢迎咱们重视大众号【网络人工智能园地】,点击菜单【HDC】,接入咱们的直播和专家线上讨论沟通!
线上直播链接:
https:///externals/hdc-2020?from=singlemessage&isappinstalled=0
编 辑:孙秀杰