1、产品概况
统一数据开发平台是数据中台能力的输出源头,是一组数据敏捷开发工具。数据开发平台符合高校业务及技术特点,遵从全数据链路管理理念,为数据治理和数据应用赋能。统一数据开发平台支持与中台各组件的无缝对接,实现由元数据智能驱动的“设计”即“开发”,“所见”即“所得”的敏捷开发模式。从本质上缩短数据价值体现周期,提升数据价值开发效率。
2、产品功能
图:统一数据开发平台功能模块
统一数据开发平台的主要功能包括:
- 数据集成
数据集成工具,是基于 Web 的简洁的集成平台,支持与统一身份认证对接,支持与数据治理平台的信息标准、元数据、数据血缘无缝对接,集成界面可以根据元数据设置显示中文语义描述,大大降低了数据集成工作的技术壁垒。支持各类常用大数据、关系型数据、API接口数据、文本数据、消息数据、非结构化数据的在线数据集成、交换。所有数据集成接口的开发定制均在web端通过拖拽实现,无需编码。它可以部署在校内私有云或内部数据中心,通过统一浏览器访问提供数据线上集成服务,使用人员无需在本地安装任何插件或客户端。
工具充分考虑高校行业的特性,支持数据复制建表,支持批量生成接口,支持与数据治理平台的双向同步,支持批量生成数据接口,支持人工智能自动构建数据字段映射等,大大降低了数据交换时间成本和运维成本。
图:数据集成工具
数据集成工具自动记录所有集成过程和数据操作,为数据治理平台和前台数据应用提供数据血缘和数据影响分析资料。
- 日志处理
日志处理工具是基于Hadoop、ElasticSearch、ClickHouse分布式存储的一站式日志处理工具,对不同日志源 (包括Windows系统, Unix/Linux系统, 应用程序, 路由器, 防火墙等)所产生的日志进行收集,实现日志的集中统一管理和存储,具有实时检索、查询分析、监控告警能力,并提供计算引擎(流式计算、批量计算)对数据做进一步的加工处理。
作为统一的日志处理中心,集中处理高校各类流式非结构化日志信息,这些数据可以来自任何能产生日志的地方,如网络探针采集的日志信息、设备日志信息、应用服务器产生的日志信息等,相关人员可以对这些日志进行检索与分析,从而更快的定位问题,并且持续挖掘数据价值。
图:日志处理工具
对于采集的日志,工具可以引用对应的数据解析模板,对数据进行二次计算,通过设置不同的预警规则,实现日志数据的价值输出,比如通过门禁日志、一卡通消费日志、流控日志来定位可能不在校的学生,通过日志来分析学生之间的关系、孤独指数等。
日志处理基于分布式系统完成,能够与关系型数据库自动关联实现实名化、业务化需求,日志可基于内存提供快速、实时的计算和结果输出能力,支持前端日志搜索、与数据分析组件无缝对接,支持自定义输出日志相关报表、图表,实现数据资产的统一可视化输出。
- 智能填报
智能填报工具建设将以“服务”为主旨,基于全域数据中心快速构建校内的表单数据填报服务,快速构建围绕对象(教师、学生、资产)的无源信息采集业务。通过“一张表”代替单个或多个审批事项的多个申请表格、材料,采用“数据自动填报+表单流转审批”的手段,实现各类事项及业务办理申请“一张表办成事”、“数据多跑路,师生少跑腿”的信息化服务模式。
图:智能填报工具
智能填报工具采用轻量级移动化体系进行系统构建,可以通过可视化的界面,快速定制各类通用表单(例如:健康打卡、在线调研、活动报名等)和业务报表(教职工职称申报、教师岗位聘任、年底工作考核等)。用户端可以快速实现报表的自助填报,解决重复填写已有信息的问题。能够与学校身份认证、微信企业号、WeLink号、钉钉等平台无缝对接,实现实名填报。
图:报表编辑
总之,报表工具的在线敏捷开发能力,能够为管理部门或业务主管提供一站式数据报表设计器,支撑报表持续性建设,为师生梳理提供自动化报表服务。报表提供历史填表版本管理,记录填报历史,完善填报周期,采用以数据为牵引、内容为导向的建设方式,做到数据不丢、不断。
- 数据分析
数据分析工具,提供各类在线数据可视化敏捷开发的能力,快速构建数据查询、数据分析主题,提供即席分析、数据大屏分析、数据分析报告输出等能力。在数据分析能力方面,能够满足手机、PAD等移动终端访问以及大屏可视化,可分类提供领导驾驶舱功能,为不同领导在其主管领域内的业务决策提供支持。支持各类主流、常用、定制化的数据可视化组件,包括气泡云图、桑基图、漏斗图、全国地图、南丁格尔玫瑰图、GIS 区域地图、矩形树图、饼图、 热点图、TOP条形图、关系图等多种生动丰富的展现形式,并支持图形一键切换。
图:数据分析工具
- 规则引擎
规则引擎是针对高校大数据应用特点,基于底层大数据分布式计算框架所自主研发的高校通用数据计算平台。通过规则引擎可以实现校级指标的快速计算,形成校级KPI库,针对个人数据提供个人KPI库定制,提供个性化的、动态的标签计算能力,满足大数据分析不断增长的数据标签需求;针对数据库提供各类数据质量检测规则,形成标准化规则接口,供校内其他业务系统使用;工具能够依据数据挖掘标准算法(时间序列、回归、Kmeans等),结合高校行业特征,形成学业预警、贫困生预警、虚假贫困预警、不在校预警等校园定制化算法。
图:规则引擎工具
3、产品特色
统一数据开发平台与传统数据开发中间件相比最大的优势在于:
- 所有能力汇聚在一个独立、完整的私有云系统内,开发效率高;
- 支持分布式部署,运行稳定,在近百所高校的场景验证下,性能表现极佳;
- 所有模块开发无需二次建模,均能够与数据治理平台的元数据、信息标准无缝对接,大大提升数据规范和操作一致性;
- 基于全数据链路的架构,实现所有开发成果的自动数据溯源、自动对接数据质量反馈、自动匹配关联历史数据、自动实现影响性分析,做到全时无死角的链路监控;
- 所有模块均可与云端知识库无缝对接,可以为每个学校提供大量的数据治理、数据开放、数据开发和数据应用的素材,从本质上降低工具落地、上手难度。