5月20日,2020中国民办教育科技峰会暨校管家520感恩答谢会以云直播的形式开启大幕。全国各地民办教育专家、学者、万人大校校长、合伙人及管理者在空中相聚,畅谈民办教育趋势与发展,共话民办教育科技创新之路。
校管家CTO宋伟带着数据科学团队新开发的产品——大数据决策系统在大会上亮相,向伙伴们展示,数据决策系统如何赋能教培机构精细化运营。
01 大数据发展必经的4个阶段
宋伟是我国著名的大数据及人工智能科研专家,拥有多项专利,2011年曾荣获广东省科学技术一等奖。加入校管家前,他曾在华为工作9年,先后担任华为中央软件院、华为美研所的技术领头人,是华为人工智能及大数据技术早期的奠基者。
宋伟表示,大数据发展有4个必经阶段:
1.发生了什么
初级阶段。
通过人工或系统记录+积累数据,并加以处理、规整,还原企业的真实现状。
2.为什么会发生
进阶阶段。
用便捷的方式,从不同角度探查数据,分析现状背后的的原因。
3.预测什么会发生
高级阶段。
预测是一件很难的事。难在哪里?
第一,企业要应用好大数据系统及背后的技术,这需要决策层的强力支持,以及技术团队锲而不舍的坚持和努力;
第二、企业经营过程中产生的数据要充分、完整地保存;
第三,需要企业有组织运作、行业经验、知识、技术等多方面的积累,并与大数据技术形成有效的共振。
4.做什么决策
智能阶段。
依托对未来的预测,企业要做一些备案、安全措施、经营调整,这个门槛很高。因为做决策是需要依赖组织的。
组织对大数据的理解透不透彻?组织有没有勇气去相信大数据系统?两者之间的配合度怎么样?依据决策产生的后续行为,是否能得到良好的闭环回馈?这些都有很大的挑战。
02 行业应用大数据现状
宋伟感叹道,大数据技术在我国已经历了十多年发展,但大部分企业,目前还停留在第一阶段,即便有些企业已经应用了类似校管家这样的信息化系统,积累了海量大数据,但这些资源是沉睡的,其效能远远没有发挥出来。
在领域里深耕多年的宋伟,给大家还原了行业内大数据的应用现状。
1.慢是常态
大部分企业是用一种很传统的方式给用户看数据。比如说,要查过去一个月的数据指标,数据能出来,但很慢,这种慢已经超过了用户的忍耐极限,并渐渐地使用户和系统之间形成一种恶性关系。
2.用户要看多角度数据时,时间成本高
系统里的数据都是以单一形式存储的,呈现形式也很单一。
这导致用户看数据的角度是相对固定的。用户要查看当前没有的数据维度,必须经过提需求、实现、交付的漫长过程。
等数据到达客户手上时,时效性大打折扣,海量数据“沉睡”在海底。
“其实大数据的真谛就是让以往在经营过程中沉淀下来、正在沉睡的数据真正产生价值,用于做决策支撑,用于预测将来要发生的事,用于总结可以传承的规律经验,并最终以智慧的方式,提升机构的运作效能。”宋伟这样说道。
03 大数据决策系统:向预测阶段过渡
宋伟介绍说,校管家发布的大数据决策系统,处于第二阶段和第三阶段之间。
1.数据展现快
大数据决策系统以秒级的性能展现数据。
宋伟表示,这是利用了一些高级技术。
正常的数据库是按行存,但是校管家数据科学团队采用按列存的方式:
第一,它压缩率比较高(数据量很大时,不压缩的话,数据会膨胀,影响速度及存储成本);
第二,列可以无限宽,可以根据未来的不可知需求,增加维度,而且无损。
2.多维度的数据汇聚及呈现
数据决策系统里集成了上千种维度及指标,用户可以随心所欲地组合。
3.展现形式更友好
系统集成了50多种图表,用户筛选出数据后,可以任意切换多种图表形式,饼图、柱状图、线形图、热力图……用户能更直观、更轻松地读懂数据。
4.形成行业通用模板
校管家成立十年来,合作了1万多家大中型机构,在陪伴客户成长期间,也吸取了他们的经验,把行业内比较关心、常用的指标整理成了标准化的图表及仪表盘。
即使用户缺乏数据分析经验,也可通过这些模板满足大部分需求。
5.用户自定义能力
在通用报表及仪表盘无法满足的情况下,用户可在1分钟内,通过拖拽的形式创建自己的图表及仪表盘,并可分享给其他同事,让机构真正随心所欲地进行数据消费。
04 多项技术成就数据决策系统
宋伟表示,用户使用大数据的过程,类似于货物进仓出仓。
第一步:仓储管理
我们都知道,仓库会汇聚不同源头的货物。当肉类、蔬菜等各种货物进入仓库后,需要在不同的温度条件下保存。数据进仓也是这样,需要分类。
第二步:数据清洗
数据进仓前需要经过清洗。有的数据不是用户想要的;有的数据不完备;需要补充;有的数据展现格式不统一,需要转换并归一。
第三步:以各种主题呈现给用户
比如把财务相关的数据组合在一起,不相关的给它们设立边界。所以,这也保证了用户可以自由地筛选各种维度,从不同角度去读数据。
第四步:设立多种感知数据的方式
通过这一步技术,用户可选择以某种方式来看数据,如图表、仪表盘等。同时,给用户提供更高阶的数据探索手段——SQL实验室。SQL是一种探索数据的标准脚本语言,能更深入、便捷地探索数据仓库里已有的数据。
05 大数据系统的阶段性目标
宋伟表示,目前校管家的数据科学团队,正在落地流计算技术。
比如网报场景,机构非常关注每时每刻的报名金额,该技术能帮助用户以秒级为单位,实时展现机构网报的收入状况,这和天猫双11实时展现的数据大屏十分类似。
同时,校管家会通过数据挖掘及机器学习技术,进一步做预测方面的技术准备,让大数据更好地为行业赋能。