最新行业资讯尽在掌握
单枪匹马,把深奥的公式运用到大量的数据搜索中,从而获得有用的见解。但是,这只是整个过程的一小步。数据分析本身并非目的,而是为了让企业做出更好的决策。资料学家必须建立产品,让组织内的每一个人都能更好地利用资料,让每一个部门、每一个层次都能作出决定。下面我们就来说说大数据可视化地图的七个关键方向。
“大数据可视化地图”是自动收集产品、清理和分析数据,并通过仪表盘或报告提供信息和预测。自动分析,数据科学家可以用业务模型改进工作,提高预测精度。
尽管每个公司根据自己的需要和目标创建数据产品,但总体步骤和目标是一致的:
1.决策目标:在数据价值链中,第一步必须是数据,然后由业务部门确定数据科学小组的目标。这类目标通常需要大量数据收集和分析。由于我们研究的是数据驱动的决策,因此我们需要一种可测量的方法来了解企业的目标。必须尽早发现关键指标或业绩指标。
2.确定业务标杆:业务应进行更改以改进关键指标,从而实现其目标。如果没有任何变化,就不会有任何进展收集和分析数据的数量。制定目标、指标可以为项目早期提供指导,避免无意义的数据分析。举例来说,目标是提高客户留存率,其中一个指标可以为客户更新其订阅率,企业可以设置提醒邮件,并通过更新页面设计、时间和内容进行特殊促销。
3.数据收集:铺开数据的大网,使更多的数据,尤其是从各种渠道获得的数据,具有更好的相关性,建立更好的模型,并获得更多可行的见解。大数据仅仅意味着个人记录常常是无用的,每一份记录都可以用来进行分析,以提供真实的价值。企业紧密地监测其网站,以追踪用户的点击和鼠标移动,利用射频识别技术追踪其活动,等等。
4.数据清理:数据分析的第一步是改善数据质量。资料学家处理正确的拼写错误,处理丢失的资料,清除无意义的资料。这是数据价值链中最关键的一步,即使使用垃圾数据进行最佳数据值分析也会导致错误和误导。不止一家公司惊讶地发现,他们的大部分客户都生活在斯克内克塔迪(美国城市)、纽约以及人口不足70000的小城镇。但 Spenectadi的邮政编码是12345,因此,几乎每个客户档案数据库中都出现了过多的数据,因为消费者通常不愿意真正填写他们的在线表单。除非数据分析员采取措施进行验证,从而得到干净的数据,否则分析数据会导致错误的结论。一般情况下,过程是自动的,但这并不意味着人类不能参与。
5.数据建模:数据科学家建立模型,将关联数据与业务结果联系起来,提出建议,确定业务价值的变化,这是第一步。在关键业务中,数据科学家通过数据、建模、预测业务结果,成为了独一无二的专家。为了建立科学准确的模型,避免毫无意义的相关性陷阱,数据科学家必须具备强有力的统计和机器学习背景,并且模型依赖于已有的数据,他们的未来预测没有用。但是统计学背景还不够充分,数据科学家需要更好地理解商业,才能确定数学模型的结果是否有价值。
6.数据科学团队:众所周知,数据科学家很难受雇,组建数据科学团队是个不错的主意,通过拥有高学历的统计人员专注于数据建模和预测,而团队其他成员,合格的基础结构工程师、软件开发人员和 ETL专家则负责建立必要的数据收集基础结构、数据管道和数据产品,通过报告和仪表板来显示数据结果和业务模型。作为一个产品,这些团队通常使用大型数据分析平台 Hadoop自动化数据收集、分析和运行整个过程。
7.优化和重复:数据价值链是一个可重复的过程,价值链的运作和数据本身不断得到改善。企业将通过数据科学团队在模型基础上测量的结果来驱动业务。根据成果,企业可以决定通过数据科学团队进一步改进数据收集、数据清理和数据模型。若企业越快地重复这一过程,它就越快地找到正确的方向,从而获得数据价值。理论上,经过几次迭代,模型会产生精确的预测,业务会达到预定的目标,数据价值链的结果会被用来监测和报告,所有人都会去解决下一个商业难题。