大数据可视化技术前景分析

发布时间:2020-09-01 阅读量:3840 来源:
如今的我们处于信息化时代的浪潮中,信息化又催生出了大数据等新技术的快速发展,而这些新技术的可视化、商业化和普及给很多行业增加了很多新的活力或激发了新的行业潜力。为此,宏图远见就企业营销、行业应用等广泛应用场景深入分析大数据可视化的作用。
大数据可视化技术前景分析

  1.数据可视化研究概述

  数据可视化,可以增强数据的呈现效果,方便用户以更加直观的方式观察数据,进而发现数据中隐藏的信息。可视化应用领域十分广泛,主要涉及网络数据可视化、交通数据可视化、文本数据可视化、数据挖掘可视化、生物医药可视化、社交可视化等领域。依照CARD可视化模型,将数据可视化过程分为:数据预处理、绘制、显示和交互这几个阶段。依照SHNEIDERMAN分类,可视化的数据分为:一维数据、二维数据、三维数据、高维数据、时态数据、层次数据和网络数据。其中高维数据、层次数据、网络数据、时态数据是当前可视化的研究热点。

  高维数据目前已经成为了计算机领域的研究热点,所谓高维数据是指每一个样本数据包含p(p≥4)维空间特征。人类对于数据的理解主要集中在低维度的空间表示上,如果单从高维数据的抽象数据值上进行分析很难得到有用的信息。相对于对数据的高维模拟,低维空间的可视化技术显得更简单、直截。而且高维空间包含的元素相对于低维空间来说更加更复杂,容易造成人们的分析混乱。将高维数据信息映射到二三维空间上,方便高维数据进行人与数据的交互,有助于对数据进行聚类以及分类。高维数据可视化的研究主要包含数据变化、数据呈现两个方面。

  层次数据具有等级或层级关系。层次数据的可视化方法主要包括节点链接图和树图2种方式。其中树图(treemap)由一系列的嵌套环、块来展示层次数据。

  为了能展示更多的节点内容,一些基于“焦点+上下文”技术的交互方法被开发出来。包括“鱼眼”技术、几何变形、语义缩放、远离焦点的节点聚类技术等。

  网络数据表现为更加自由、更加复杂的关系网络。分析网络数据的核心是挖掘关系网络中的重要结构性质,如节点相似性、关系传递性、网络中心性等,网络数据可视化方法应清晰表达个体间关系以及个体的聚类关系。主要布局策略包含结点链接法和相邻矩阵法。

  时间序列数据是指具有时间属性的数据集,针对时间序列数据的可视化方法包含:线形图、动画、堆积图、时间线、地平线图。

  数据可视化伴随着大数据时代的到来而兴起,可视化分析是大数据分析不可或缺的一种重要手段和工具,只有在真正理解可视化概念本质后,才能更好的研究并应用其方法和原理,获得数据背后隐藏的价值。

  2.数据可视化的定义

  数据可视化,是关于数据视觉表现形式的科学技术研究。可视化技术是利用计算机图形学及图像处理技术,将数据转换为图形或图像形式显示到屏幕上,并进行交互处理的理论、方法和技术。它涉及计算机视觉、图像处理、计算机辅助设计、计算机图形学等多个领域,成为一项研究数据表示、数据处理、决策分析等问题的综合技术。

  2.1数据可视化的基本概念

  1)数据空间。由n维属性、m个元素共同组成的数据集构成的多维信息空间。

  2)数据开发。利用一定的工具及算法对数据进行定量推演及计算。

  3)数据分析。对多维数据进行切片、块、旋转等动作剖析数据,从而可以多角度多侧面的观察数据。

  4)数据可视化。将大型数据集中的数据通过图形图像方式表示,并利用数据分析和开发工具发现其中未知信息。

  2.2数据可视化的标准

  为实现信息的有效传达,数据可视化应兼顾美学与功能,直观的传达出关键的特征,便于挖掘数据背后隐藏的价值。

  可视化技术应用标准应该包含以下4个方面:

  1)直观化。将数据直观、形象的呈现出来。

  2)关联化。突出的呈现出数据之间的关联性。

  3)艺术性。使数据的呈现更具有艺术性,更加符合审美规则。

  4)交互性。实现用户与数据的交互,方便用户控制数据。

  3.数据可视化面临的挑战

  伴随着大数据时代的到来,数据可视化日益受到关注,可视化技术也日益成熟。然而,数据可视化仍存在许多问题,且面临着巨大的挑战。

  大数据可视化存在以下问题:

  1)视觉噪声。在数据集中,大多数数据具有极强的相关性,无法将其分离作为独立的对象显示。

  2)信息丢失。减少可视数据集的方法可行,但会导致信息的丢失。

  3)大型图像感知。数据可视化不单单受限于设备的长度比及分辨率,也受限于现实世界的感受。

  4)高速图像变换。用户虽然能够观察数据,却不能对数据强度变化做出反应。

  5)高性能要求。对于静态可视化对性能要求不高,因为可视化速度较低,性能要求不高,然而动态可视化对性能要求会比较高。

  数据可视化面临的挑战主要指可视化分析过程中数据的呈现方式,包括可视化技术和信息可视化显示。目前,数据简约可视化研究中,高清晰显示、大屏幕显示、高可扩展数据投影、维度降解等技术都试着从不同角度解决这个难题。

  可感知的交互的扩展性是大数据可视化面临的挑战之一。从大规模数据库中查询数据可能导致高延迟,使交互率降低。

  在大数据应用程序中,大规模数据及高维数据使数据可视化变得十分困难。

  在超大规模的数据可视化分析中,我们可以构建更大、更清晰的视觉显示设备,但是人类的敏锐度制约了大屏幕显示的有效性。

  由于人和机器的限制,在可预见的未来,大数据的可视化问题会是一个重要的挑战。

  4.数据可视化技术的发展方向

  1)可视化技术与数据挖掘有着紧密的联系。数据可视化可以帮助人们洞察出数据背后隐藏的潜在信息,提高了数据挖掘的效率,因此,可视化与数据挖掘紧密结合是可视化研究的一个重要发展方向。

  2)可视化技术与人机交互拥有着紧密的联系。实现用户与数据的交互,方便用户控制数据,更好地实现人机交互这是我们一直追求的目标。因此,可视化与人机交互相结合是可视化研究的一个重要发展方向。

3)可视化与大规模、高维度、非结构化数据有着紧密的联系。目前,我们身处于大数据时代,大数据时代,大规模、高纬度、非结构化数据层出不穷,要将这样的数据以可视化形式完美的展示出来,并非易事。因此,可视化与大规模、高维度、非结构化数据结合是可视化研究的一个重要发展方向。

大数据是对大量、动态、能持续的数据,通过运用新系统、新工具、新模型的挖掘,而大数据可视化更是艺术完美结合,帮助人更好的分析数据,通过图形和色彩将关键数据和特征直观地传达出来,从而实现对于相当稀疏而又复杂的数据集的深入洞察。