AirJD 焦点
AirJD

没有录音文件
00:00/00:00
加收藏

数据可视化及NEV-什么是数据可视化 by 王玮@网易

发布者 big_data
发布于 1455670074887  浏览 8091 关键词 可视化, 大数据, JavaScript 
分享到

第1页

hzwangwei15@corp.netease.com
   网易杭州研究院移动技术组 
数据可视化及NEV
 王玮

第2页

 数据可视化的含义及意义
 数据可视化的展现形式
 数据可视化的应用场景
 NEV简介
 NEV自适应布局
 NEV展望

----- 会议笔记(15/10/20 15:56) -----
数据可视化的展现形式要减少

第3页

什么是数据可视化?
数据可视化是指,在图形中使用有组织关系的视觉对象(例如,点,线或棒)来表示数据或信息的技术。
其目标主要是:通过图形、图表、表格来直观高效地传递信息给用户。
将信息和数据可视化这种实践行为可以说是伴随着整个人类文明的发展。

第4页

从旧石器时代刻在砂岩上的狩猎指南到到古埃及记录的矿产分布开采分布图
从中国的弦图再到十三世纪西班牙哲学家卢拉提出的知识关系图

第5页

拿破仑远征图,中国美食地图

第6页

从第一张世界地图到拿破仑远征图

第7页

从第一张世界地图到拿破仑远征图

第8页

第9页

第10页

为什么要数据可视化?
人类大脑处理信息的方式,人脑的认知,模式匹配,人类的视觉系统非常适合做数据可视化分析,
文字或者图形几乎是一个文明传承下来的必需条件,

人类80%的信息来自于视觉,感光神经是一个非常大的数据运输管道,它能够将视觉信息源源不断地传输至大脑(有研究表明,感光神经的信息传输速度大约是8MB/s),而大脑非常擅长处理诸如边缘检测,形状识别,模式匹配等相关问题。例如,几个月大的婴儿能够比较容易地辨别与自己朝夕相处的亲人和陌生人,计算机无法识别的验证码人类可以轻易地识别
人类也在不断的借助各种科学技术增强自己的视觉能力,将信息以人类最擅长的方式展现出来这是一种必然趋势

第11页

每天交易信息
用户的访问数据
在线交易情况
海量数据

第12页

复杂的数据结构
复杂的数据关系
复杂的逻辑分类
复杂数据
这是一个信息社会,海量的数据正从各行各业中爆发出来(如股市,互联网),如何有效的从这些数据中发觉出有价值的信息来帮助我们了解蕴含在数据后面的规律和模式,根据这些规律来指导决策显得尤为重要,但是对一般人而言海量数据显得冷冰冰的,不容易操纵,而数据可视化为用户提供了一个非常形象的展现形式,并且一系列的交互操作能够和用户产生高度的互动,用户是带着疑问的,通过自己探索,让数据来告诉你答案

第13页

1973年,统计学家F.J. Anscombe构造出了四组奇特的数据。
这四组数据中,x值的平均数都是9.0,y值的平均数都是7.5;x值的方差都是10.0,y值的方差都是3.75;它们的相关度都是0.816,线性回归线都是y=3+0.5x。
呈现数据特征
统计数字上看来,四组数据所反映出的实际情况非常相近,而事实上,这四组数据有着天壤之别。

第14页

呈现数据特征
把它们描绘在图表中,你会发现这四组数据是四种完全不同的情况。第一组数据是大多人看到上述统计数字的第一反应,是最“正常”的一组数据;第二组数据所反映的事实上是一个精确的二次函数关系,只是在错误地应用了线性模型后,各项统计数字与第一组数据恰好都相同;第三组数据描述的是一个精确的线性关系,只是这里面有一个异常值,它导致了上述各个统计数字,尤其是相关度值的偏差;第四组数据则是一个更极端的例子,其异常值导致了平均数、方差、相关度、线性回归线等所有统计数字全部发生偏差。
数学运算的到的统计信息是很难完全反应数据的全部面貌的

第15页

数据可视化的意义
有效地传达信息
从海量数据快捷地获取知识
能够帮助人们探索数据,发现规律
有效地传达信息,利用人类视觉的天然模式识别器,将数据转化为肉眼的感官
认知。
海量数据无法直接分析,通过可视化,可以更加容易更快捷获取想要的知识。
能够帮助人们探索数据,发现规律。

第16页

常见的可视化展现形式

第17页

柱状图
历史证明,人类的视觉在人类的科学发现中发挥过杰出的作用。通常在可视化方面,关键技术的出现,就是重大科学发现的前奏。望远镜和显微镜在天文学和生物发展中的作用,就是明证。这些工具,放大和扩展了人类眼晴的功能。今天,这个道理仍然成立。人类的可视化功能,允许人类对大量抽象的数据进行分析。新的数据开发工具,可以大大拓展我们的视力。人的创造性不仅取决于人的逻辑思维,而且取决于人的形象思维。海量的数据只有通过可视化变成形象,才能激发人的形象思维。从表面上看来是杂乱无章的海量数据中,找出其中隐藏的规律,为科学发现、工程开发、医疗诊断和业务决策等提供依据。这里我们还必须区分数据、信息和知识的概念。数据是符号的集合。信息是有用的数据。信息不等同于知识。信息不能像知识那样去反映数据之间的内在联系。对于知识,有人主张可分成两类,一类是无法用语言和文字来描述的,称之谓隐知识(Tacit Knowledge);另一类是可以用语言和文字来描述的,称之谓显知识(Explicit Knowledge)。当前,信息就是这种显知识。展望未来,在脑科学取得突破的基础上,将研制成功类人脑的计算机-生物计算机,从而开创人工智能的黄金时代。但即使到那时,信息也不能完全表达人类全部的隐知识。只有将数据和信息用图形和图像表示出来,才有可能为获得十分宝贵的隐知识创造条件。总之,数据可视化可以大大加快数据的处理速度,使时刻都在产生的海量数据得到有效利用;可以在人与数据、人与人之间实现图像通信,从而使人们能够观察到数据中隐含的现象,为发现和理解科学规律提供有力工具;可以实现对计算和编程过程的引导和控制,通过交互手段改变过程所依据的条件,并观察其影响。


大数据时代的数据量大且数据结构多样化,其复杂程度早已超过了传统意义上的关系数据库。同时,大数据已经渗透到人们生活的各个领域,很多行业都开始增加对大数据的需求。但普通用户往往更关心结果的展示,数据的复杂性限制了普通用户从大数据中直接获取知识。因此,数据的可视化在进行大数据的分析工作时应当被研究工作者加以重视并进一步提升。

第18页

面积图
历史证明,人类的视觉在人类的科学发现中发挥过杰出的作用。通常在可视化方面,关键技术的出现,就是重大科学发现的前奏。望远镜和显微镜在天文学和生物发展中的作用,就是明证。这些工具,放大和扩展了人类眼晴的功能。今天,这个道理仍然成立。人类的可视化功能,允许人类对大量抽象的数据进行分析。新的数据开发工具,可以大大拓展我们的视力。人的创造性不仅取决于人的逻辑思维,而且取决于人的形象思维。海量的数据只有通过可视化变成形象,才能激发人的形象思维。从表面上看来是杂乱无章的海量数据中,找出其中隐藏的规律,为科学发现、工程开发、医疗诊断和业务决策等提供依据。这里我们还必须区分数据、信息和知识的概念。数据是符号的集合。信息是有用的数据。信息不等同于知识。信息不能像知识那样去反映数据之间的内在联系。对于知识,有人主张可分成两类,一类是无法用语言和文字来描述的,称之谓隐知识(Tacit Knowledge);另一类是可以用语言和文字来描述的,称之谓显知识(Explicit Knowledge)。当前,信息就是这种显知识。展望未来,在脑科学取得突破的基础上,将研制成功类人脑的计算机-生物计算机,从而开创人工智能的黄金时代。但即使到那时,信息也不能完全表达人类全部的隐知识。只有将数据和信息用图形和图像表示出来,才有可能为获得十分宝贵的隐知识创造条件。总之,数据可视化可以大大加快数据的处理速度,使时刻都在产生的海量数据得到有效利用;可以在人与数据、人与人之间实现图像通信,从而使人们能够观察到数据中隐含的现象,为发现和理解科学规律提供有力工具;可以实现对计算和编程过程的引导和控制,通过交互手段改变过程所依据的条件,并观察其影响。


大数据时代的数据量大且数据结构多样化,其复杂程度早已超过了传统意义上的关系数据库。同时,大数据已经渗透到人们生活的各个领域,很多行业都开始增加对大数据的需求。但普通用户往往更关心结果的展示,数据的复杂性限制了普通用户从大数据中直接获取知识。因此,数据的可视化在进行大数据的分析工作时应当被研究工作者加以重视并进一步提升。

第19页

饼图
历史证明,人类的视觉在人类的科学发现中发挥过杰出的作用。通常在可视化方面,关键技术的出现,就是重大科学发现的前奏。望远镜和显微镜在天文学和生物发展中的作用,就是明证。这些工具,放大和扩展了人类眼晴的功能。今天,这个道理仍然成立。人类的可视化功能,允许人类对大量抽象的数据进行分析。新的数据开发工具,可以大大拓展我们的视力。人的创造性不仅取决于人的逻辑思维,而且取决于人的形象思维。海量的数据只有通过可视化变成形象,才能激发人的形象思维。从表面上看来是杂乱无章的海量数据中,找出其中隐藏的规律,为科学发现、工程开发、医疗诊断和业务决策等提供依据。这里我们还必须区分数据、信息和知识的概念。数据是符号的集合。信息是有用的数据。信息不等同于知识。信息不能像知识那样去反映数据之间的内在联系。对于知识,有人主张可分成两类,一类是无法用语言和文字来描述的,称之谓隐知识(Tacit Knowledge);另一类是可以用语言和文字来描述的,称之谓显知识(Explicit Knowledge)。当前,信息就是这种显知识。展望未来,在脑科学取得突破的基础上,将研制成功类人脑的计算机-生物计算机,从而开创人工智能的黄金时代。但即使到那时,信息也不能完全表达人类全部的隐知识。只有将数据和信息用图形和图像表示出来,才有可能为获得十分宝贵的隐知识创造条件。总之,数据可视化可以大大加快数据的处理速度,使时刻都在产生的海量数据得到有效利用;可以在人与数据、人与人之间实现图像通信,从而使人们能够观察到数据中隐含的现象,为发现和理解科学规律提供有力工具;可以实现对计算和编程过程的引导和控制,通过交互手段改变过程所依据的条件,并观察其影响。


大数据时代的数据量大且数据结构多样化,其复杂程度早已超过了传统意义上的关系数据库。同时,大数据已经渗透到人们生活的各个领域,很多行业都开始增加对大数据的需求。但普通用户往往更关心结果的展示,数据的复杂性限制了普通用户从大数据中直接获取知识。因此,数据的可视化在进行大数据的分析工作时应当被研究工作者加以重视并进一步提升。

第20页

折线图
历史证明,人类的视觉在人类的科学发现中发挥过杰出的作用。通常在可视化方面,关键技术的出现,就是重大科学发现的前奏。望远镜和显微镜在天文学和生物发展中的作用,就是明证。这些工具,放大和扩展了人类眼晴的功能。今天,这个道理仍然成立。人类的可视化功能,允许人类对大量抽象的数据进行分析。新的数据开发工具,可以大大拓展我们的视力。人的创造性不仅取决于人的逻辑思维,而且取决于人的形象思维。海量的数据只有通过可视化变成形象,才能激发人的形象思维。从表面上看来是杂乱无章的海量数据中,找出其中隐藏的规律,为科学发现、工程开发、医疗诊断和业务决策等提供依据。这里我们还必须区分数据、信息和知识的概念。数据是符号的集合。信息是有用的数据。信息不等同于知识。信息不能像知识那样去反映数据之间的内在联系。对于知识,有人主张可分成两类,一类是无法用语言和文字来描述的,称之谓隐知识(Tacit Knowledge);另一类是可以用语言和文字来描述的,称之谓显知识(Explicit Knowledge)。当前,信息就是这种显知识。展望未来,在脑科学取得突破的基础上,将研制成功类人脑的计算机-生物计算机,从而开创人工智能的黄金时代。但即使到那时,信息也不能完全表达人类全部的隐知识。只有将数据和信息用图形和图像表示出来,才有可能为获得十分宝贵的隐知识创造条件。总之,数据可视化可以大大加快数据的处理速度,使时刻都在产生的海量数据得到有效利用;可以在人与数据、人与人之间实现图像通信,从而使人们能够观察到数据中隐含的现象,为发现和理解科学规律提供有力工具;可以实现对计算和编程过程的引导和控制,通过交互手段改变过程所依据的条件,并观察其影响。


大数据时代的数据量大且数据结构多样化,其复杂程度早已超过了传统意义上的关系数据库。同时,大数据已经渗透到人们生活的各个领域,很多行业都开始增加对大数据的需求。但普通用户往往更关心结果的展示,数据的复杂性限制了普通用户从大数据中直接获取知识。因此,数据的可视化在进行大数据的分析工作时应当被研究工作者加以重视并进一步提升。

第21页

散点图
历史证明,人类的视觉在人类的科学发现中发挥过杰出的作用。通常在可视化方面,关键技术的出现,就是重大科学发现的前奏。望远镜和显微镜在天文学和生物发展中的作用,就是明证。这些工具,放大和扩展了人类眼晴的功能。今天,这个道理仍然成立。人类的可视化功能,允许人类对大量抽象的数据进行分析。新的数据开发工具,可以大大拓展我们的视力。人的创造性不仅取决于人的逻辑思维,而且取决于人的形象思维。海量的数据只有通过可视化变成形象,才能激发人的形象思维。从表面上看来是杂乱无章的海量数据中,找出其中隐藏的规律,为科学发现、工程开发、医疗诊断和业务决策等提供依据。这里我们还必须区分数据、信息和知识的概念。数据是符号的集合。信息是有用的数据。信息不等同于知识。信息不能像知识那样去反映数据之间的内在联系。对于知识,有人主张可分成两类,一类是无法用语言和文字来描述的,称之谓隐知识(Tacit Knowledge);另一类是可以用语言和文字来描述的,称之谓显知识(Explicit Knowledge)。当前,信息就是这种显知识。展望未来,在脑科学取得突破的基础上,将研制成功类人脑的计算机-生物计算机,从而开创人工智能的黄金时代。但即使到那时,信息也不能完全表达人类全部的隐知识。只有将数据和信息用图形和图像表示出来,才有可能为获得十分宝贵的隐知识创造条件。总之,数据可视化可以大大加快数据的处理速度,使时刻都在产生的海量数据得到有效利用;可以在人与数据、人与人之间实现图像通信,从而使人们能够观察到数据中隐含的现象,为发现和理解科学规律提供有力工具;可以实现对计算和编程过程的引导和控制,通过交互手段改变过程所依据的条件,并观察其影响。


大数据时代的数据量大且数据结构多样化,其复杂程度早已超过了传统意义上的关系数据库。同时,大数据已经渗透到人们生活的各个领域,很多行业都开始增加对大数据的需求。但普通用户往往更关心结果的展示,数据的复杂性限制了普通用户从大数据中直接获取知识。因此,数据的可视化在进行大数据的分析工作时应当被研究工作者加以重视并进一步提升。

第22页

雷达图
历史证明,人类的视觉在人类的科学发现中发挥过杰出的作用。通常在可视化方面,关键技术的出现,就是重大科学发现的前奏。望远镜和显微镜在天文学和生物发展中的作用,就是明证。这些工具,放大和扩展了人类眼晴的功能。今天,这个道理仍然成立。人类的可视化功能,允许人类对大量抽象的数据进行分析。新的数据开发工具,可以大大拓展我们的视力。人的创造性不仅取决于人的逻辑思维,而且取决于人的形象思维。海量的数据只有通过可视化变成形象,才能激发人的形象思维。从表面上看来是杂乱无章的海量数据中,找出其中隐藏的规律,为科学发现、工程开发、医疗诊断和业务决策等提供依据。这里我们还必须区分数据、信息和知识的概念。数据是符号的集合。信息是有用的数据。信息不等同于知识。信息不能像知识那样去反映数据之间的内在联系。对于知识,有人主张可分成两类,一类是无法用语言和文字来描述的,称之谓隐知识(Tacit Knowledge);另一类是可以用语言和文字来描述的,称之谓显知识(Explicit Knowledge)。当前,信息就是这种显知识。展望未来,在脑科学取得突破的基础上,将研制成功类人脑的计算机-生物计算机,从而开创人工智能的黄金时代。但即使到那时,信息也不能完全表达人类全部的隐知识。只有将数据和信息用图形和图像表示出来,才有可能为获得十分宝贵的隐知识创造条件。总之,数据可视化可以大大加快数据的处理速度,使时刻都在产生的海量数据得到有效利用;可以在人与数据、人与人之间实现图像通信,从而使人们能够观察到数据中隐含的现象,为发现和理解科学规律提供有力工具;可以实现对计算和编程过程的引导和控制,通过交互手段改变过程所依据的条件,并观察其影响。


大数据时代的数据量大且数据结构多样化,其复杂程度早已超过了传统意义上的关系数据库。同时,大数据已经渗透到人们生活的各个领域,很多行业都开始增加对大数据的需求。但普通用户往往更关心结果的展示,数据的复杂性限制了普通用户从大数据中直接获取知识。因此,数据的可视化在进行大数据的分析工作时应当被研究工作者加以重视并进一步提升。

第23页

气泡图
历史证明,人类的视觉在人类的科学发现中发挥过杰出的作用。通常在可视化方面,关键技术的出现,就是重大科学发现的前奏。望远镜和显微镜在天文学和生物发展中的作用,就是明证。这些工具,放大和扩展了人类眼晴的功能。今天,这个道理仍然成立。人类的可视化功能,允许人类对大量抽象的数据进行分析。新的数据开发工具,可以大大拓展我们的视力。人的创造性不仅取决于人的逻辑思维,而且取决于人的形象思维。海量的数据只有通过可视化变成形象,才能激发人的形象思维。从表面上看来是杂乱无章的海量数据中,找出其中隐藏的规律,为科学发现、工程开发、医疗诊断和业务决策等提供依据。这里我们还必须区分数据、信息和知识的概念。数据是符号的集合。信息是有用的数据。信息不等同于知识。信息不能像知识那样去反映数据之间的内在联系。对于知识,有人主张可分成两类,一类是无法用语言和文字来描述的,称之谓隐知识(Tacit Knowledge);另一类是可以用语言和文字来描述的,称之谓显知识(Explicit Knowledge)。当前,信息就是这种显知识。展望未来,在脑科学取得突破的基础上,将研制成功类人脑的计算机-生物计算机,从而开创人工智能的黄金时代。但即使到那时,信息也不能完全表达人类全部的隐知识。只有将数据和信息用图形和图像表示出来,才有可能为获得十分宝贵的隐知识创造条件。总之,数据可视化可以大大加快数据的处理速度,使时刻都在产生的海量数据得到有效利用;可以在人与数据、人与人之间实现图像通信,从而使人们能够观察到数据中隐含的现象,为发现和理解科学规律提供有力工具;可以实现对计算和编程过程的引导和控制,通过交互手段改变过程所依据的条件,并观察其影响。


大数据时代的数据量大且数据结构多样化,其复杂程度早已超过了传统意义上的关系数据库。同时,大数据已经渗透到人们生活的各个领域,很多行业都开始增加对大数据的需求。但普通用户往往更关心结果的展示,数据的复杂性限制了普通用户从大数据中直接获取知识。因此,数据的可视化在进行大数据的分析工作时应当被研究工作者加以重视并进一步提升。

第24页

字符云图
采用文本在二维空间中所占据的面积大小来代表该词出现的频次
常用于社交网络中的标签云,或新闻关键词的可视化等

第25页

热力图
采用颜色及其深浅来表示数值的大小
常用于统计事件频率

第26页

边捆绑图
用以展现不同实体之间的关联关系
例如:不同机场之间的直飞航线等

第27页

聚类树状图
可以用于显示不同聚类簇之间的层级关系(分层聚类过程),也可以用于显示目标时间发生的路径

第28页

圆包含图
与簇树状图的表达方式类似,但可以显示深度不同的分层聚类结构
其优势在于可以更加直观地显示各聚类簇之间的层级关系

第29页

力导向图
适合研究复杂拓扑结构
如社会成员之间的社交

第30页

树图
与簇树状图的表达方式类似,但可以显示深度不同的分层聚类结构
其优势在于可以更加直观地显示各聚类簇之间的层级关系

第31页

弦图
可以表达各个类别之间的依赖关系的强弱
其优势在于可以更加直观地显示各聚类簇之间的层级关系

第32页

地图
可以表达各个类别之间的依赖关系的强弱
其优势在于可以更加直观地显示各聚类簇之间的层级关系

第33页

可视化的应用场景
Norse Attack Map是Norse公司在能力范围内提供的全球暗网黑客战画面网页。2015年7月中国处于可直接访问状态——上面显示在随便一段时间内。Norse的产品副总裁杰夫·哈瑞尔(Jeff Harrell)解释称,所有在地图上看到的攻击,其实是真实攻击情况的映射——这家公司在全球50多个国家放置了超过800万个攻击传感器,它们伪装成PC、Mac电脑,或者ATM等最容易受到网络攻击的设备,当受到攻击的时候,数据就通过专用网络传回Norse公司后台,并映射在地图上。

第34页

宏观势态可视化
全球风速实时监测
Norse attack map
态势可视化是在特定环境中对随时间推移而不断动作并变化的目标实体进行觉察、认知、理解,最终展示整体态势。此类大数据可视化应用通过建立复杂的仿真环境,通过大量数据多维度的积累,可以直观、灵活、逼真地展示宏观态势,从而让非专业人士很快掌握某一领域的整体态势、特征

第35页

设备仿真运行可视化
通过图像、三维动画以及计算机程控技术与实体模型相融合,实现对设备的可视化表达,使管理者对其所管理的设备有形象具体的概念,对设备所处的位置、外形及所有参数一目了然,会大大减少管理者的劳动强度,提高管理效率和管理水平,是“工业4.0”涉及的“智能生产”的具体应用之一。

第36页

数据统计分析可视化
商业智能
政府决策
公共服务
市场营销
此领域是目前媒体大众提及最多的应用,可用于商业智能、政府决策、公众服务、市场营销等领域。通过采集相关数据,进行加工并从中提取能够创造商业价值的信息,面向企业、政府战略并服务于管理层、业务层,指导经营决策。商业智能可视化负责直接与决策者进行交互,是一个实现了数据的浏览和分析等操作的可视化、交互式的应用。他对于决策人获取决策依据、进行科学的数据分析、辅助决策人员进行科学决策显得十分重要。因此商业智能可视化系统对于提升组织决策的判断力、整合优化企业信息资源和服务、提高决策人员的工作效率等具有显著的意义。




历史证明,人类的视觉在人类的科学发现中发挥过杰出的作用。通常在可视化方面,关键技术的出现,就是重大科学发现的前奏。望远镜和显微镜在天文学和生物发展中的作用,就是明证。这些工具,放大和扩展了人类眼晴的功能。今天,这个道理仍然成立。人类的可视化功能,允许人类对大量抽象的数据进行分析。新的数据开发工具,可以大大拓展我们的视力。人的创造性不仅取决于人的逻辑思维,而且取决于人的形象思维。海量的数据只有通过可视化变成形象,才能激发人的形象思维。从表面上看来是杂乱无章的海量数据中,找出其中隐藏的规律,为科学发现、工程开发、医疗诊断和业务决策等提供依据。这里我们还必须区分数据、信息和知识的概念。数据是符号的集合。信息是有用的数据。信息不等同于知识。信息不能像知识那样去反映数据之间的内在联系。对于知识,有人主张可分成两类,一类是无法用语言和文字来描述的,称之谓隐知识(Tacit Knowledge);另一类是可以用语言和文字来描述的,称之谓显知识(Explicit Knowledge)。当前,信息就是这种显知识。展望未来,在脑科学取得突破的基础上,将研制成功类人脑的计算机-生物计算机,从而开创人工智能的黄金时代。但即使到那时,信息也不能完全表达人类全部的隐知识。只有将数据和信息用图形和图像表示出来,才有可能为获得十分宝贵的隐知识创造条件。总之,数据可视化可以大大加快数据的处理速度,使时刻都在产生的海量数据得到有效利用;可以在人与数据、人与人之间实现图像通信,从而使人们能够观察到数据中隐含的现象,为发现和理解科学规律提供有力工具;可以实现对计算和编程过程的引导和控制,通过交互手段改变过程所依据的条件,并观察其影响。


大数据时代的数据量大且数据结构多样化,其复杂程度早已超过了传统意义上的关系数据库。同时,大数据已经渗透到人们生活的各个领域,很多行业都开始增加对大数据的需求。但普通用户往往更关心结果的展示,数据的复杂性限制了普通用户从大数据中直接获取知识。因此,数据的可视化在进行大数据的分析工作时应当被研究工作者加以重视并进一步提升。

第37页

NEV
Nice Easy Visualization
NEV是网易杭州研究院前端技术部完全自主研发的一款纯JavaScript编写的跨平台的数据可视化引擎,其主要目标是为用户提供简洁美观的数据可视化库,用户不需要关心细节问题

第38页

NEV处理流程
场景构建---此阶段主要是根据上一阶段计算得到的信息来构建一颗用于描述图表结构组成的场景树,场景树中的每一个节点是一个精灵,从功能上来看,精灵分为容器精灵和可视化精灵,容器精灵主要是用于组织场景的结构,一般为非叶子节点,而可视化精灵主要是用于承载可视化编码信息

场景布局---此阶段主要是实现图表中可视化元素的空间布局,主要解决的问题是如何在有限的空间资源条件下,既要满足空间属性的编码要求,也要满足审美上的需求。

应用视觉编码----颜色,形状,文本等非空间属性对人眼的刺激比较敏感,可作为可视化变量来编码信息。例如:


第39页

数据预处理
对数据进行排序、过滤、添加ID等;
计算默认配置参数;
解析用户配置字段,生成统一格式的配置信息;

第40页

数据预处理
对数据进行排序、过滤、添加ID等;
计算默认配置参数;
解析用户配置字段,生成统一格式的配置信息;

第41页

第42页

数据预处理
对数据进行排序、过滤、添加ID等;
计算默认配置参数;
解析用户配置字段,生成统一格式的配置信息;

第43页

数据预处理

第44页

场景构建
场景构建---此阶段主要是根据上一阶段计算得到的信息来构建一颗用于描述图表结构组成的场景树,场景树中的每一个节点是一个精灵,从功能上来看,精灵分为容器精灵和可视化精灵,容器精灵主要是用于组织场景的结构,一般为非叶子节点,而可视化精灵主要是用于承载可视化编码信息
精灵支持各种各样的属性设置。

第45页

应用视觉编码
本阶段主要设置除空间位置以外的视觉属性
空间位置,例如:scatter图
长度:Bar图
角度&斜率:Pie图,Line图
面积:Area图,Bubble图
体积,密度,颜色饱和度:热力图
色调:新闻图
当我们进行数据可视化时,我们会将量化信息编码进空间位置,形状,颜色等视觉属性当中去,用户在使用图表的时候再对各种视觉属性进行解码,研究表明,人对不同的视觉属性的解码精度是不一样的,精度从大到小:

第46页

设置交互
交互性是可视化中一个比较重要的功能,主要是为了帮助用户能够更方便,更精确,更加有针对性地了解和探索数据。提供友好的人机接口
Interactive visualization enables the exploration of data via the manipulation of a battery of chart images, with color, brightness, size, shape and motion of visual objects representing aspects of the dataset being analyzed.
These tools enable user to analyze data by interacting directly with its visual representation.
——Garnter                                                                                         
需求:1、人脑虽然具有很强的模式匹配功能,但是并不能对可视化属性进行精确地解码,存在较大的误差,所以也需要一个帮助有需要的人们来认识原始的,但也更精确的数据。
      2、当许多数据一起呈现在一个图表里面时,用户可能只对某部分数据比较关心,我们需要提供一个人机接口来给用户去选择自己感兴趣的数,也就是说,人和数据需要有互动;
而不是你被动的接受这样一堆数据,而是你可以主动的去和数据沟通,要他来回答你的问题。

第47页

自适应布局
在有限的空间资源条件下,尽可能地美观、完整地表达出数据信息
保证信息不失真

第48页

Examples
考虑一个笛卡尔坐标系的Bar图,当用户给定的区域大小大范围发生变化时,
如何确保布局的正确性?
当绘图区域发生变化时,需要考虑的问题:Bar的宽高如何变化,轴label的内容如何变化 X轴和y轴如何对齐


第49页

当绘图区域发生变化时,需要考虑的问题:Bar的宽高如何变化,轴label的内容如何变化 X轴和y轴如何对齐


第50页

当绘图区域发生变化时,需要考虑的问题:Bar的宽高如何变化,轴label的内容如何变化 X轴和y轴如何对齐


第51页

当绘图区域发生变化时,需要考虑的问题:Bar的宽高如何变化,轴label的内容如何变化 X轴和y轴如何对齐


第52页

当绘图区域发生变化时,需要考虑的问题:Bar的宽高如何变化,轴label的内容如何变化 X轴和y轴如何对齐


第53页

当绘图区域发生变化时,需要考虑的问题:Bar的宽高如何变化,轴label的内容如何变化 X轴和y轴如何对齐


第54页

Examples
考虑一个散图,当用户给定的区域大小大范围发生变化时,如何确保布局的正确性?

第55页

Examples
考虑一个饼图,当用户给定的区域大小大范围发生变化时,如何确保布局的正确性?

第56页

第57页

已知绘图区域的宽高,各个文本的宽高,求网格最大外接圆半径及位置。
已知文本的宽高及网格外接圆半径和位置,求绘图区域的大小及位置。

第58页

第59页

在NEV中还有各种各样的自适应布局,通过恰当的抽象都可以建立相应的数学模型。

第60页

如何描述空间资源的分布情况?

第61页

如何描述空间资源的分布情况?
可以精确描述空间资源的消耗情况,还可以用于交互时的场景管理,可以提高交互的性能

第62页

所有的布局问题都看作是在给定空间资源下对场景进行布局:
                     
空间四叉树
场景树
布局好的场景树
布局描述信息
空间四叉树
布局器

第63页

第64页

Future
丰富图表
增强自适应布局,
大数据时增加滚动条
实现一套可视化语法;
丰富底层的布局器;

第65页

Q&A
支持文件格式:*.pdf
上传最后阶段需要进行在线转换,可能需要1~2分钟,请耐心等待。