第三课:什么是数据可视化
导语:本节课黄志敏会跟我们聊聊数据可视化。
正文:
数据可视化的优秀表达
讲数据可视化,绕不开有几个很典型的作品,例如说像这个是一个非常非常著名的作品,就是关于拿破仑的,他是用这个图,讲的是拿破仑怎么从华沙一直往东打到莫斯科,最后失败的这么一个过程。那么我们能看到,这个箭头,这个路径,从这儿走,走到这儿再回去,这是去程,然后这个线条的宽度代表他军队的人数,所以你能看到他最后几乎是全军覆没的,他在失败的过程中,气温起了非常重要的作用,因此就是底下还画了一个气温的曲线图,然后跟上面对应起来,这样能帮助大家很好的理解,所以像这样的东西,才可以叫做真正的叫一图读懂。我们现在经常看到很多一图读懂,其实不是图,只是把文字拆开了,摆在不同的位置,仅此而已,这才叫一图读懂。
我们再看另外一个很著名的作品,这个作品叫南丁格尔玫瑰图,之所以叫这个名字,因为他做的是南丁格尔,南丁格尔也就是那个护士南丁格尔,因为他不仅是个护士,还是个统计学家,也是最早做数据可视化的人。一八五几年的时候,发生了克里米亚战争,英国、俄国什么在克里米亚半岛打仗,然后南丁格尔跑到陆军部,调取了伤亡数据,然后画了很像一朵玫瑰花的这样的一种扇形图,然后告诉大家说,你看这个在战场上因为照顾的不好死去的人远远多过直接被打死的人,后来促进了现代护理行业的发展,促进了战场护理的发展等等等等,所以起了非常非常重要的作用。
数据可视化的分类、形式、用途及场景
首先来讲,可视化他可以分为三类,第一类叫科学可视化,第二类叫信息可视化,第三类叫可视分析。科学可视化,指的是用图形来展示一些自然科学的数据,像地图、卫星云图,我们到医院拍脑电图、心电图,CT等等,这些都属于科学可视化的范畴。第二类是叫信息可视化,信息可视化指的是用图形来展示一些抽象的信息,像我们在路上见到所有的交通标志,其实都属于信息可视化,他画一个图形告诉你,说这里禁止左转,那里限速60,禁止停车等等,这都属于信息可视化。第三类可视分析,是用这个图形来帮助我们分析数据,最常见的我们用excel去画各种数据,对吧,或者说K线图,这种都是典型的可视分析,其实可视化是无所不在的,我们随便看看像这个,这个表盘就是个可视化,他用两根指针,用一些刻度就能够让你快速的理解现在是几点,对吧,这个是一个很典型的可视化。或者说甚至像这种,一个商标,这也是一种可视化,因为他把他变成了一个视别系统,包括像我们这种开关面板上面有一个太阳,就代表说在加热,画个雪花代表制冷等等,这都是很典型的可视化。甚至二维码,二维码也是很典型的可视化,把一些文字信息可能是地址,可能是链接,可能是电话号码等等等等这些东西,转化成一个二维码这样的一个图形,所以这个也是很典型的可视化,所以可视化是无所不在的。
可视化他的主要形式有很多种,我们只说其中常见的三种,第一种信息图,静态的,像我刚才讲的那个拿破仑的那个或者南丁格尔都属于静态的。互动图表是在网页上去实现的,这个要通过写网页代码,把他实现出来,是可以操作互动的,还有第三类可视化视频。
从用途上来讲,很多很多用途,像例如说商业智能,商业智能我们一般管这种叫BI,在企业内部一般我们会用BI去帮助我们去分析数据,然后数据新闻不用讲,像数据展示,像一些大屏的展示,例如说我们看天猫双十一的晚会上面,他经常会用到这种大屏展示的形式,其他做品牌宣传等等,这种东西都非常非常的常见。
那其他的话例如说我们还可以看到,例如说像企业,所以他的使用场景,例如说企业也很多,媒体也很多,政府等等等等,都会需要很多,所以这个他其实他的使用场景是非常非常广的。只不过现在大家发现了一个什么问题呢?就是说现在发现其实很多媒体,他发现他需要做这个,他这个事解决不了,这个是现在很常见的问题,其实你要解决这种问题,不外乎就几种,第一、你如果有条件,你媒体就自己去建这样的一个团队,去建自己的数据新闻团队,如果你没有团队,你就去找第三方合作,一起合作把它做出来。
为什么我们要做数据可视化呢?因为数据可视化它的好处是,他传递信息非常的快,人眼传递图形信息的速度是传递文字信息速度的一百倍,而图形他很多时候,能够帮助我们跨越这个文化的界限、语言的界限等,非常非常的快和方便。
大数据与数据可视化的关系
那么这里头我们要解释清楚,就是一些概念上的东西,例如说不要把大数据和数据可视化混为一谈,数据可视化也可以是来可视化小数据,其实我前面举的很多例子,那都涉及小数据而不是大数据。大数据跟数据可视化之间是一个什么样的关系呢?
我给大家举个例子,大家会很容易理解。这个图的形状,这种样式叫热力图,我想大家可能都能够理解了,对吧,然后这个图画的是什么呢?是14年12月31号晚上上海外滩的人口分布,那我们都还记得,那天晚上后来发生什么事情对吧,发生了踩踏事故,你如果看这个人口分布的话,你就会发现说,你看人口在什么地方多,你会发现说,好,我们都知道这个黄色的地方人多,里头红色的人更多,红色的里头如果有黑色的地方人会更多,所以你能在这里头找到一些人口密集的区,而最密集的显然是在江边,然后这其中最密集的又是在陈毅广场,也就是最后发生踩踏的地方。如果当时在场的人能够看到这么一张图的话,可能他们就会有效的去避免,避免去太拥挤的地方,能够避免这种惨剧的发生,这样一个图是根据什么画出来的呢?这样一个图是根据在场十几万人的坐标画出来的,十几万人的坐标,我们当然可以把它称之为大数据,但是你把十几万人坐标打印出来,会是什么情况?得厚厚的这么一本,第一你看不完,第二你看完你也不知道他什么意思,你也理解不了,但是你把这些坐标把它转化成这么一个热力图的时候,大家所有人在几秒钟之内,就能够看清楚,他这里头他的人口分布的情况和特征是什么,所以我说,这个数据可视化是做大数据分析的一个重要工具,或者说一个非常接近是一个必备的工具。
做大数据研究一定会用到数据可视化,但是做数据可视化,不一定是大数据也可以是小数据,所以我们可以把它的关系区分清楚,因此数据新闻不等于大数据新闻,很多时候我们做数据新闻是基于小数据来做的,我们真正有机会去接触大数据,有能力处理大数据的机会的这种时候并不太多,大部分人没有能力去处理大数据,我们一般都处理小数据,而大数据你也很难拿到。
第三条,H5不等于数据新闻。H5是什么?H5是HTML5的简称,HTML是一个用来写网页的语言,HTML5是HTML的第五个版本,仅此而已。HTML它有很多新的特性,到第五个版本他有很多新的特性能帮助我们做很多交互性很强的,或者说很多那种多媒体的网页,能做很多很好的效果。所以理论上来讲,他在电脑上也能做出很好的效果,在手机上也能做出很好的效果,那为什么在手机上很流行,在电脑上不流行呢?原因是因为在电脑上浏览器的种类很多,然后它又有很多版本,这样的情况之下,你就很难做出一个网页,在不同的电脑上面能呈现同样的效果,兼容性很难解决,因此HTML5在电脑上流行的不广,但是他在手机上流行的非常广,为什么呢?手机咱们现在一共就俩平台,一个叫苹果一个叫安卓,这俩平台对HTML5的支持都非常好,所以你很容易做出一个网页在每一台手机上的效果是一样的,因此他在手机上就非常的流行,然后大家为了省心,尤其是做营销的公司,他为了容易传播就管它简称叫H5,所以H5你可以做各种各样的融媒体作品,做各种各样的交互,做各种各样的多媒体作品,那么你也可以做营销什么之类的,你也可以拿来做数据新闻,但是他不等于数据新闻,他只是一个载体,他就是一个载体,我们把这个了解完以后,我们要学会欣赏数据可视化。
【版权归钛媒体所有,未经许可不得转载】
账号合并
经检测,你是“钛媒体”和“商业价值”的注册用户。现在,我们对两个产品因进行整合,需要您选择一个账号用来登录。无论您选择哪个账号,两个账号的原有信息都会合并在一起。对于给您造成的不便,我们深感歉意。
Oh! no
您是否确认要删除该条评论吗?