大数据可视化
- 来源:中国信息化周报 smarty:if $article.tag?>
- 关键字:大数据 smarty:/if?>
- 发布时间:2017-03-22 15:32
大数据的火热让大数据可视化炙手可热。在传媒、制造、医疗等行业领域,大数据可视化的应用正在或多或少、或深或浅地改变,甚至是重塑着这些行业。
近日Looker推出了LookVR,这款应用允许用户在虚拟现实的环境下探索数据,借助LookVR用户能够以前所未有的方式查看数据,是VR与数据服务的创新,也是一种数据可视化的新的呈现方式。
据了解,Looker是一个完整的数据平台,为企业的每个功能提供数据分析,并且可以轻松集成到每个领域的应用程序中,直接将数据导入决策。据了解,该公司正在为800多家行业领先的创新公司提供数据服务,例如索尼、亚马逊、经济学人、科勒、红牛等。
如今大数据可视化铺天盖地,不要以为听起来很潮,其实可视化是一个非常古老的东西。从欧洲中世纪开始人们就使用包含等值线的地图、海上风向的箭头图等,可视化发展的历史与测量、绘画与科技的发展一脉相承。在地图、科学制图、工程制图、统计图表中,可视化理念与技术已经应用发展了数百年。
进入18世纪,绘图师不再满足于在地图上展现几何信息,发明了新的图形化形式,例如等值线、轮廓线,以及其他物理信息的概念图。随着统计理论、实验数据分析的发展,抽象图和函数图被广泛发明,人类认识的提升带来了工艺设计的完善。19世纪上半叶采用统计图表来辅助思考的诞生同时衍生了可视化思考的新方式:图表用于表达数学证明和函数;列线图用于辅助计算;各类可视化显示用于表达数据的趋势和分布,便于交流、获取和可视化观察。
进入21世纪,随着大数据时代的到来,现有的可视化技术已经难以应对海量、高维、多源和动态数据的分析挑战,需要综合可视化、图形学、数据挖掘理论与方法,研究新的理论模型、新的可视化方法和新的用户交互手段,辅助用户从大尺度、复杂、矛盾甚至不完整的数据中快速挖掘有用的信息,以便做出有效决策,这门新兴的学科就称为可视分析学。
概括来讲,数据可视化是关于数据视觉表现形式的科学技术研究,其中这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量,它是一个处于不断演变中的概念,其边界在不断扩大。
它主要是指技术上较为高级的方法,而且允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。与立体建模之类的特殊技术方法相比较,数据可视化所涵盖的技术方法十分广泛。
由于数据可视化主要是借助于图形化手段,清晰有效地传达与沟通信息,就会很容易产生一些误区,例如数据可视化就一定因为要实现其功能用途而令人感到枯燥乏味,或者是为了看上去绚丽多彩而显得极端复杂。为了有效地传达思想概念,感官表现与功能更要齐头并进。通过直观传达关键方面与特征,从而实现对于凌乱而又复杂的数据集的深入洞察。
可视化新闻“独霸天下”,工厂可视化运营备受关注,可视化的健康管理、移动医疗方兴未艾……大数据可视化有哪些利器?未来我们可以做出怎样的展望?听本报记者娓娓道来。
应用篇
可视化新闻正“独霸天下”
“内容为王、用户主导”依旧是传媒业不可或缺的时代属性,但内在价值不变的前提下,重要的是外在形式的多样化。新一代电子信息传播技术正在以势不可挡的影响力颠覆传媒业,这是一场声势浩大的变革,不管是内容生产、传播媒体,还是舆论空间,都处于嬗变中。可视化是目前新闻采编实践中较为流行的技术手段之一。回顾一下去年的里约奥运会,《华盛顿邮报》的数据可视化奥运报道不得不让传媒界点一个大大的赞。据了解,为了让民众更好地参与、融入本届赛事,《华盛顿邮报》推出“可视化的里约2016”系列专栏,以数据地图、时间线、交互式图表、交互式查询界面、动图等数据为主,文字为辅的表现方式记录了奥运会的点滴。
数据地图与时间轴是数据可视化的重要表现方式之一,在地图上标注信息是灵活运用数据地图的重要方式。在世界地图上罗列出了那些以往举办过奥运会以及即将举办奥运会的国家,以不同的颜色划分地域,例如蓝色代表北美洲,绿色代表欧洲,橘色代表亚洲等;用形状区分奥运会类型,例如实心三角形代表冬奥会,实心圆代表夏季奥运会等,再配以时间线进一步说明奥运会举办的时间顺序,即保证了信息的详尽,又不失简洁、大方和美观。
在记录各国所获奖牌数量上,《华盛顿邮报》选择了交互式图表这一生动的表现方式。每个小人代表不同的国家,小人下方的三色小圆点由上至下分别代表铜牌、银牌、金牌,圆点的个数与所获奖牌的数量相等。该图表的交互性体现在,鼠标所到之处的小圆点会显示出对应的奖牌信息,例如点击美国最上方的代表铜牌的小圆点显示的是“举重:女子75千克举重,获奖者Sarah Robles。”
为了方便用户比较以及查阅,《华盛顿邮报》以地域、语言、人口数量等为标准将全世界的国家划分为16个组,例如欧盟国家、东亚国家、岛国、人口少于100万的国家、说英语的国家等,设立了交互式数据查询界面。在数据查询界面中,用户可以根据需求选择两个不同的国家组合。在鼠标选中的同时,窗口下方会出现所选组合对应的交互性图表信息:所获奖牌数以及包含国家的数量和名称等。交互式作品的优点在于不但可以扩大图表容纳的信息量,而且可以增强用户的参与度与体验感,赋予了新闻阅读趣味性。此外,我国也有很多媒体,包括各家报、刊、网、端平台也在越来越多地使用这一形式来呈现新闻内容。新闻可视化有很多优点:可以使信息的传播效率更高,可以再现摄影记者没能拍摄到的某些镜头,有些可视化图表比新闻稿和照片更加直观、简洁、易读,很多图表还具有较强的视觉冲击力。
“在大数据时代,数据新闻是数据和新闻的融合,是从数据分析中发现事实的报道。而可视化是其核心。”中国传媒大学教授、大数据挖掘与社会计算实验室主任沈浩对记者说。在沈浩看来,数据可视化本身就是数据分析,是一种数据手段,让读者感知我们想表达的东西,是科学和艺术的和谐统一。“有一种说法叫所有人都应该用数据说话。因为只有看得见我们才做得好,只有看得见才能做得到。”沈浩认为,如何使用可视化,核心是我们如何对数据进行理解,以及如何充分使用数据相关的技术。他还提出,在内容充分的前提下,可视化形式大于内容,可视化可以让内容更有说服力。“通过可视化,把人的社会关系、地理信息以及事件的属性融合在一起,可以让人们更好地感知这个社会,我们要从可视化的视角出发,让数据改变人们的心理模式。”
在北京大学信息学院信息科学中心副主任袁晓如看来,所谓可视化绝非形式好看那么简单。“好的可视化不能仅仅是一张漂亮的图片,或者说它从来不应该只是漂亮的图片。可视化首先必须具有功能性,脱离功能性便无从谈起。”袁晓如说。此外,袁晓如对记者表达了对可视化未来发展趋势的看法:“今天我们看到了各种各样的可视化类型,我们的目标是将来用户可以用成熟的工具把这些可视化在画板上直接画出来,越来越多的可视化将会为大众所使用,我们将会看到更多有趣的工具。”
可视化运营是如虎添翼 还是新式枷锁
近年来,产能过剩与利润偏低一直是困扰制造产业的“最深的痛”,但是随着工业物联网技术的快速发展,以工厂大数据为核心价值的智能工厂应运而生,而借助智能工厂平台构建的可视化运营管理更是使得智能工厂管理如虎添翼。运用可视化运营管理能否彻底打破目前工业制造业领域面临的困境?或者说可视化运营对智能工厂是新的枷锁?
什么是可视化运营管理?可视化运营管理是最近兴起的一种工厂管理的创新,是建立智能工厂的重要手段。简单来说,智能工厂可视化运营管理就是通过3D仿真虚拟动画库直观、实时地观测工厂各种智能设备运行情况、产品生产过程、物料消耗状态甚至物流运输状态等,然后根据实时数据显示做远程的智能化控制,进而通过可视化的数据分析帮助企业管理人员挖掘数据背后的价值,从而做出有效的决策。
3D可视化技术在可视化智能工厂管理中发挥着重要作用,深度参与生产过程质量控制,应用3D可视化技术深度参与控制设备实现对工艺参数的实时自动调整,可以提升产品控制精度,从而确保产品质量同质化和稳定性;降低人工技能门槛,扩展员工职业能力。标准化利于规范操作和维修,可视化的设备维修能够在2秒内精准定位设备故障点,利用系统提供的设备装配或拆卸图以3D动画的形式直接指导维修步骤,跟随界面显示可轻松完成任何类型的机械或电气设备故障维修;依托3D可视化技术,通过采集设备现场各生产设备的物料消耗数据,并将数据按照物料类别进行全车间机台排名,在2秒内可实现快速查询各机台的数据对比差异;通过设备零备件管理系统,在以3D装配动画中可以远程查询零配件的库存信息、生活周期值信息、性价比信息,帮助企业管理人员提前制造采购计划等。
另外,不得不提的还有可视化布局全景。可视化运营管理由可视化智能设备、可视化智能管理和可视化智能服务构成,可视化智能设备是具有感知、分析、推理、决策、控制功能的制造装备,它是先进制造技术、可视化技术、智能技术的集成和深度融合。三维可视化动态设备管理平台对企业智能工厂地形地貌、建筑、车间结构、设施设备等几何建模,直观、真实、精确地展示各种设施、设备形状及生产工艺的组织关系,设施、设备的分布和拓扑情况,使用户在电脑上就可以浏览整个企业现场,如同亲临现场。
同时,系统将装置模型与实时、档案等基础数据捆绑在一起,实现设备在三维场景中的快速定位与基础信息查询。对在建工程、设备安装等进行三维建模,并把三维场景与计划、实际进度时间结合,用不同颜色表现每一阶段的安装建设过程;建立设备台账及资产数据库,并和三维设备绑定,实现设备台账的可视化及模型和属性数据的互查、双向检索定位,进而实现三维可视化的资产管理,使用户能够快速找到相应的设备以及查看设备对应的现场位置、所处环境、关联设备、设备参数等真实情况。
有平台采用GPRS+PDA+RFID技术方案,巡检任务从制定、分配、下发、接收、执行、考核等都可以远程控制、无线实时同步,从而实现巡检过程可视化、简捷化、规范化、智能化管理,使用户及时发现设施缺陷和各种安全隐患。按照巡检工作的程序,动态地收集和管理相应数据,强化巡检计划的监控力度,提升管理水平。监控人员通过实时监控功能,可以掌握当前所有巡检员的状态,并可以选择任意一个在线巡检员查看实时位置和巡检信息,选择查看任意一天或一段时间内任一巡线员的历史轨迹,并可动态回放历史轨迹。
有的平台还可以对企业重点设备进行在线信息采集、报警、控制等管理。采集与监控方面重点对设备的温度、湿度、转速、振动、开关等实时信息进行采集和分析。当工作条件出现异常时,可及时显示、报警。另一种是事故报警,包括非操作引起的断路器跳闸和保护装置动作信号,普通报警包括一般设备状态变化、遥信状态异常信号、模拟量越复限、节点或链路状态、遥控操作、保护操作、电压合格率、VQC功能、小电流接地选线等功能中的报警。系统能够对各类报警进行分类管理,自动推出报警提示及定位到三维场景相应的设备上。同时伴随着不同音响警报,并支持向指定人员手机发送报警信息,使用户及时捕获到运行风险或潜在风险,同时可通过三维动态方式指导过程处理。远程控制可实现远程控制设备的启停、调整等,同时能在环境非正常的情况下自动或远程人为地控制各种环境调节设备(如空调、通风设备等),使工作环境恢复正常。
智能工厂平台,快速地搭建三维可视化动态设备管理应用,可显著降低资本支出和运营支出,减少因非计划停运造成的收入损失,实现智能工厂安全运营。在智能工厂整个生命周期内的关键工作流程中,用户大大受益于动态基础数据和其它信息系统的协作功能,其建立和应用可以提高工厂运营和维修的效率,提高工厂整体的管理水平。
智能工厂可以实现硬装备智能化、生产过程可视化、制造管理精益化、指挥调度数字化,全方位提升企业核心竞争力,推进智能制造发展。而对于智能工厂来讲,可视化运营管理绝不仅仅是锦上添花,它是作为促进智能工厂落地的重要管理创新手段。不置可否无论是工业物联网,还是可视化运营对于智能工厂来讲,都不再是伪命题,可视化运营管理工厂可以以低成本实现智能工厂安全、可持续生产、运营、维护和管理,进而打破工业领域的传统工作模式,突破重重困境确保盈利能力和长期生存能力。
数据可视化接盘 医疗如何搞定
国外媒体VentureBeat曾经撰文讲述了移动数据可视化技术是如何帮助减少93%的疟疾病例,接下来该技术可能将会被用于消除寨卡病毒。有3.6万户家庭(初步估计该数字还在不断增加)应感谢移动数据可视化技术拯救了他们,带来了新的生活的希望。
如今“精准医疗”的提出让越来越多人将目光投向移动医疗领域,如何提升用户体验,建立自身特色,进而产生用户黏性成为移动医疗是否能够快速发展的重中之重,许多案例都表明优秀的数据可视化设计在这其中所起到的促进作用。
构建移动医疗数据可视化,首先需要分析传递数据的目的。举例来说,一款针对糖尿病患者的慢性疾病管理APP的血糖数据呈现,可以通过数据的呈现告知用户血糖控制情况,引导用户进行更好的血糖控制;或者是通过数据的合理表现缓解用户在控制饮食中的抵触情绪,进而达到激励用户的目标等,完成通过目标寻找需求的过程。
随着大众对于自我健康管理的重视,移动医疗应用应以面向消费者、患者的健康应用为主,全面调研目标用户的生理心理状态、生活状态、使用情境、预期目标、核心行为等,结合用户群特点建立用户模型,进而制定合理数据可视化目标。
众所周知,“传递信息,而不是数据。”是指界面设计的出发点以及落脚点并不是简单的数据呈现,而是完成对用户的引导,让用户接收到所表达的重要信息。
移动医疗应用中每天都会有上百条的数据被记录,设计师不可能在移动端呈现每条数据,所以合理分析所需表现的数据,制定优先级是至关重要的。换句话说就是对收集到的多项数据指标进行排序,判定哪些数据是需要着重展现的核心,哪些数据是辅助,哪些数据不需要展现等。
以Nike+为例,Nike+是一款专为跑步者设计的运动管理型应用,通过移动端配合可穿戴硬件可以获得的用户数据包括:跑步时间、跑步距离、跑步速度、运动心率、热量消耗值、运动排名、运动次数及其他各项统计数据。在用户运动过程中的数据可视化目标是让用户可以直观地看到自己本次跑步的信息,所以核心数据便是此次跑步的里程数,辅助信息为速度、时间及用户当下心率,而类似排名、次数这类统计数据便不再进行展示。
文字和图表是常见的表现数据的手段,现有医疗健康类APP主要使用图表来实现数据可视化,相对于单纯的文本而言图形化的表现形式更能抓住人们眼球和注意力,同时更能展现数据中蕴含的趋势及含义。
每一种图表都有它适宜表现的数据种类,明确其使用场景才能够选择合适的图表。精准表达数据,提升用户的浏览效率,可以根据所需表现的具体信息特点,对这些常见图表进行变化与组合。不仅可以创造出更适合的图表形式,降低用户的认知成本;还可以用全新的图表形式带给用户很强的新鲜感。
由于与用户产生直接接触的是最终的设计界面,所以数据可视化的效果与细节刻画密切相关。所谓细节刻画是指从视觉设计的角度对所选择的表现形式进行修饰,既能吸引眼球,创造产品特色,又能让用户关注到真正所需要表现的信息本身。
从具体的视觉元素来看:色彩在移动端的设计中合适的配色是成功的一大半。在表现移动医疗数据时,配色数量不可过多,在同一图表中的用色不要超过三种,需做好层次区分,明确主色调与辅助色,并选择饱和度和明度较高、辨识度较高的颜色作为点缀色,来引导用户视觉流,营造产品特色。
由于人类的大脑更容易接收和理解图形化的信息,在视觉可视化设计中应尽量使用图标来代替文字完成数据信息的传达,以降低用户的理解成本。但相较于细节刻画更真实的三维图标,在展现数据信息时尽量使用扁平化的图标,简洁的设计可以让用户更加专注于数据所要表现的具体信息。考虑数据呈现的节奏和用户界面的交互效果,在设计中可以对关键信息添加动态效果,引导用户的视线走向的同时,给用户带来愉悦感。
工具篇
大数据欲善其事 得先利其器
古语有云:工欲善其事,必先利其器。好工具可以大大提升工作效率,有效改善管理方式。由于人类大脑在记忆能力方面的限制,利用视觉获取的信息量多于感官。在大数据与互联网时代,企业从传统的流程式管理方式过渡到基于数据的管理方式将会成为必然的趋势。对此数据可视化能够帮助其对数据有更全面的分析与认识,让数据的呈现更及时、直观、简单。
为何SAS如此风靡
SAS是由美国NORTHCAROLINA州立大学在1966年开发的统计分析软件。1976年SAS软件研究所成立并开始进行SAS系统的维护、开发、销售和培训工作,虽然其间经历了许多版本并经过多年来的完善和发展,SAS系统在国际上已被誉为统计分析的标准软件,在各个领域得到广泛的应用。
“SAS大部分产品与解决方案应用于特定业务领域,还有一些则可用于满足更广泛的需求。我们的客户受益匪浅,可以说几乎所有客户在使用SAS高级分析后都能增加营收,改善业务流程,降低成本。”正如SAS分析全球市场总监Sascha Schubert所言。
近年来大数据已然成为商业变革的重要推动力量,并作为重要的生产力上升至国家战略。大数据的蓬勃发展为各个机构带来了前所未有的机遇,但如何将这些海量、多样的数据资源转化为真正的价值,SAS大数据分析则是唯一的答案。SAS作为数据管理、数据分析与商业分析的有力工具,目前已广泛运用于金融,保险,快消,医药、政府和教育等行业。在全球52个国家设有400多家分支机构及三大研发中心,每年的产品研发投入为当年营业额的24%,是业界平均水平的两倍以上。SAS公司早在1990年开始进入我国市场,在北京、上海、广州、香港和台北均设有分支机构,并在北京设立了用户服务支持中心,其中国家信息中心、国家统计局、卫生部以及中国科学院等都是SAS系统的用户。
具体来说,SAS是一个模块化、集成化的大型应用软件系统。它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等。
对于企业的优势在于可将数据汇总、分析和报告功能集中在一个透明框架内,并最终提供一个完整的、E2E的解决方案。其中Base SAS模块是SAS系统的核心,负责数据管理,交互应用环境管理,进行用户语言处理,调用其它SAS模块。Base SAS 为SAS系统的数据库提供了丰富的数据管理功能,还支持标准的SQL语言对数据进行操作,能够制作从简单列表到比较复杂的统计报表,进行基本的描述性统计及基相关系数的计算等。
SAS把数据存取、管理、分析和展现有机地融为一体,功能强大,统计方法齐备全新。SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进、可靠。分析方法的实现通过过程调用完成,许多过程同时提供了多种算法和选项,其强大的功能尤其受金融类与医药类行业的青睐。
例如欺诈和金融犯罪是目前金融领域面临的最大问题和挑战。为了解决这个棘手的问题,很多金融机构选择欺诈管理解决方案,面对众多供应商以及产品该如何选择?相关资料显示,Forrester Research对符合入选标准的供应商的欺诈管理解决方案进行了详细的实操实验评估,根据15项要素对这些解决方案进行评估打分,结果SAS高居榜首,成为现有产品的领导者,还在其战略和市场表现分项中获得了所有厂商中的最高分。
Chartis采用RiskTechQuadrants排行榜进行评比。这种专门为风险控制技术市场开发的评估方法基于广泛的独立调查,通过明确的评分体系对调查结果进行打分。同样在企业级欺诈管理解决方案风险技术象限报告中,SAS位居第一,被评为行业领导者。SAS还以反洗钱(AML)与交易监测解决方案,尽职调查(KYC)以及客户端登录解决方案,还包括观察名单监控解决方案,被评为风险技术象限的领导者。
Tableau:
当互联网医疗遇见大数据分析
近年来,在全球化的市场竞争的大背景下,商业智能已经成为热门技术,企业对精细化管理、定量分析、风险控制等业务越来越重视。Tableau 是桌面系统中最简单的商业智能工具软件,不用强迫用户编写自定义代码,新的控制台也可完全自定义配置。在控制台上不仅能够监测信息,而且还可以提供完整的分析能力,灵活且具有高度的动态性。Tableau软件的研发最早源于美国国防部(DOD)在斯坦福大学的一个研究项目,目的就是为了提高实现数据和信息的分析能力。
随之诞生的Tableau公司将数据运算与美观的图表完美地嫁接在一起。它的程序很容易上手,各公司可以用它将大量数据拖放到数字“画布”上,转眼间就能创建好各种图表。这一软件的理念是界面上的数据越容易操控,公司对自己在所在业务领域里的所作所为到底是正确还是错误,就能了解得越通透。
早在18世纪,南丁格尔便开始用可视化的数据来证明英国士兵之所以在克里米亚战争中的死亡率居高不下,并不是因为战争本身的伤亡较大,而是因为战地医院糟糕的治疗环境。当人们询问她为什么要用图来展示士兵的死亡率,她说她希望能够通过眼睛来传达没有能够通过耳朵传达到的信息。的确,在很多时候,眼睛看到的都能够比耳朵听到的更具有说服力和震撼力。我们列举一个Tableau在医疗方面的例子加以说明:
病人对于一个医院的印象往往都来自于急诊的接待情况,所以医院必须要确保服务能够满足病人的要求,所以利用医院已有的数据来分析,简化分流的步奏就会显得很重要。这样既能够保证在急症过程的每一分钟都能得到有效利用,也让病人与家属都能有一个良好的诊疗体验。
Tableau通过分析病人到达时间等数据,可以清晰看到病人每天、每小时的来院情况,这能够让医院适时保证足够的值班人员,并合理分配医疗资源。Tableau还能帮助建立急诊科患者的个人档案,通过分析出的医院急诊科的应诊能力,在病人数量达到极值时做出反应和措施。
据估计,超过50%的患者信息都被杂乱地保存,这使得开发利用这些重要的数据变得十分困难。而在Tableau的帮助下,医生可以很方便地查阅病人的医疗记录等相关信息。Tableau极大地增强了患者信息的可视化程度,方便对医疗记录和患者信息进行统一管理和访问。通过对患者的住址、治疗进展以及其他深入到病人的详细记录的分析,Tableau可以为各级医疗卫生服务人员提供相关建议,帮助分析和改进服务。
等待时间长最有可能引起患者的不满情绪,追踪一个病人从被接待到接受诊疗所花费的时间可以让医院采取有效的措施,减少病人的等待时间,提高服务的满意度。Tableau可以追踪病人诊疗期间的等待时间等数据,制定计划改进诊疗流程以减少患者在候诊室的等待时间。
此外,医疗保险支出的情况是一个国家的重大问题。Tableau可以提供可视化的图表,分析医疗保险支出的区域分布,每个患者的平均医疗保险支付差异,还可以看到不同的保险公司的价格差异以及地区差异,根据颜色不同理解不同地区医疗保险费用不同的原因。医院和保险公司都需要了解在一定的人群中有什么流行疾病、什么年龄段的人更容易受到感染、治疗的成本等情况。Tableau可以帮助医疗保险公司评估特定申请人的患病风险等级,分析申请人最可能患的疾病以及相对应的治疗费用,得到这些分析结果后,保险公司就可以选择制定相应的保险方案。
R语言:
一种环境,一种现状的描述
R语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发(因此称为R),现在由“R开发核心团队”负责开发。R作为一套完整的数据处理、计算和制图软件系统,其功能包括数据存储和处理系统、数组运算工具(其向量、矩阵运算方面功能尤其强大)、完整连贯的统计分析工具、优秀的统计制图功能、简便而强大的编程语言、可操纵数据的输入和输出并可实现分支、循环以及可自定义功能。
与其说R是一种统计软件,还不如说是一种数学计算的环境,因为R并不仅仅提供若干统计程序,使用者只需指定数据库和若干参数便可进行一个统计分析。主要是可以提供一些集成的统计工具,但更大量的是它提供的各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。例如,澳门特别行政区政府统计普查局网站获得2006年1月到2015年10月澳门通货膨胀率数据,分析结果最大值为9.49,最小值为-1.03,平均值为5.161,中位数为5.42。从数值上看,澳门近十年来的通货膨胀率变化趋势较为明显,通货膨胀率的2个峰值9.49、-1.03分别发生在2008年3月、2009年9月。此期间的一年半内澳门通货膨胀率迅速从波峰到达波谷,变化10.52。
又比如横向描述澳门通货膨胀率的趋势,分别从中国国家统计局网站、珠海统计调查信息网网站、香港特别行政区政府统计处网站、澳门特别行政区政府统计普查局网站收集2011年1月到2015年10月通货膨胀率数据(中国内地通膨数据含广东省,广东省通膨数据含珠海市),其中绿色实线代表澳门,蓝色代表香港,红色代表中国内地,绿色代表广东省,黑色代表珠海市。继而得出结论:横向对比周边地区近5年来通货膨胀率总体走势,澳门通货膨胀率的走势始终处于高位,故波动不大,从整体趋势不容易看出与其他地区的连动性或关系,因此还需进一步分析。当然R在统计学上的应用不胜枚举,但毕竟其只是一种辅助工具,要想深入解决问题,还需要大量的其他辅助条件。
畅想篇
未来 我们还可以怎样可视化
人们坚信大数据可视化依旧会如火如荼地发展,但在迅速发展的过程中我们可以获取到一个关键信息:利用信息学来整合复杂数据的收集、分析和可视化,并从数据中获得价值。数据可视化不仅仅是可见,更要求可控性。
视图整合
探索不同维度的数据关系
通过专业的统计数据分析系统设计方法,理清海量数据指标与维度,按主题或者成体系呈现复杂数据背后的联系;将多个视图整合,展示同一数据在不同维度下呈现的数据背后的规律,帮助用户从不同角度分析数据、缩小答案的范围、展示数据的不同影响。具备显示结果的形象化和使用过程的互动性,便于用户及时捕捉其关注的数据信息。
所有数据视图交互联动
将数据图片转化为数据查询,每一项数据在不同维度指标下交互联动,展示数据在不同角度的走势、比例、关系,帮助使用者识别趋势,发现数据背后的知识与规律。
除了原有的饼状图、柱形图、热图、地理信息图等数据展现方式,还可以通过图像的颜色、亮度、大小、形状、运动趋势等多种方式在一系列图形中对数据进行分析,帮助用户通过交互,挖掘数据之间的关联,并支持数据的上钻下探、多维并行分析,利用数据推动决策。
强大的大屏展示功能
一个良好的大数据应用环境,是要从推开门那一刹那开始体验的。随着综合指挥运维中心和大屏幕的普及与常态化,越来越多的用户希望通过可视化手段提升数据使用体验。2017年,大屏可视化将继续发挥助力作用,推动大数据在各行业的应用。
支持主从屏联动、多屏联动、自动翻屏等大屏展示功能,可实现高达上万分辨率的超清输出,并且具备优异的显示加速性能,支持触控交互,满足用户的不同展示需求。
可以将同一主题下的多种形式的数据综合展现在同一个或分别展示在不同的几个高分辨率界面内,实现多种数据的同步跟踪、切换;同时提供大屏幕触控屏,作为大屏监控内容的中控台,通过简单的触控操作即可实现大屏展现内容的查询、缩放、切换,全方位展示企业信息化水准。
有洞察力的
数据可视化分析工具
有洞察力的数据可视化分析工具可以更好助力企业IT管理、资产管理等,有效的可视化管理平台包含多个通用可视化工具组件,可以方便为客户提供多种组合服务,更好地展示仿真可视化系统、搭建虚拟数据中心、基于VDC实现集中可视化管理、三维可视化、直觉化交互操作、资产可视化管理、配线可视化管理、动力环境可视化管理、安防可视化管理、IT系统可视化管理、巡检可视化管理、统计报表、展示管理等强大功能。
相关链接
在医疗界,移动终端正颠覆临床医生使用技术的观念,引发了事业与生活平衡的问题,并对医院的信息技术带来了正能量,有效带动了相关领域的研发与突破。
所谓智能医疗,从大范围的定义来说,有医院的信息化(包括电子病历、电子处方、电子化流程、电子查房等系统)、医疗信息的互联网化(包括各类很火的寻医问药的网站、APP应用等)、药剂医疗设备的物联网化(药品/血液/器械等RFID管理等)、远程健康监护乃至远程医疗等。
医院信息化、医疗信息互联网化、药剂医疗设别的物联网化、远程健康监护以及远程医疗等智能医疗在大数据的促进下,如火如荼的发展中,也正充满生机地不断进步并完善。
因而,通过利用大数据可视化数据分析工具和机器学习中的最新突破性技术,医疗机构的管理者们可以把孤立的数据集融汇成统一的数据流,从而揭示患者总体情况,并了解医护人员的整体水平。
记者手记
众所周知,数据是非常强大的。当然如果能够真正理解它想告诉你的内容,那它的强大之处就更能体现出来。通过观察数字和统计数据的转换以获得清晰的结论并不是一件容易的事,必须用一个合乎逻辑的、易于理解的方式来呈现数据才好。
数据可视化将数据以视觉形式来呈现,如图表或地图,以帮助人们了解这些数据的意义。人类的大脑对视觉信息的处理优于对文本的处理,因此使用图表、图形和设计元素,数据可视化可以更容易地解释趋势和统计数据。
对比之下,文本形式的数据很混乱(更别提有多空洞),而可视化的数据可以帮助人们快速、轻松地提取数据中的含义。用可视化方式充分展示数据的模式,趋势和相关性,而这些可能会在其他呈现方式中难以被发现。
如今,数据可视化可以是静态的或交互的。几个世纪以来,人们一直在使用静态数据可视化,如图表和地图。交互式的数据可视化则相对更为先进:人们能够使用电脑以及移动设备深入到这些图表和图形的具体细节,然后用交互的方式改变他们看到的数据及数据的处理方式。
无论是对大数据可视化分析的追根溯源,还是从应用与工具中探索其中的奥秘,我想都无法离开对现实规律的最根本认知:避免误区就会用得更好。
大多数人并不关心可视化的过程中所涉及到的数据总量的多少,更多是在意数据被可视化分析后是否更接近企业应用需要的初衷。同理,显示错误的数据与显示无用的数据危害存在一致性,数据是否干净清晰对决策很关键,一处数据的错误会影响整体的分析以及决策过程。
很多时候由于特殊形式的表格不常见,人们在追求美化数据的过程中必然会离分析数据的真相越来越远。我们需要什么?关心什么?做到这些被要求了什么?明确这些问题或许就可以进行有效的大数据可视化分析了。
本报记者 刘晶晶