数据中台数据中台
申请试用
新闻动态
了解袋鼠云最新动态
新闻动态>「数据可视化」根据时变数据可视化方式的科学研究>
「数据可视化」根据时变数据可视化方式的科学研究
202115|文章来源:-

「数据可视化」根据时变数据可视化方式的科学研究,时变型数据信息是一种伴随着时间转变、含有时间属性的数据信息。在具体运用中,时变型数据信息总数大、层面多、自变量多,并且种类丰富多彩,遍布范畴普遍,特别是在各种传感器网络、移动互联运用中,以流方式形成的流数据是一类独特的具备无尽长短时间轴的时变型数据信息。文中剖析了时变型数据信息的內容、特点以及可视化的类型,从三个层面对时变型数据信息的可视化方式 开展梳理和汇总。

「数据可视化」根据时变数据可视化方式的科学研究,时间具备时间具备十分关键的纬和属性。伴随着时间转变、含有时间属性的数据信息时变型数据信息(TemporalData)。从宏观经济上看,时变型数据信息类可分数值型、层次性和类型性三类。在其中,随意2个井然有序型数据信息都具备某类次序关联,而标值型数据信息可当做某类有实际标值的井然有序型数据信息。据调查1974-1980年全世界的15种报刊和杂志期刊上发表的4000个图象结合的75%全是以时间编码序列排列的。。

1.时间属性的可视化

假如将时间属性或次序性当做轴自变量,那麼每一个数据信息案例则视作轴上某一变量类型相匹配的单独恶性事件,对时间属性的描绘有三种方法:

(1)线形时间和周期时间时间:线形时间假设一个立足点并界定为从以往到未来数据信息原素的线形时立足点并界定为从以往到未来数据信息原素的线形频域。

(2)时间点和时间间距:离散变量时间点将时间叙述为可与离散变量的室内空间欧拉点相对性等的抽象化。

(3)次序时间、支系时间和多方面时间:次序时间域考虑到这些按依次产生的恶性事件。针对支系时间、多芯时间支系进行,这有益于叙述和较为有可选择性的计划方案,这类种类的时间适用作出只有一个挑选产生的管理决策全过程多方面时间能够 叙述超过一个有关被观查客观事实的见解。

不一样类型的时变型数据信息需选用不一样的可视性方式 不一样类型的时变型数据信息需选用不一样的可视性方式 来表述。规范的显示信息方式 是将时间数据信息做为二维的曲线图显示信息,x轴表明时间,y轴表明别的的自变量。这类方式 擅于主要表现数据信息原素在线形时间域中的转变,可是无法表述时间的规律性。时间编码序列还可以沿圆上排序,选用螺旋式图的方式 合理布局时间轴,一个控制回路意味着一个周期时间,挑选恰当的排序周期时间能够 呈现数据的规律性特点。除此之外,为了更好地反映时变型数据信息的规律性构造能够 选用环形表明某时间段内的时间构造。类似叙述型小说集,时变型数据信息中蕴含的信息内容存有支系构造,对同一个恶性事件也很有可能存有好几个视角的描绘。依照时间组织架构,这类可视化可分成线形、流状、树形结构、图状等种类。

(4)线形多方面时间可视化:为了更好地展现一个详细的恶性事件过程和社会行为(如个人健康纪录、历史大事件等),可选用类似甘特图(用条形图表进展的可视化标示方式 )的方法,应用好几个条形图进程主要表现时间的不一样属性随时间转变的全过程,线框的色调和薄厚都能够编号不一样的自变量。

流状支系时间主线任务可视化根据江河的可视性暗喻可呈现时钟频率型恶性事件随时间造成流动性、合拼、分岔和消退的实际效果,这类实际效果类似小说集和电影中的叙述主线任务。比如,开发软件中分工协作的演化类似电影中的人物角色。每一个开发者在开发设计全过程选用一条线表明,当2个程序猿另外开发设计同一个控制模块的情况下,她们的线框合拼。

2.多自变量时变型数据可视化

多自变量时变型数据信息是具体运用中普遍的数据。因为存有好几个自变量,可视化必须兼具数据信息自身属性和数据的次序性,融合数据统计分析的方式 呈现和发掘次序性数据信息的规律性。这一步骤与可视化的基础步骤—“全局性引言;显示信息关键一部分—放缩和过虑;按要求显示信息关键点,进一步剖析”相符合,梳理为三类基础方式 ,即数据抽象、数据信息聚类算法和现状分析。

高维空间抽象性的时变非空间信息一般 蕴含宏观经济的、结构型的、随时间转变的规律性。将时变编码序列中的每一个数据信息取样点联接,原时变编码序列构成一条在高维空间的线,在低维空间可视化这根线可表明高维空间的时间编码序列演变发展趋势根据线表明的可视化有三个基础流程。

第一步:高维空间曲线图取样,取样的頻率由客户互动特定。

第二步:将取样后的高维空间曲线图按段,便于描绘每段曲线图的特点,小段中间能够 重合。

第三步:用主元分析方法将高维空间曲线图投射到二维空间,显示信息和科学研究曲线图特点。

立即可视化规模性的时变型数据信息无法展现其所有关键点,因而必须设计方案适合的互动方式 主要表现关键的地区。

3.流数据可视化

流数据是一类独特的时变型数据信息,键入数据信息(所有或一部分)并不储存在可任意浏览的硬盘或运行内存中,只是以一个或好几个“持续数据流分析”的方式抵达。普遍的流数据有移动通信技术日志、数据网络(日志、传送数据包报警等)、性能卓越群集服务平台日志、感测器互联网纪录、金融大数据(如股市)、社交媒体数据信息等,解决流数据与传统式的数据信息池解决方式 对比有下列特性:

(1)数据流分析的潜在性尺寸或许是无尽的。

(2)数据信息原素线上抵达,必须并行处理,不然数据信息的使用价值随时间的消逝很有可能减少。

(3)没法控制参数原素的抵达次序和总数,每一次注入的数据信息次序很有可能不一致总数时多时少。

(4)某一原素被解决后,要不被丢掉,要不被存档储存。

针对流数据的查看异常现象和类似种类较为用时,人力检验日志非常枯燥且易不成功。

「数据可视化」根据时变数据可视化方式的科学研究,上文汇总的时变型数据可视化方式 关键选用静态数据方法展现数据信息中纪录的內容,不随时间转变,但可选用多方面、数据信息较为等方式 反映数据信息随时间转变的发展趋势。除此之外,时变型数据信息也有很多的实际归类,在对时变型数据信息开展可视化时,还务必考虑到时变型数据信息开展详尽的剖析,应用最好的可视化方式 对其吓醒可视化。

此刻起,和袋鼠云一起让数据产生更大价值
此刻起,和袋鼠云一起让数据产生更大价值