文字情感分析的数据可视化和关键点感情的不同,文字感情旋光性/建议剖析(后文通称文字情感分析)是一个应用面更广更关键的文本挖掘方式,被普遍应用在剖析客户自身转化成的文字数据信息上。wiki百科上针对文字情感分析的详细介绍是“情感分析的目地是以便找到讲话者/创作者在一些话题讨论上或是对于一个文字两方面的见解的心态。”自然因为感情层面的添加,我们可以对文字数据信息开展大量有趣的剖析,接下去大家就来详细介绍一些文字情感分析数据分析系统。
文字情感分析的数据可视化和关键点感情的不同,绝大多数文字感情可视性系统软件全是以展现根据时间线的信息流广告主导,好像头条上的新闻报道、新浪微博信息流广告、产品的用户评价这些。下面的图是一张twitter数据信息的感情時间序列图,在其中顺向的值意味着积极心态,负性则是负面情绪,这幅图呈现了在时间线上每个不一样恶性事件针对网友twitter心态的危害。
上边这类简易的可视性方式 太过度抽象性,以致于无法主要表现出这种心态变换出現的缘故。以便处理这个问题,愈来愈多的数据可视化技术性刚开始从不一样的视角来呈现心态。下边从用户评价和社交网络2个层面看来一下一些实际的文字感情可视性系统软件的运用与完成。
消费者评价的可视性剖析
从运用方面看来,文字情感分析最具备使用价值也是最有利于立即运用的行业是针对消费者评价的剖析,尤其是在现如今网上购物已变成大家必不可少的消費方式时,大家会十分立即在每个电子商务平台上对所选购的产品作出正负面信息点评。即时上,如今现有许多感情数据可视化系统软件更是是专业对于这一场景制作的。
下面的图的可视性系统软件列举的是消费者对一款复印机评价的大数据可视化結果,以热力地图的方法另外展现了评价量和感情。在其中每一行意味着一种类目的复印机,每一列则是复印机的某一特性,鲜红色表明负面情绪,深蓝色则意味着反面心态,色调的浓淡水平意味着该心态的高矮,每一个格子中的格子尺寸表明评价总数。这类数据可视化方法,不但有效地将心态旋光性数据信息同商品的每个层面融合在一起,还简约、高内容效度地展现出大数据分析师最想第一时间获得的待机信息:感情旋光性。
Rohrdantz在2013年在ACMTrans上发布《Feature-BasedVisualSentimentAnalysisofTextDocumentStreams》
详细介绍了一整套详细的用户评价感情可视性系统软件,该系统软件融合了文本挖掘、情感分析与可视性剖析技术性,协助系统软件使用人获取文字中的更有意义信息内容,例如感情转变、数据信息相对密度、关键字这些。下边的热力地图展现了时间轴上的感情转变,在其中每一个像素数意味着一条文字,翠绿色为积极心态、鲜红色为消极情绪、淡黄色为中性化心态。该图以日历表的方式呈现总体时间轴上的情感分析結果。
该系统软件以便尽快主要表现感情转变、数据信息相对密度及其关键字前后文,还出示了以下的時间相对密度图。
事例是提取了五万条包括了关键字”password”的评价产生的感情時间相对密度图,每一条评价以横线的方式展现,仍然以鲜红色(消沉)、翠绿色(积极主动)、深灰色(中性化)的方法表明心态,而横线的高宽比则意味着了数值的真实度,越高意味着可靠水平越高。入选中每一条横线的情况下,能够回溯到实际的评价內容,评价內容中出現的专有名词、修饰词也会用实际的心态色调作出标明。最正下方的曲线图则是用于展现数据信息相对密度。
此外,系统软件还设计方案了一套优化算法用于标志出系统软件使用人将会会很感兴趣的內容,系统软件自动检索出的五个在時间相对密度图上非常值得被关心的话题讨论。
社交网络的可视性剖析
社交网络(以文字方式主导的贴子或情况)的可视性剖析被很多应用在舆情分析上,例如政府部门掌握群众针对一些现行政策或是恶性事件的建议,或是是公司搜集网友针对企业商品的观点。那样的舆情分析的难题取决于互联网技术上大家的念头散播十分快,而群众建议也具备多元性的特性。
OpinionFlow是一套专业朝向社交网络的建议散播可视性数据分析系统。针对某一个特殊的主题风格,OpinionFlow会剖析一系列客户公布的有关Tweet,针对每一个客户u在時间t上发布或是分享的有关文章,系统软件会测算出感情值并纪录为S(u,t)。根据对目前散播方式的鉴别,系统软件可以推论一个客户u把建议散播给另一个客户v的概率Puv。
文字情感分析的数据可视化和关键点感情的不同,OpinionFlow最终应用桑基图的方法呈现了社交网络中好几个主题风格的建议散播情况,五个主题风格下系统软件的实例,红色和绿色仍然意味着建议的积极主动与消沉情况。
另一个社交网络数据可视化系统软件的事例是SocialHelix,剖析社交网络上出現的客户产生分歧。说白了客户产生分歧就是指例如在政治运动中,不一样党派的拥护者在社交网络上依据自身的政冶见解开展争辩。产生分歧造成的标准是务必最少有2组拥有不一样见解的人,次之在一系列有关的聚焦点恶性事件中她们会发布分别势力不一样的建议。
SocialHelix的设计灵感来自于DNA螺旋式构造,可以充足展现产生分歧中必须包括的消费群、聚焦点恶性事件及其见解心态等要素。双螺旋结构的两根碳链(backbone)各自意味着感情建议反过来的2个人群,而碱基对(basepairs)则意味着产生的聚焦点恶性事件,磷酸基团(phosphate)意味着了该恶性事件中该人群表达意见的典型性意味着客户,图中越贴近上边心态越积极主动,相反则越消沉,另外也以绿红黄三色对心态做出了标志。c图以另一种方式展现了一样的数据信息,仅以色调反映正负极心态见解,相较之中b图更加形象化。
SocialHelix剖析了2013年ObamaCare现行政策2个不一样人群的产生分歧,在其中的数据信息是在10月3日夜里即时收集的。清楚地展现了在10点以后2个人群刚开始拥有不一样的建议。但有趣的是在12:40以后以前拥有负面信息建议的人群变为了反面,而反面建议人群却转为了负面信息,必须对实际的文章做进一步剖析。
结束语
文字感情数据可视化是一个十分趣味的行业,并且仍在持续发展趋势中,现阶段都还没一套非常完善的规范。而现阶段的感情数据可视化技术性大多数是运用驱动器的,并沒有特备清楚的归类。坚信这一方位依然会是以后的科学研究网络热点。