《经济学人》数据可视化编辑:错误的图表,我们也画了很多
大数据文摘出品来源:Medium编译:张秋玥、夏雅薇经济学人杂志除了色彩鲜明的文章之外,其在数据可视化方面也自成一派。
绝妙的颜色搭配,风格鲜明的图表总能让读者过目不忘。
据图表编辑编辑Sarah Leo在一篇博客中介绍到:虽然对于每一张图表,他们都尽量准确地以最能支持故事表达的方式来可视化数字,但有时候也会犯错。
为了能够做的更好,他们在从错误中不断总结教训,不断的自我改进。
为此Sarah Leo还把经济学人的错误总结为3点,并写成一篇博客,供大家参考,大数据文摘对文章编译如下?深入了解我们的记录后,我找到了几个有用的例子。
我将针对数据可视化的问题分为三类:误导性图表模糊的图表未能说明问题的图表免责声明:大多数“原始”图表是在我们的图表重新设计之前发布的。
改进的图表是为了符合我们的新规格而绘制的。
它们的数据完全一致。
误导性的图表以误导的方式呈现数据是数据可视化中最严重的问题,虽然我们从不故意这样做,但它确实时不时发生。
我们来看看三个例子。
错误:截断标尺这图就很左翼分子对不对此图表显示了政治左翼Facebook页面上帖子的点赞平均数量。
这张图表的重点是显示Corbyn先生与其他帖子之间的差异。
原始图表不仅低估了Corbyn先生的数量,还夸大了其他帖子的数量。
在重新设计的版本中,我们完整地展示了Corbyn先生的数据并保证所有其他数据长条仍然可见。
另一个奇怪的是颜色的选择。
为了模仿工党的配色方案,原图使用了三种橙色/红色色调来区分Jeremy Corbyn与其他国会议员和政党。
虽然颜色背后的逻辑对许多读者来说可能是显而易见的,但对于那些不太熟悉英国政治的人来说,这可能没什么意义。
错误:通过故意操纵坐标轴来假装存在相关关系难得的完美关联?并不是的。
上面的图表附有一个关于狗重量下降的故事。
乍一看,似乎狗的体重和颈部大小完全相关。
但这是真的吗?其实并不是很相关哦。
在原始图表中,两个坐标轴的跨度均为三个单位(左边是21到18:右边是45到42)。
按百分比计算,左边的比例下降了14%而右边则下降了7%。
在重新设计的图表中,我保留了双坐标轴的设计,但调整了它们的范围以反映可比较的比例变化。
考虑到这个图表的休闲主题,这个错误可能看起来并没有那么重要。
毕竟,图表的信息在两个版本中都是相同的。
但我们从中学到的事情很重要:如果两个变量过于紧密相关,那么再仔细观察一下坐标轴尺度可能是一个好主意。
错误:选择错误的可视化方法对脱欧的看法几乎和谈判结果一样不稳定我们在每日新闻应用Espresso中发布了此投票图表。
它显示了民众对欧盟公投结果的态度,并以折线图绘制。
从数据来看,似乎受访者对公投结果的看法相当不稳定——每周都会增加或减少几个百分点。
我们并未使用平滑曲线绘制单个民意调查来显示趋势,而是连接每个民意调查的实际值。
这主要是因为我们的内部图表工具没有绘制平滑线条的功能。
我们直到最近才逐渐开始熟悉更复杂的可视化统计软件(如R)。
今天,我们团队所有人都能够绘制一个类似上面重新设计的投票图表了。
此图表中需要注意的另一件事是坐标轴如何起点的方式。
原始图表将数据扩展到全部空间。
而在重新设计的版本中,我在坐标轴开始的部位和最小数据点之间留下了更多空间。
弗朗西斯·加农(Francis Gagnon)为此制定了一个很好的规则:我们应当试着在一个不从零开始的折线图下留出至少33%的空白区域。
模糊的图表这没有误导性图表那么过分,但是一份难以阅读的图表还是表明可视化工作做得很糟糕。
错误:“发散性思维”过于发散了…这啥玩意?在“经济学人”杂志上,我们被鼓励创造“发散性思维”的新闻报道。
但是有时候,我们会认为这有点太过分了。
上图显示了美国的商品贸易逆差和制造业就业人数。
该图表非常难以阅读。
它有两个主要问题。
《经济学人》数据可视化编辑:错误的图表,我们也画了很多的信息就聊到这里吧,感谢你花时间阅读本站内容,更多关于《经济学人》数据可视化编辑:错误的图表,我们也画了很多的信息别忘了在本站进行查找喔。