智能数据可视化:质量评估算法

不良数据可视化与良好数据可视化之间的差距很小。

好的数据可视化与出色的数据可视化之间的鸿沟巨大!

面临的挑战是,我们以及我们的HiPPO会带来意见和感受,以及我们对未来发展的看法 病毒式的 进行对话。这在区分好,坏与好方面完全相反。

相反,我们需要的是对我们追求卓越的过程中面临的上升趋势的坚如磐石的理解,以及可以帮助我们无私地评估质量的标准框架。

今天就开始吧。学习如何将坏与好,好与坏分开,并使用我们都可以立即联系到的示例来做到这一点。

首先,我们将研究这两组困扰着人类的根源,然后学习评估全新的数据可视化效果如何。如果您采用它,我保证对您工作的影响将是变革性的。

痴迷冲突。

任何数据可视化都涉及两个方面。

1.分析师/数据可视化器。

正如我在该博客上经常分享的内容一样,我们(分析师)都在进行说服。我们努力实现期望的结果,因为在创建数据可视化时,这是我们的首要关注点/愿望/观点:

我如何才能尽可能多地填充图形?

我应该包括哪些内容以确保每个人都能清楚地知道自己做了多少工作?

我需要公开多少议程,并且可以秘密公开多少?

我是否可以添加一些东西来增加传播的机会并带来名声和荣耀?

好。我只是在开玩笑。

但是,作为分析师,数据 可视化器,我不能说这些想法没有引起我的注意。 :)

我主要分享上述内容是为了确保您知道这些动机存在–并且,像我一样,您应该努力抵抗!

最好的数据可视化工具,痴迷于:

1. 已知变量和未知变量
2. 因果关系
3. 细微差别
4. 可视化技术
5. 排序消息
6. 简单,简单,简单,简单,简单,简单,最后一次保证安全。

这是我工作中至高无上的六件事,而这对您来说至关重要。

简单性比其他问题更重要,因为如果我不能提炼复杂性,那么我也最好不做这项工作,因为那仅仅是 雪球在阳光下的机会 观众会理解我复杂的视觉效果。

让我们看看数据可视化方程中涉及的另一组人。

2.数据使用者。

以下是数据可视化的使用者在进行一组分析时首先要考虑的关注点/愿望/观点:

对我有什么好处?

有多容易 把握最重要的一点?

对我有什么好处?

我需要投入多少精力来理解整个信息图?

对我有什么好处?

我如何才能相信此消息来自可靠的分析师/来源/使用合理的方法?

(永远不要低估数据使用者在向他们显示数据表或数据可视化表时带给他们的惊人的自私。而且,这是可以理解的,因为他们的工作很艰辛,还有其他71件事情需要担心。)

注意,对数据使用者和数据可视化器的痴迷几乎没有重叠。

如果您有选择(并且愿意!),请让数据消费者的需求驱动您的数据可视化工作。唯一的例外是,当您尝试进行宣传时,然后按照您的议程进行。

如果图表很烂,通常是由于可视化工具和使用者之间在上述尺寸上的冲突。

当您通过Consumer镜头观看任何图形并着眼于简单性(Analyst尺寸)时,您将在显示屏上生动地看到它。

数据可视化评估算法。

算法 如此处所述,可能有点夸张。我开发了一套 滤镜和镜片 通过它,您可以查看任何数据可视化,以便快速评估质量。

也许读此博客文章的人会通过构建机器学习算法来评估Data Viz是好是坏,来帮助我们所有人。 :)

反思前面提到的“消费者与可视化工具”之间的痴迷冲突,使我将数据可视化工具的评估提炼为八个维度。它们相互影响,而且影响整个投资组合,但它们却独立存在。

以“痴迷| [等级量表]”,这是数据即评估算法:

1. 时间到最重要的见解。 [规模:快。慢。 KMN!]

2. 努力了解整个图形。 [低。中。不,谢谢。]

3. 信任标记。 [明确。不明显。没有。]

4. 关键消息的排名。 [是。部分。 WTH!]

5. 解释为图形提供动力的关键逻辑。 [超级清晰。多云的。无形。]

6. 暴露细微差别。 [甜。一些。酸。]

7. 可视化器试图变得太聪明。 [不,谢谢上帝。是的,但这是无害的。是的,可悲的是。

8. 可能会推荐给有影响力的领导者。 [是!不行。]

我希望您明确注意:

我把数据消费者放在第一位

数据可视化工具激励良好行为,以及…

…最后包含结果,因为 活动 很好,花花公子,但这是 结果 有什么关系。

我希望分享一种非常具体的算法,使您的批判性思维源源不断。我邀请您就如何使它变得更智能提出批评和建议。请回复。

最好的学习方法是通过实际示例进行练习。所以..做吧!

COVID我应该害怕(!)数据可视化。

几周前,也许并非偶然,许多不同的实体发布了视觉效果图,以帮助我们了解我们可以安全地做什么以及会造成严重伤害的内容。

我已经收集了其中四项努力–每种方法都可以通过不同的方式可视化几乎相同的信息。这为我们提供了理想的数据集来应用我们的算法,并在此过程中学习敏锐的技能。

数据可视化#1

第一张图片 来自无与伦比的Randall Munroe(我是xkcd的超级粉丝!)。
兰德尔拥有一种传达复杂信息的独特方式(购买 事物解释器!),此图形也没有不同。它结合了认真,有趣和科学的准确性。

作为一种方法,2x2确实可以很好地工作。他们迫使简单化。上面的颜色群集有助于您更快地跳转到最安全或最危险的活动。

不利的一面是,很难把整个事情都考虑进去。您可能会迷路。

我将其视为一个非常严肃的例子,但请务必记住,上述意图包括使我们微笑的目的。

让我们应用我们的算法,看看该图形如何处理我们的 坚强但充满爱心 镜片。

1. 时间到最重要的见解。 [快速。 。 KMN!]

2. 努力了解整个图形。 [低。 。不,谢谢。]

3. 信任标记。 [明确。不明显。 没有。]

4. 关键消息的排名。 [。部分。 WTH!]

5. 解释为图形提供动力的关键逻辑。 [超级清晰。多云的。 无形。]

6. 暴露细微差别。 [。一些。酸。]

7. 可视化器试图变得太聪明。 [不,谢谢上帝。 是的,但这是无害的。是的,可悲的是。

8. 可能会推荐给有影响力的领导者。 [是! 不行。]

从技术上讲,图形应该通过#3,因为它很有趣,也可能是#5。但是,我仍然对其进行了认真的评分,以便我们所有人都可以练习评分。

如果在这里使用大小姐这个词,那也许就是理解整个图形(或更准确地说,卡通)的第二点。

得分 23/66。

哦,我完全忘了告诉你……我做了一个评分系统,可以帮助您真正地了解关键信息。那些了解我的人不会惊讶于我的系统具有陡峭的渐变曲线(#highstandardsFTW!)。

计分系统在上标度的每个等级上使用乘数。此外,由于每个维度的重要性不同,因此每个维度都有一个乘数–有效传达我的价值观。

这是数学……

除非您意识到其中涉及得分,否则所有娱乐和游戏都是如此! :)

重要:创建数据可视化评估算法和评分表的目的不是让您完全同意我对每个可视化文件进行评分的方式。我的目的是讲授一种系统的方法,可以带您完成这些困难和复杂的任务。

我希望您能明白为什么我要按照自己的方式得分,希望您会同意。但是,这种愿望是高等的。

数据可视化#2

第二张图 来自举世闻名的Information is Beautiful(B)。他们拥有一些世界上最著名的数据可视化。 (简单有效: 海平面袭击时)

B倾向于为大屏幕制作图形,我需要在心爱的27英寸ThinkVision显示器上才能最佳地读取它。

在这种情况下,您会注意到调色板会影响文本的读取功能(深灰色为深灰色,深灰色为浅灰色)。

从浅黄色到血红色的光谱(具有内部渐变)正试图增加一层可能使Data 可视化器满意的机灵,这是以数据使用者为代价的。

一旦放大了视觉的一部分,一切就变得可读了。您确实会丢失任何部分的全貌。在这种情况下,也许您会同意气泡中的内容具有随机性(请在下面的两个视觉效果中进行检查)。

在可视化效果的左上方添加“要考虑的风险因素”真是太好了,它解释了为图形提供动力的逻辑。(您可以在更高分辨率的视图中更清楚地看到它,灰色的蓝色字体使它变得更清晰)上方)。

我确实喜欢一些细微有用的技巧,例如以下有关调味品的技巧。

让我们应用我们的算法,看看该图形如何处理我们的 坚强但充满爱心 镜片:

1. 时间到最重要的见解。 [快速。 。 KMN!]

2. 努力了解整个图形。 [低。 。不,谢谢。]

3. 信任标记。 [明确。不明显。 没有。]

4. 关键消息的排名。 [是。 部分的。 WTH!]

5. 解释为图形提供动力的关键逻辑。 [超级清晰。 多云的。无形。]

6. 暴露细微差别。 [甜。 一些。酸。]

7. 可视化器试图变得太聪明。 [不,谢谢上帝。是的,但这是无害的。 是的,可悲的是。]

8. 可能会推荐给有影响力的领导者。 [是! 没有。 没门。]

我就快要选择了 没门 在向其他人推荐该图形方面(因为我永远不会)。最终,IiB是一个如此巨大的实体,如此著名,所以很多人都喜欢他们…… 没门 似乎太多反对谷物。

I'我们已经了解到IiB具有定义它们的非常特定的设计语言,纹理和理念。现在它可能起约束作用。

根据算法的评估,它获得了 得分为7/66。

这是数学:

数据至关重要–如此广泛的消费(整个星球)–需要弄清楚如何达到极高的简单性和有效的通信标准。 否则,它仍然是Data 可视化器的自我满足练习。

数据可视化#3

第三张图 由Saskia Popescu教授,James P. Phillips博士和Ezekiel Emanuel博士共同撰写。

我是伊曼纽尔博士的忠实粉丝。他是奥巴马政府卫生政策的特别顾问,在通过 患者保护和平价医疗法案 (又名。奥巴马医改)。为此,他对那些社会和政治家通常在美国不听的人表示永恒的感谢。

Covid-19风险指数清楚地标识了图形的逻辑: 密闭空间, 人群, 互动时间强制呼气.

请注意,IiB也有一些这样的因素,在这里增加了强制呼气(不足为奇的是,医生把它放在了首位)。

图形中的颜色与风险的强度有关,绿色为低,红色为高。简单,直接,有效。

我不是图形上巨大的公司徽标的忠实拥护者,如您在下面的"hexagon art."我相信:更多的空白=更多的和平。

鉴于在美国进行的令人心碎的辩论,我的确很感激呼吁采取行动并戴上口罩的额外呼吁。

您是否注意到底部的信任标记?非常好。

与IiB图形一样,该图形用于大屏幕显示。我为团队确保每个部分都可读而称赞–没有精美的字体颜色和精美的背景作为Visualizer的演示's smartness.

我团队中的人都知道我对图标有特别的仇恨。他们增加了混乱。在这种情况下,我确实支持包含图标的决定。

例如,无需阅读任何文字,我知道在办公室工作会带来中/高风险,而参加团体宗教服务属于 推荐你请避免 类别–即使是上面的小版本,也肯定是下面的放大版本。

让我们应用我们的算法,看看该图形如何处理我们的 坚强但充满爱心 镜片。

1. 时间到最重要的见解。 [快速。慢。 KMN!]

2. 努力了解整个图形。 [低。 。不,谢谢。]

3. 信任标记。 [明确。不明显。没有。]

4. 关键消息的排名。 [是。 部分的。 WTH!]

5. 解释为图形提供动力的关键逻辑。 [超清。多云的。无形。]

6. 暴露细微差别。 [甜。 一些。酸。]

7. 可视化器试图变得太聪明。 [不,谢谢上帝。是的,但这是无害的。是的,可悲的是。

8. 可能会推荐给有影响力的领导者。 [是! 没有. 没门。]

此图在社交媒体上风靡一时,理应如此。随着CV-19在多个国家/地区爆发(不幸的是,我们在美国仍在经历第一波挑战),我希望您可以使用上面的图片来确保安全–并与您的朋友和家人分享,以便他们也能保持安全。

根据算法的评估,它获得了 得分为50/66。

这是数学:

显然,数据可视化工具可以引以为傲的图形达到了 强迫症重叠 数据消费者的痴迷是罕见的。

数据可视化#4

最后的图形 由德州医学协会COVID-19工作组和TMA传染病委员会的医师开发。

我喜欢它。

很简单。这很容易消化。绝对没有可爱的东西(哇!)。没有圈子可以跳过。没有雇用昂贵的Data 可视化器字体专家。该图形并不太努力。

它可能是由TMA的Doctors设计的。真是无聊。就是…… 有效.

我唯一能做出的轻率批评是,也许与德克萨斯州在与Covid打交道时的(具有讽刺意味的)自由主义姿态保持一致,因此与所有其他消息来源相比,该图表降低了冒险的标准。我将其作为一个小危险信号来分享,但它与我们今天正在进行的对数据的技术分析相邻。

如下图所示,为图形提供动力的逻辑已集成到图形的核心中。几乎不需要任何努力来理解视觉效果。从顶部开始,继续前进。颜色和条形帮助您前进。

即使是这么小的尺寸,也相当可读…

如此清晰地布置信息时,其他事情会突然出现,使您产生思考(出色的数据可视化的出色特征)。

以下所有项目均为8或9–但请考虑惊人的差异。

参加酒吧活动与参加500多个礼拜者的宗教仪式一样冒险!而且,两者都比吃自助餐要危险一点!! 您好奇地询问数据。一个好兆头。

TMA COVID最高风险

让我们应用我们的算法,看看该图形如何处理我们的 坚强,但有爱 镜片:

1. 时间到最重要的见解。 [快速。慢。 KMN!]

2. 努力了解整个图形。 [。中。不,谢谢。]

3. 信任标记。 [明确。 不明显。没有。]

4. 关键消息的排名。 [。部分。 WTH!]

5. 解释为图形提供动力的关键逻辑。 [超清。多云的。无形。]

6. 暴露细微差别。 [甜。 一些。酸。]

7. 可视化器试图变得太聪明。 [不,谢谢上帝。是的,但这是无害的。是的,可悲的是。

8. 可能会推荐给有影响力的领导者。 [是! 没有. 没门。]

根据算法的评估,它获得了 得分64/66。

这是数学:

TMA图形是编写此新闻简报的火花。

世界需要一种简单的方法来进行有效的交流,在这种情况下,实际上就是可以挽救生命的信息。

尽管在业务环境中很少出现如此高风险的事情,但我希望TMA能够激发您确保您在进行数据可视化时不会忽略重要的事情:对数据的理解。

底线。

您如何处理作为数据可视化工具的目标(以及雇主为您创建的激励措施)与数据消费者之间的冲突?虽然答案似乎很明显,但是执行起来却非常困难。希望您能使用数据可视化评估来确保您自己的团队首先解决数据消费者问题,其次才是您自己。

如果您的图形得分超过60,我希望看到它们! (如果它们是可共享的。)

祝一切顺利。

PS:额外生活课程:

一小部分人肯定会注意到该算法的完美分数是 66 (都很棒),并且它的分数足够好是 22 (所有都可以优化)。那巨大的鸿沟反映了生活(和我的哲学)。

毕竟,这是一件好事,成千上万的分析师会停下来。也许一百或更少的人会为实现卓越而付出艰辛的工作。他们将统治(biz)世界。

#现在你知道了

评论

  1. 1
    丹尼尔·切格 says

    感谢Avinash分享了这篇出色的智能数据可视化文章。

    信息图表是惊人的。

    保持良好的工作。– Daniel.

  2. 2
    扎克·希勒(Zach Shearer) says

    与往常一样,感谢您的精彩帖子。该算法很好。正如您提到的,看到一个应用程序可以自动对可视化进行分级很酷。一世'确保有人做了或正在努力。添加一些定量标准(例如,数据墨水比)会很有趣。

    在浏览本文时,我制作了自己的电子表格。也许其他人可以复制工作表并做出更好的版本:

    //docs.google.com/spreadsheets/d/1YdTq2uCWukb0Vo3WmA8RYlr-RI0vAmRcbpRPUTSdcFo/edit?usp=sharing

  3. 4
    艾米·沃尔特(Amy Walter) says

    很高兴看到您返回博客Avinash,谢谢!

    考虑到您的八个维度,对于我们的代理商而言,影响最大的是#6和#5。分析师唐'对业务没有足够的战略了解以暴露细微差别。同样,他们经常不这样做't有效地解释基础,这会导致人们经常误解图形的实际含义。

  4. 5
    兰詹·耶拿(Ranjan Jena) says

    谢谢先生。你一直是我的灵感& my work & my brand.

    虽然我'在经历了如此长的时间间隔后,我回到了您的网站,很高兴为您推荐此博客,以帮助我制定业务和数字营销策略。希望从现在起应该更加定期,并随时更新您的帖子。谢谢。

  5. 6
    李戴夫 says

    一个非常及时的帖子,不仅是出色的分析建议,还为我们所有人提供了有用的COVID建议。 :)

    我同意德州医学的图形。很简单。很容易阅读。它就是有效的。

    对我来说最令人困惑的是《信息就是美丽》。它试图变得太聪明,很难克服这些泡沫,并且不清楚它们的布局方式是否有等级顺序(德州医疗公司不是问题)。

    我非常喜欢计分表,感谢您分享Excel版本。

  6. 7
    阿维纳什 says

    那把我带到了一个全新的高度…当我尝试使用数字化工具来显示我的商户号码以进行有效可视化时,这对我非常有帮助..
    谢谢
    阿维纳什(我也是)

  7. 8

    非常感谢您的文章!

    除了计分系统,我意识到这些是可视化,我们通过python和R生成的只是Plot :)

添加您的观点

*