本篇文章2308字,读完约6分钟

原创pup china普林斯顿读书汇

编辑器注释:

在这样的大数据时代,人们往往认为自己有做出正确决定所需的一切新闻。 但实际上,我们拥有的数据并不完整,可能只是冰山一角。

就像宇宙大部分由暗物质构成一样,我们看不见它们,但并不意味着它们不存在。 新闻世界也充满了这样阴暗的数据。 如果我们忽视它的存在,不管你有多聪明,不管你采用的统计模型和算法有多先进,你的结论都很可能是错的,严重的时候会让自己陷入危险。

黑暗的数据无处不在

什么是暗数据? 黑暗数据是你没有的数据。

这个“没有”可能知道,没有像问卷表格提问下的空白一样的你。 我可能不知道你在不在。 例如,不满的顾客选择沉默而不是投诉等。 但是,除了简单的二元分类外,暗数据还可以以多样化的玩法出现,有点明显,有点微妙。

例如,简单的摘要统计可以传达有关数据的新闻,但这些统计忽略了其他方面。 为了一个目的设计的定义在另一种情况下可能会引起很大的误解。 是隐藏的数据。 没什么,但我想得到的数据会告诉你情况会发生什么。

总结起来,15种暗淡的数据备受关注。

黑暗数据——极其重要

如果数据库、计算机、笔记本和电子表格中实际可用的数据是某些数据,并且隐藏了重要新闻,则基于这些数据进行的分析可能会引起误解,因此,暗数据非常重要。

一个神话是,缺少一些数据也没什么大问题。

特别是在“大数据”的世界里,大量数据容易积累,淡化错误,修正缺失数据引起的偏差的说法正在流行。

但是,这个想法是错误的,这些缺失的数据可能是理解正在发生的事件的关键。

继续为你提供数据的是转发器。 如果忽视未来的顾客,试图为你的企业制定快速发展战略的话,会被数据误解。 诊断疾病的算法,如果其数据罕见且缺乏致命疾病,那对患有这种疾病的人来说一定是个坏消息。

黑暗数据——岌岌可危

暗数据给任何行业都带来潜在的风险。

在商业行业中,我们将获得有关客户行为的数据,但业务增长需要了解其他客户可能采取的行为。

新药的临床试验需要知道患者为什么停药。 是因为治疗没有效果吗? 还是因为治疗完全有效,病情治愈了?

在天体物理学中,我们看不到天上所有的星星。 如果我们不能看到的哪个星星(也就是暗的数据)和我们能看到的星星完全不同呢?

如果人类参与经济和公共政策等行业,情况就会更加复杂。 人类对他们所处的环境做出反应,无论注意还是判断都会做出反应。 这意味着你收集的数据受到了“你正在研究这个议题”的影响。 暗数据带来的潜在多重性、复杂性和误解是显而易见的。

黑暗数据的危险一直伴随着我们。 没有人不知道的。 所以一定有我们不知道的事件。 问题是这些缺失的东西是否重要,以及“数据驱动社会”的迅猛发展是否加剧了问题的严重性。

当然,大数据集的现成(和自动)获取,再加上现代统计学、机器学习、人工智能工具的强大威力,提高人类能力是有前途的,但这些进步都伴随着挑战。

虽然计算机的能力很强,但这意味着我们必须依赖这些机器。 需要提供统计摘要、图表和算法的输出。 这意味着计算机是我们和数据之间的必要中介。

如果它充当显示这些数据的过滤器,它也充当我们和数据之间的墙。 使数据观察具有不透明性,只有在我们可以通过这面墙窥视的地方,新的发现才会有内在的存在。

pup复制快递:

暗数据:

“我喜欢东京”t know matters

黑暗数据:为什么你不知道的事件很重要?

点击“阅读原文”直奔本书的购买页面

作者: david j. hand

出版时间:.1.3

isbn: 9780691182377

硬封面,第344页

全书的文案要点

dark data探索了我们在许多方面忽视缺失的数据,以及由此得出的错误、危险或灾难性的结论和行动。 从挑战者号爆炸到许多纷繁复杂的金融诈骗,hand通过研究大量现实生活的例子,将存在的黑暗数据类型和可能发生的情况进行了实用的分类,使我们能够识别和控制它们。 在这样的过程中,他不仅教会了我们警惕不为人知的事件带来的问题,还教会了我们如何利用阴暗的数据来做出越来越多的理解和更好的决定。

今天,我们全部由数据决定。 dark data向我们展示了如何降低产生坏数据的风险。

作者介绍:

大卫·约翰

david j. hand,英国帝国理工学院数学系名誉教授,高级研究员。 曾任皇家统计学会主席,英国科学院成员。 萩有improbability principle、measurement:averyshortintroduction、statistics:averyshortintroduction、及principlesODATIA

名家推荐:

“我们在个人或职业生活中做决策时,我们一般从某种形式的数据开始。 “数据”一词来源于拉丁语,意思是“被赋予的东西”,但是是谁赋予的呢? 从哪里来的? 我应该相信表面吗? 睁开我们的眼睛,把“被赋予的”看成是理所当然的陷阱,让我们认识到,在“假信息”和数据爆炸的时代,这本有见识的书应该是每个人都必须要阅读的。 ”。

——adrian smith,directorandchiefexecutiveofthealanturinginstitute

“做好数据驱动的决定后,请看书吧。 不能晚。 有收获。 作者引诱网友看到了多个黑暗数据的陷阱。”

――美国全国广播公司

-结束-

原题:《数据时代的替代决定指南》

浏览原文信息进行推荐

99岁的英国退伍军人为医务人员捐赠了400多万英镑

根据网站截图,99岁的英国退伍军人汤姆·摩尔于月末开始了在100岁生日之前推着步行辅助车在后院走100圈的挑战,称之为“。 ...

标题:“数据时代的另类决定指南”

地址:http://www.ok-sl.com/ozdt/8314.html