消息首页搜索举报

【包邮】可视化未来【正版九新】

九品消毒塑封

17 3.1折 54.9 九五品

仅1件

天津宝坻

认证卖家担保交易快速发货售后保障

作者埃雷兹·艾登

出版社浙江人民出版社

ISBN9787213068508

出版时间2015-09

装帧其他

开本16开

定价54.9元

货号9787213068508

上书时间2024-11-23

文渊文化传媒

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 15小时
好评率暂无

最新上架

【包邮】红云初心故事与精神基因【正版九新】 ¥14.20

【包邮】沟通的八张面孔【正版九新】 ¥14.10

【包邮】从东江纵队到两广纵队【正版九新】 ¥14.80

【包邮】藤本月季·玫瑰12月栽培笔记【正版九新】 ¥14.10

【包邮】发现！蔚蓝大海的秘密/科学真好玩爆笑漫画书·第2辑【正版九新】 ¥13.80

【包邮】婴幼儿行为心理学【正版九新】 ¥14.20

【包邮】宇宙职业选手 2 【正版九新】 ¥14.20

【包邮】俏鼠记者21博物馆探案/(意)菲.斯蒂顿【正版九新】 ¥14.60

【包邮】小鹰逆风飞行【正版九新】 ¥12.70

商品详情

品相描述：九五品

商品描述: 导语摘要
《可视化未来（数据透视下的人文大趋势）》是史蒂芬·平克最为推崇的人类趋势新作。它是世界权威数字人文学家、“谷歌图书”项目首席专家埃雷兹·艾登与让-巴蒂斯特·米歇尔的重磅力作，是超级畅销书《链接》译者、中科院计算所副研究员沈华伟，中科院计算所所长助理、中国科学院网络数据科学与技术重点实验室主任程学旗诚意之作。
书中，500多万本电子书、82幅图表、6大热点主题，完美洞悉人文历史与未来。
中国工程院院士、中国科学院大学计算机与控制学院院长李国杰，清华大学心理学系主任、加州大学伯克利分校心理学系终身教授，当代最伟大思想家、世界最语言学家和认知心理学家、经典畅销书《语言本能》作者史蒂芬·平克，数据趋势先驱，著名畅销书《大数据时代》合著者肯尼思·库克耶联袂重磅推荐。

作者简介
埃雷兹·艾登，1980年，埃雷兹·艾登出生于美国布鲁林，精通希伯来语和匈牙利语。本科就读于普林斯顿大学，主修数学、物理学和哲学专业，毕业后考入叶史瓦大学历史学专业，攻读硕士学位。
2009年，在哈佛-麻省理工博德研究所攻读博士学位的艾登被《麻省理工科技评论》提名为世界上前35位年龄小于35岁的创新者。
博士毕业后，艾登先是任职于哈佛大学科研学会，后任谷歌客座教授，随后成为贝勒医学院和莱斯大学的助理教授，领导基因组架构研究中心。2012年，他因和同事一起发明了探测基因3D折叠方式的技术，获得美国总统青年科技奖（PECASE），这是美国政府颁给青年科学家的优选荣誉。
让-巴蒂斯特·米歇尔，数据科学公司量化实验室（Quantified Labs）创始人，哈佛大学副研究员，曾任谷歌客座教授。2010年在哈佛获得博士学位。2012年入选TED Fellow，很近被《福布斯》提名为“30岁以下30位创新者”之一。

目录
推荐序  数据透镜，洞穿科学与人文之美
        李国杰
        中国工程院院士，中国科学院大学计算机与控制学院院长
译者序  在大数据的指引下开启未知之旅
引言  数字眼，透视历史与未来
第1章  乔治·金斯利·齐夫与化石猎手
  英语演进的全景式图谱
  源起孩童式问题
  1937，数据史诗
  幂率，引爆词汇世界新正态
  过于齐夫与否
  2005，另一个数据史诗
  时间旅行者的窘境
  词典与索引
  数一数玫瑰的花瓣
  【量化人文】是burnt，还是burned？
第2章  四个生日和一个葬礼
  语言本质的新视域
  谷歌数字图书馆之梦
  3000万本！“谷歌图书”的9年成果
  《财富》500强法务部门的心理
  大投影，应对隐私泄漏之殇的密钥
  在“谷歌图书”的投影中
  自己动手编词典
  词汇暗物质
  【量化人文】老爸，保姆来自哪里？
第3章  未来，每个人都将在7.5分钟内成名
  从崭露头角到名望顶峰的路线图
  名望的万有引力
  测量名望，你需要一个“风洞”
  临摹名望，只是接近成名
  断代分析，将名望视作疾病来研究
  人类名望的风云变化：从75岁到41岁
  如何获得名望：职业选择指南
  恶名，最极端的成名方式
  【量化文化】一步之遥，名望天地间
第4章  文明割裂与寂静之声
  如何透视文化审查的藏身之处
  “堕落的艺术”
  史上最火爆的艺术展
  焚书
  环球巡回，他们不希望你看到什么
  思想有数百万个出口
  【量化人文】两个权利催生一个新权利
第5章  为什么越是痛苦的记忆，越容易被忘怀
  集体意识的铭记与遗忘曲线
  记忆测试
  记忆关联效应：其他东西的记忆
  集体记忆的遗忘曲线
  新信息如何进入社会
  新技术如何进入社会
  147个重要日期
  奇点，还是破灭？
  量化民族精神
  让世界一起上瘾
  【量化人文】妈妈，火星人来自哪里？
第6章  乌托邦、反乌托邦与数托邦
  让预测人类未来成为现实
  数字化的过去：书籍、报纸等的数字化
  数字化的现在：数字通信与社交媒体让人类更亲密
  数字化的未来：“数字化来世”将触手可及
  真相与后果
  志趣相投：科学与人文已经走向融合
  心理史学
  【量化人文】由n元词组词频统计器绘制的人类大未来
附录  n元词组历史大会战

内容摘要
科学的传播速度有多快？今时今日我们很少谈论上帝了吗？人们什么时候开始用“havingsex”而不用“makinglove”？史上的人是在哪岁成名的？语法的变化速度到底有多快？哪些作家被纳粹审查得最彻底？“donut”什么时候开始取代“doughnut”？我们能否预测人类未来？比尔·克林顿和花椰菜哪个更出名？不规则动词是如何逐渐消失的？数据和上帝，人们更相信哪一个？名人们更多的是少年成名，还是大器晚成？如何进行合适的职业选择？
埃雷兹·艾登、让-巴蒂斯特·米歇尔编著的《可视化未来（数据透视下的人文大趋势）》一书的一
大特色是用图表说话。书中数百幅图表，以最直观的方式回答了这些看似毫无头绪的复杂问题。回答这些问题的图表，可以说是人类文化的一部连环画。它们简单易懂，而我们还可以通过在线的n元词组词频查看器方便地生成很多类似的图表，来满足我们对人类文化各个方面的好奇心。
该书是史蒂芬·平克最为推崇的人文趋势新作，500多万本电子书、82幅图表、6大热点主题，完美洞悉人文历史与未来。

精彩内容
打扫垃圾这个工作不怎么迷人，却可以成就英雄。
不信的话，你可以问一下希腊神话中的英雄——大力神赫拉克勒斯。在赫拉克勒斯的12次劳作中，第5次的任务就是打扫奥革阿斯国王（Augeas）的牛棚，那里面住着数千头长生不老的母牛。由于牛棚已经30年没有打扫了，粪秽堆积如山。因此，赫拉克勒斯将两条湍急的河流引来，一天之内就将牛棚冲洗得干干净净。他的英雄事迹至今仍是世界排污工程史上最
伟大的成就之一。
几千年后，类似的传奇故事仍然不绝于耳。这个故事是关于我们的“计算大力神”沈渊的。谷歌花费了5年时间，尽情地汇聚知识的力量，快速地数字化数以百万计的图书。然而，在创造了世界上最大的数字图书“牛棚”的同时，也不可避免地衍生出了一个副产品——谷歌积累了数量庞大的低质量数据。有些大数据是脏的。所以，我们是时候该清理“牛棚”了。
阻碍：错漏百出的图书馆卡片目录最近，你将多少黄金时间耗费在了图书馆的卡片目录上？
卡片目录曾经是图书馆里图书流通的核心。图书馆里的每本书都对应着一张卡片，上面记录着该书的关键信息，包括书名、作者、主题、出版年份和用于标识图书位置的编码。每天，来访者源源不断，他们会走向卡片目录存放柜，然后再根据目录里的信息走向遥远角落里的一排排书架。
如果没有卡片目录，图书馆将杂乱无章，人们也
就无法从中获取任何信息。很多个世纪以来，最重要
的图书馆之一——梵蒂冈秘密档案馆（VaticanSecretArchive）就处于这种状态。这家档案馆的书架有83.7公里长，却缺少一个囊括所有馆藏图书信息的卡片目录。档案馆里面有什么？即使是有权自由访问该档案馆的人，恐怕也说不清楚。如果需要从中找一本书，你就需要了解：谁可能知道书的位置。档案馆里陈列着很多珍贵的手稿，这些手稿可以追溯到8世纪，譬如，关于对伽利略进行异端审判的记录。然而，要想从中找出这些珍宝，却无异于是一场探险，或许《夺宝奇兵》中的印第安纳·琼斯（IndianaJones）会想要去进行这样的探险。对于这家档案馆来说，没有卡片目录无疑是一种绝佳的信息保护方式。
对我们而言，和任何其他图书馆用户一样，仅仅拥有查找馆藏图书的权利还远远不够。如果我们想对比一下不同时代和地方的书，还需要准确地找出记录着书的元信息的卡片目录，以便我们了解哪本书是关于什么的，从而在进行自动分析时知道该如何对其进行分类。
起初，我们并没有觉得这是一个大问题。谷歌在收集1.3亿本书时，使用的就是来自数百个源头的目录信息。这些年来，各大图书馆的卡片目录都完成了数字化，这是最早受益于数字化的事物之一，原来那些实体卡片通常都被“冷落”了。然而，事实证明，哪怕是最好的卡片目录也会出错。
错误一旦酿成，一般不会很快得到纠正。卡片目录如此之多，即便是最忠实的图书馆用户也不能总是注意到这些错误。有时候，用户也会因此找不到书。
在这种情况下，“非礼勿视，非礼勿听，非礼勿言”。有时候，错误出现在诸如图书出版地区之类的地方，但只要编码正确，用户们还是能找到相应的书。在这种情况下，卡片上错误的元信息对于读者而言影响不大，因为关键信息是正确的。
随着时间的推移，众多没有得到纠正的错误从实体卡片目录上迁移到了数字卡片目录上，然后又迁移到了谷歌采集图书时使用的“母目录”上，最后来到了我们这里。和只对某本书感兴趣的人不同，错误对我们影响很大：我们无法手工检查数百万本书。然而，这些卡片中有相当大一部分含有错误。如果我们使用这个目录元数据来产生n元词组表格，最终的结果就会非常糟糕且无法使用。而当我们使用含有错误的目录信息进行计算时，我们发现，隔壁办公室的朋友16世纪时就已经很出名了。当我们告诉她这个消息时，她否定了自己有那么老。要么是她对我们撒了谎，要么是我们的计算出了问题。我们该怎么办？
由于不能手工检查这些书，所以我们决定编写计算机算法以找出可疑的卡片——因某种原因包含了错误信息的卡片。以杂志为例，对于系列出版物如报纸、学术期刊以及其他期刊，图书馆会将创刊日期放在每一期上。这就意味着，按照我们的卡片目录检索，每一期的《时代周刊》都出版于1923年。对于我们的研究目的而言，这是一个大问题。
为了解决这些问题，我们编写了一个叫作“系列出版物杀手”（SerialKiller）的算法，它可以找出任何可疑的系列出版物。我们还编写了一个叫作“快速确定日期”（SpeedDater）的算法，查看图书的正文，根据正文推测图书的出版日期。我们将两个算法相结合就可以识别出可疑的卡片以及对应的图书。然后，我们再将这些书从我们的分析中剔除出去。
P81－84