【正版图书】社交网站的数据挖掘与分析马修.罗塞尔9787111369608机械工业出版社2012-02-01
正版图书 书友可放心下单
¥
4.83
0.8折
¥
59
九品
库存2件
作者马修.罗塞尔
出版社机械工业出版社
ISBN9787111369608
出版时间2012-02
装帧其他
开本16开
定价59元
货号9787111369608
上书时间2024-05-20
商品详情
- 品相描述:九品
- 商品描述
-
作者简介
马修·罗塞尔(Matthew A.Russell),Digital ReasoningSystems公司的技术副总裁和Zaffra公司的负责人,是热爱数据挖掘、开源和Web应用技术的计算机科学家。他也是《Dojo:The DofinitiveGuide》(O'Reilly出版社)的作者。在LinkedIn上联系他或在Twitter上关注@ptwobrussell,可随时关注他的近期新动态。
目录
前言
章 绪论:Twitter 数据的处理
Python 开发工具的安装
Twitter 数据的收集和处理
小结
第2章 微格式:语义标记和常识碰撞
XFN 和朋友
使用XFN 来探讨社交关系
地理坐标:兴趣爱好的共同主线
(以健康的名义)对菜谱进行交叉分析
对餐厅评论的搜集
小结
第3章 邮箱:虽然老套却很好用
mbox:Unix 的入门级邮箱
mbox+CouchDB= 随意的Email 分析
将对话线程化到一起
使用SIMILE Timeline 将邮件“事件”可视化
分析你自己的邮件数据
小结
第4章 Twitter :朋友、关注者和Setwise 操作
REST 风格的和OAuth-Cladded API
干练而中肯的数据采集器
友谊图的构建
小结
第5章 Twitter:tweet ,所有的tweet ,只有tweet
笔PK 剑:和tweet PK 机枪(?!?)
对tweet 的分析(每次一个实体)
并置潜在的社交网站(或#JustinBieber VS #TeaParty)
对大量tweet 的可视化
小结
第6章 LinkedIn :为了乐趣(和利润?)将职业网络聚类
聚类的动机
按职位将联系人聚类
获取补充个人信息
从地理上聚类网络
小结
第7章 Google Buzz:TF-IDF 、余弦相似性和搭配
Buzz=Twitter+ 博客(???)
使用NLTK 处理数据
文本挖掘的基本原则
查找相似文档
在二元语法中发Buzz
利用Gmail
在中断之前试着创建一个搜索引擎……
小结
第8章 博客及其他:自然语言处理(等)
NLP :帕累托式介绍
使用NLTK 的典型NLP 管线
使用NLTK 检测博客中的句子
对文件的总结
以实体为中心的分析:对数据的深层了解
小结
第9章 Facebook :一体化的奇迹
利用社交网络数据
对Facebook 数据的可视化
小结
0 章 语义网:简短的讨论
发展中的变革
人不可能只靠事实生活
期望
内容摘要
Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?本书简洁而且具有可操作性,它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。
本书每章都介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。
通过本书,你将
. 获得对社交网络世界的直观认识
.使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn等社交网络API中的数据
. 学习如何应用便捷的Python工具来交叉分析你所收集的数据
. 通过XFN探讨基于微格式的社交联系
. 应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的优选挖掘技术
. 通过基于HTML 5和JavaScript工具包的网络技术建立交互式可视化
主编推荐
2011年Jolt生产效率大奖获奖图书
新一代在线数据资源挖掘技术指南
社交数据挖掘、分析、可视化推荐参考书
媒体评论
“本书是《Programming CollectiveInelligence》一书的深入篇,它介绍通过Python从社交网站中采集数据的一种实践方法。”
——Jeff Hammerbacher,Cloudera 的首席科学家
“对于探索结构化和非结构化数据的一系列工具、技术和理论,本书给出了丰富、紧凑并实用的介绍。”
——Alex Martelli, Google的不错主管工程师,《Python in aNutshell》的作者
“这是一本非读不可的书,因为现在的数据都散落在各处,令人眼花缭乱。[Matthew]Russell 这位API 达人、社交媒体专家(当然他更像是数据方面的科学家)在社交媒体数据挖掘方面巧妙地开创了先河。”
——Nick Ducoff,Infochimps 公司CEO
“这是一本能让你了解新一代在线数据资源挖掘技术的重要指南。Russel做了件很了不起事,他为社交网站的从业人员准备了一本通俗易读的操作手册,涵盖了如何存取数据以及如何从原始数据中提取有价值的信息的简单方法。”
——Pete Warden,OpenHeatMap.com 创始人
“每当我参与的项目涉及社交数据分析时,本书肯定是我的推荐参考书。书中有很多有用的示例,如果你正开发与数据挖掘相关的项目,那么我郑重向你推荐本书。本书不仅对初学者有用,对数据挖掘的资历人士也极具参考价值。”
——Abe Music,Zaffra 公司总裁
“作者编写本书时肯定乐在其中。他很巧妙地将传统的文本、图形挖掘库与时下流行的社交媒体应用联系到了一起。其示例既言之有物又不失简洁性,不但为读者提供了有价值的建议,也为读者进行更深入的开发和探讨提供了帮助。不论是对于刚涉足社交网络数据挖掘的新手,还是需要了解近期新社交媒体API的资历研究人员来说,本书都是一本很好的指南。”
——Chris Augeri,Nebraska 大学不错研究员
“对任何想涉足社交数据挖掘的人来说,这都一本很好好的书。作者进行了深入研究,从靠前章开始就提供了丰富的示例。它不但易懂而且很有趣。如果你对社交网络数据的挖掘、分析和可视化感兴趣的话,那么本书是你的优选。”
——Jeffrey Humphries 博士;计算机科学家
“在未来几年中,几乎没有任何事情可以阻碍我们通过软件自动了解人际交往方式的脚步。这个话题广博而精深。它一直是众多学术论文和学位论文的研究主题。Matthew真的是将一些容易忽略的东西联系到了一起:他对一系列庞杂而深奥的技术以及埋没在社交网站内的人际沟通方面的知识进行了很实用的讲解。本书出自一位技术高人之手——他对新工具的编程技术了如指掌。本书将为你打开软件未来十年走向的大门。”
——Tim Estes,Digital Reasoning Systems 公司创始人、CEO
“本书告诉你如何有效地利用Twitter API 。”
——Raffi Krikorian,Twitter 公司平台服务组
“Matthew精心挑选的这些数据源、分析技术、数据管理工具以及可视化方面的话题都很好有趣,全面体现了“如何从社交网络获取有价值的信息”领域的近期新思想。他举的例子很生动,是进行深入研究很好的起点。Matthew很好在乎读者能否理解这些材料;本书随处都给出了适时、适用且真正有帮助的提示和建议。本书能激发我深入研究数据进而分析这一领域的兴趣。”
——Roger Magoulas,O'Reilly Media 公司市场研究总监
— 没有更多了 —
以下为对购买帮助不大的评价