作者简介: 泰勒?阿克道,Google的不错软件工程师,担任着Data ProcessingLanguages&Systems小组技术负责人的职务。他也是APacheBeam PMC的创始成员。 内容简介: 在传统的数据处理流程中,总是先收集数据,然后将数据放到DB中。当人们需要的时候通过DB对数据做query,得到答案或进行相关的处理。这样看起来虽然很好合理,但是结果却很好的紧凑,尤其是在一些实时搜索应用环境中的某些具体问题,类似于MapReduce方式的离线处理并不能很好地解决问题。这就引出了一种新的数据计算结构---流计算方式。它可以很好地对大规模流动数据在不断变化的运动过程中实时地进行分析,捕捉到可能有用的信息,并把结果发送到下一计算节点。本书讲解流计算原理。 目录: Preface Or: What Are You Getting Yourself Into Here? Part Ⅰ.The Beam Model 1.Streaming 101 Terminology: What Is Streaming? On the Greatly Exaggerated Limitations of Streaming Event Time Versus Processing Time Data Processing Patterns Bounded Data Unbounded Data: Batch Unbounded Data: Streaming Summary 2.The What, Where, When, and How of Data Processing Roadmap Batch Foundations: What and Where What: Transformations Where: Windowing Going Streaming: When and How When: The Wonderful Thing About Triggers Is Triggers Are Wonderful Things! When: Watermarks When: Early/On-Time~Late Triggers FTWI When: Allowed Lateness (i.e., ...
以下为对购买帮助不大的评价