• Alink权威指南:基于Flink的机器学习实例入门(Java)
21年品牌 40万+商家 超1.5亿件商品

Alink权威指南:基于Flink的机器学习实例入门(Java)

若图片与书名不一致,以书名和定价为准!

93.87 6.3折 149 全新

库存7件

河北保定
认证卖家担保交易快速发货售后保障

作者杨旭

出版社电子工业出版社

ISBN9787121420580

出版时间2021-10

版次1

装帧平装

开本16开

纸张胶版纸

定价149元

货号8702037

上书时间2024-09-06

中图网旗舰店

十二年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
基本信息
书名:Alink权威指南:基于Flink的机器学习实例入门(Java)
定价:149元
作者:杨旭
出版社:电子工业出版社
出版日期:2021-10-01
ISBN:9787121420580
字数:
页码:
版次:
装帧:平装
开本:128开
商品重量:
编辑推荐

内容提要

目录
目  录章 Alink快速上手11.1 Alink是什么11.2 免费下载、安装11.3 Alink的功能21.3.1 丰富的算法库21.3.2 多样的使用体验31.3.3 与SparkML的对比31.4 关于数据和代码41.5 简单示例51.5.1 数据的读/写与显示51.5.2 批式训练和批式预测71.5.3 流式处理和流式预测91.5.4 定义Pipeline,简化操作101.5.5 嵌入预测服务系统12第2章 系统概况与核心概念142.1 基本概念142.2 批式任务与流式任务152.3 Alink=A link182.3.1 BatchOperator和StreamOperator192.3.2 link方式是批式算法/流式算法的通用使用方式202.3.3 link的简化232.3.4 组件的主输出与侧输出232.4 Pipeline与PipelineModel242.4.1 概念和定义242.4.2 深入介绍252.5 触发Alink任务的执行282.6 模型信息显示292.7 文件系统与数据库342.8 Schema String36第3章 文件系统与数据文件383.1 文件系统简介383.1.1 本地文件系统393.1.2 Hadoop文件系统413.1.3 阿里云OSS文件系统433.2 数据文件的读入与导出453.2.1 CSV格式473.2.2 TSV、LibSVM、Text格式533.2.3 AK格式56第4章 数据库与数据表604.1 简介604.1.1 Catalog的基本操作604.1.2 Source和Sink组件614.2 Hive示例624.3 Derby示例654.4 MySQL示例67第5章 支持Flink SQL705.1 基本操作705.1.1 注册705.1.2 运行715.1.3 内置函数745.1.4 用户定义函数745.2 简化操作755.2.1 单表操作765.2.2 两表的连接(JOIN)操作805.2.3 两表的集合操作825.3 深入介绍Table Environment865.3.1 注册数据表名875.3.2 撤销数据表名885.3.3 扫描已注册的表89第6章 用户定义函数(UDF/UDTF)906.1 用户定义标量函数(UDF)906.1.1 示例数据及问题916.1.2 UDF的定义916.1.3 使用UDF处理批式数据926.1.4 使用UDF处理流式数据936.2 用户定义表值函数(UDTF)956.2.1 示例数据及问题956.2.2 UDTF的定义966.2.3 使用UDTF处理批式数据966.2.4 使用UDTF处理流式数据99第7章 基本数据处理1017.1 采样1017.1.1 取“前”N个数据1027.1.2 随机采样1027.1.3 加权采样1047.1.4 分层采样1057.2 数据划分1067.3 数值尺度变换1087.3.1 标准化1097.3.2 MinMaxScale1117.3.3 MaxAbsScale1127.4 向量的尺度变换1137.4.1 StandardScale、MinMaxScale、MaxAbsScale1137.4.2 正则化1157.5 缺失值填充116第8章 线性二分类模型1198.1 线性模型的基础知识1198.1.1 损失函数1198.1.2 经验风险与结构风险1218.1.3 线性模型与损失函数1228.1.4 逻辑回归与线性支持向量机(Linear SVM)1238.2 二分类评估方法1258.2.1 基本指标1268.2.2 综合指标1288.2.3 评估曲线1318.3 数据探索1368.3.1 基本统计1388.3.2 相关性1408.4 训练集和测试集1448.5 逻辑回归模型1458.6 线性SVM模型1478.7 模型评估1498.8 特征的多项式扩展1538.9 因子分解机157第9章 朴素贝叶斯模型与决策树模型1609.1 朴素贝叶斯模型1609.2 决策树模型1629.2.1 决策树的分裂指标定义1659.2.2 常用的决策树算法1679.2.3 指标计算示例1699.2.4 分类树与回归树1729.2.5 经典的决策树示例1739.3 数据探索1769.4 使用朴素贝叶斯方法1799.5 蘑菇分类的决策树1850章 特征的转化19110.1 整体流程19510.1.1 特征哑元化19710.1.2 特征的重要性19810.2 减少模型特征的个数20010.3 离散特征转化20210.3.1 独热编码20210.3.2 特征哈希2041章 构造新特征20711.1 数据探索20811.2 思路21011.2.1 用户和品牌的各种特征21111.2.2 二分类模型训练21211.3 计算训练集21311.3.1 原始数据划分21311.3.2 计算特征21411.3.3 计算标签22211.4 正负样本配比22411.5 决策树22611.6 集成学习22711.6.1 Bootstrap aggregating22811.6.2 Boosting22911.6.3 随机森林与GBDT23211.7 使用随机森林算法23311.8 使用GBDT算法2342章 从二分类到多分类23512.1 多分类模型评估方法23512.1.1 综合指标23712.1.2 关于每个标签值的二分类指标23812.1.3 Micro、Macro、Weighted计算的指标23912.2 数据探索24112.3 使用朴素贝叶斯进行多分类24412.4 二分类器组合24612.5 Softmax算法24912.6 多层感知器分类器2533章 常用多分类算法25613.1 数据准备25613.1.1 读取MNIST数据文件25713.1.2 稠密向量与稀疏向量25813.1.3 标签值的统计信息26113.2 Softmax算法26213.3 二分类器组合26413.4 多层感知器分类器26513.5 决策树与随机森林26713.6 K近邻算法2704章 在线学习27314.1 整体流程27314.2 数据准备27514.3 特征工程27714.4 特征工程处理数据27914.5 在线训练28014.6 模型过滤2835章 回归的由来28615.1 平均数28715.2 向平均数方向的回归28815.3 线性回归2896章 常用回归算法29216.1 回归模型的评估指标29216.2 数据探索29416.3 线性回归29716.4 决策树与随机森林30016.5 GBDT回归3017章 常用聚类算法30317.1 聚类评估指标30417.1.1 基本评估指标30417.1.2 基于标签值的评估指标30617.2 K-Means聚类30817.2.1 算法简介30817.2.2 K-Means实例30917.3 高斯混合模型31417.3.1 算法介绍31417.3.2 GMM实例31617.4 二分K-Means聚类31717.5 基于经纬度的聚类3208章 批式与流式聚类32418.1 稠密向量与稀疏向量32418.2 使用聚类模型预测流式数据32618.3 流式聚类3299章 主成分分析33119.1 主成分的含义33319.2 两种计算方式33719.3 在聚类方面的应用33919.4 在分类方面的应用343第20章 超参数搜索34720.1 示例一:尝试正则系数34820.2 示例二:搜索GBDT超参数34920.3 示例三:聚类个数350第21章 文本分析35321.1 数据探索35321.2 分词35521.2.1 中文分词35621.2.2 Tokenizer和RegexTokenizer35921.3 词频统计36321.4 单词的区分度36521.5 抽取关键词36721.5.1 原理简介36721.5.2 示例36921.6 文本相似度37121.6.1 文本成对比较37221.6.2 相似的TopN37521.7 主题模型38721.7.1 LDA模型38821.7.2 新闻的主题模型39021.7.3 主题与原始分类的对比39221.8 组件使用小结396第22章 单词向量化39822.1 单词向量预训练模型39922.1.1 加载模型39922.1.2 查找相似的单词40022.1.3 单词向量40222.2 单词映射为向量406第23章 情感分析41223.1 使用提供的特征41323.1.1 使用朴素贝叶斯方法41623.1.2 使用逻辑回归算法41923.2 如何提取特征42323.3 构造更多特征42623.4 模型保存与预测43023.4.1 批式/流式预测任务43023.4.2 嵌入式预测431第24章 构建推荐系统43324.1 与推荐相关的组件介绍43424.2 常用推荐算法43724.2.1 协同过滤43724.2.2 交替小二乘法43824.3 数据探索43924.4 评分预测44424.5 根据用户推荐影片44624.6 计算相似影片45224.7 根据影片推荐用户45424.8 计算相似用户457
作者介绍
2004年获南开大学数学博士学位;随后在南开大学信息学院从事博士后研究工作;2006年加入微软亚洲研究院,进行符号计算、大规模矩阵计算及机器学习算法研究;2010年加入阿里巴巴,从事大数据相关的统计和机器学习算法研发。著有《重构大数据统计》《机器学习在线》等。
序言

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP