• MLOps实践――机器学习从开发到生产
21年品牌 40万+商家 超1.5亿件商品

MLOps实践――机器学习从开发到生产

46 4.3折 106 九五品

仅1件

北京通州
认证卖家担保交易快速发货售后保障

作者李攀登 著

出版社电子工业出版社

ISBN9787121431562

出版时间2022-04

版次1

装帧平装

开本16开

纸张胶版纸

页数292页

定价106元

上书时间2024-04-15

灵感飞驰

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:MLOps实践――机器学习从开发到生产
定价:106.00元
作者:李攀登 著
出版社:电子工业出版社
出版日期:2022-04-01
ISBN:9787121431562
字数:
页码:292
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
适读人群 :本书适合数据科学家、软件工程师、ML工程师及希望学习如何更好地组织ML实验的研究人员阅读。                               1.哈佛大学统计学博士,香港大学博士生导师刘中华倾情作序,业内大咖孙明俊、李毅成、陈宇、周鹏飞、秦予平联袂力荐。2.本书系统地介绍了MLOps的方方面面,聚焦于可落地的MLOps实践,为企业推进机器学习生产化提供了有价值的参考。3.本书不仅可以作为企业智能数字化转型的实践参考,也可以作为ML领域从业者的经验手册。4.本书适合数据科学家、软件工程师、ML工程师及希望学习如何更好地组织ML实验的研究人员阅读。
内容提要
在大数据时代,机器学习(ML)在互联网领域取得了巨大的成功,数据应用也逐渐从“数据驱动”阶段向“模型驱动”阶段跃升,但这也给ML项目落地带来了更大的困难,为了适应时代的发展,MLOps应运而生。本书从多个方面介绍了MLOps实践路径,内容涵盖了设计、构建和部署由ML驱动的应用程序所需的各种实用技能。本书适合数据科学家、软件工程师、ML工程师及希望学习如何更好地组织ML实验的研究人员阅读,可以帮助他们建立实用的MLOps实践框架。
目录
目  录章  MLOps概述 11.1  机器学习涉及的概念 11.1.1  监督学习 31.1.2  无监督学习 41.1.3  半监督学习 41.1.4  强化学习 51.1.5  何时使用机器学习 51.2  机器学习相关符号及术语定义 71.2.1  原始数据、输入数据、特征与特征工程 71.2.2  训练样本及预留样本 81.2.3  参数与超参数 81.2.4  参数模型、非参数模型、极大似然估计 91.2.5  机器学习管道 111.2.6  模型选择与性能权衡 121.3  机器学习的工程挑战与MLOps解决方案 131.3.1  MLOps的定义 141.3.2  MLOps与其他Ops的区别 151.3.3  谁在关注MLOps 171.3.4  为什么需要MLOps 191.3.5  MLOps给企业带来的增益 201.3.6  MLOps的工作流程 211.3.7  MLOps工程师需要具备的技能 221.3.8  什么时候真正需要MLOps 231.4  MLOps框架下的工程实践 241.4.1  机器学习工程及生产化模块 251.4.2  机器学习工程模块的设计原则 261.4.3  进行机器学习工程的模块设计时需要注意的细节 271.4.4  编码环境与模型探索 271.4.5  特征存储 311.4.6  实验管理和模型管理 321.4.7  服务 321.4.8  模型服务规模化 331.4.9  模型监控 341.5  本章总结 34第2章  在MLOps框架下开展机器学习项目 362.1  界定业务范围阶段 372.1.1  在项目规划时考虑生产化 372.1.2  业务需求 382.1.3  确定衡量指标和项目范围 382.1.4  设计初步解决方案 402.1.5  制定共同语言 412.1.6  数据权限及准备 442.2  研究与探索阶段 442.2.1  数据探索 442.2.2  技术有效性检查 452.3  模型开发阶段 462.3.1  模型开发的必要准备 462.3.2  模型开发 462.3.3  模型验证 462.4  模型生产化阶段 472.5  机器学习项目生命周期 482.6  团队建设及分工 492.6.1  企业数字化程度 502.6.2  界定机器学习团队的角色 502.6.3  探讨机器学习项目的团队建设与分工 512.6.4  项目外包还是自建机器学习团队 532.7  本章总结 55第3章  MLOps的基础准备:模型开发 563.1  背景概要 573.2  定义机器学习目标 573.2.1  业务问题概述 583.2.2  业务目标 583.2.3  机器学习目标 583.3  数据收集 583.3.1  数据获取 593.3.2  加载数据 593.3.3  关于数据集 613.4  数据预处理 623.4.1  缺失值处理 623.4.2  离群值检测 633.5  数据探索 643.5.1  目标变量 653.5.2  服务分析 653.5.3  用户行为分析 673.6  特征工程 703.6.1  分类和数值列拆分 703.6.2  One-Hot编码 723.6.3  特征缩放处理 733.6.4  目标变量 733.6.5  样本生成 743.7  构建和评估模型 743.7.1  处理非平衡问题 743.7.2  模型构建 753.8  持久化模型 783.9  构建REST API 783.9.1  导入相关库并加载模型 793.9.2  编写预测函数 803.9.3  用户请求 813.10  模型投产 823.10.1  机器学习投产陷阱及挑战 833.10.2  机器学习模型演化:从独立模型到模型工厂 853.10.3  利用MLOps实现模型的规模化投产 863.11  本章总结 87第4章  ML与Ops之间的信息存储与传递机制 884.1  机器学习实验跟踪 894.1.1  机器学习实验跟踪的定义 904.1.2  机器学习实验跟踪的必要性 914.1.3  随时随地管理实验 914.1.4  机器学习实验跟踪与模型管理的区别 924.1.5  在MLOps框架中增加机器学习实验跟踪功能 924.1.6  设计和实现机器学习实验跟踪API 934.1.7  在生产中使用机器学习实验跟踪API 1004.2  A/B在线实验 1014.2.1  创建在线实验的必要性 1014.2.2  确定实验的范围与目标 1024.2.3  样本量的确定方法 1034.2.4  对机器学习模型进行A/B测试 1044.2.5  在MLOps框架中增加A/B在线实验功能 1054.2.6  用于A/B在线实验的MAB方案 1084.2.7  MLOps框架中的A/B实验管理 1104.3  模型注册 1114.3.1  模型注册的定义 1114.3.2  模型注册的必要性 1124.3.3  将模型注册功能融入MLOps框架 1144.3.4  模型注册中心存储的信息 1154.3.5  模型注册的价值 1164.3.6  先从一个简单的模型注册开始 1184.3.7  设计和实现符合MLOps标准的模型注册中心 1194.3.8  在生产中使用模型注册API 1244.3.9  模型注册中心的权限设置 1264.4  特征存储 1274.4.1  特征工程及使用挑战 1274.4.2  特征存储的定义 1284.4.3  在MLOps框架中增加特征存储 1294.4.4  离线与在线特征 1304.4.5  特征存储带来的益处 1314.4.6  特征存储的架构设计 1324.5  本章总结 135第5章  模型统一接口设计及模型打包 1365.1  机器学习模型基础接口概述 1365.1.1  软件开发的策略模式 1375.1.2  Scikit-Learn对接口的处理方法 1385.2  业内一些常见的解决方案 1395.2.1  AWS的机器学习生命周期工具SageMaker 1395.2.2  Meta的机器学习平台FBLearner Flow 1395.2.3  Uber的机器学习平台Michelangelo 1405.2.4  开源的SeldoCore 1405.3  一个简单的机器学习模型接口示例 1405.3.1  继承ModelBase基类 1425.3.2  模型管理基类 1455.3.3  Flask REST端点 1485.4  机器学习项目打包 1485.4.1  模型及代码打包的必要性 1495.4.2  模型和代码打包的事项及示例 1505.4.3  模型序列化 1505.5  本章总结 152第6章  在MLOps框架下规模化部署模型 1536.1  定义及挑战 1546.1.1  机器学习部署的简单定义 1546.1.2  部署机器学习模型的常见挑战 1556.2  对业务的驱动逻辑 1566.2.1  模型部署的边界 1566.2.2  模型部署与业务应用流程的关系 1576.3  常见的设计模式 1586.3.1  用于在线推理的机器学习模型部署的挑战 1596.3.2  什么时候需要在线推理 1626.3.3  什么时候使用批量推理 1626.3.4  数据库批量推理模式 1636.3.5  嵌入式推理模式 1646.3.6  单服务推理模式 1656.3.7  微服务推理模式 1666.4  构建MLOps通用推理服务:模型即服务 1686.4.1  模型即服务的工作流程 1696.4.2  模型即服务的核心服务模块 1716.5  Web服务框架及应用生态 1726.5.1  Web应用程序 1726.5.2  WSGI服务器 1736.5.3  Web服务器 1766.5.4  使用REST API为模型提供服务 1786.6  基于Docker的模型应用程序部署 1796.6.1  Docker的定义 1806.6.2  Docker容器、Python虚拟环境和虚拟机 1806.6.3  构建HTTP REST API 1816.6.4  创建生产级的Docker镜像 1826.6.5  构建并运行Docker容器 1836.7  模型即服务的自动化 1846.7.1  模型即服务的逻辑设计 1846.7.2  模型即服务的通用接口定义 1876.7.3  使用SQLAlchemy ORM重构MLOps的信息存储表 1876.8  在MLOps框架下实现模型部署示例 1906.8.1  将构建好的模型进行注册 1906.8.2  模型部署和服务化 1936.8.3  机器学习实验跟踪功能升级 1956.9  基于开源项目的模型服务解决方案 1996.9.1  基于Kubernetes的资源管理项目KFServing 1996.9.2  机器学习部署平台SeldoCore 1996.9.3  轻量级模型部署及管理平台BentoML 2006.9.4  机器学习生命周期管理平台MLflow 2006.9.5  机器学习模型服务开源方案的总结 2016.9.6  关于机器学习模型部署和服务方案的思考 2016.10  本章总结 202第7章  MLOps框架下的模型发布及零停机模型更新 2047.1  机器学习在生产中的CI/CD 2057.1.1  模型在生产中持续迭代的挑战 2067.1.2  在MLOps框架中添加模型的发布流程 2077.1.3  CI阶段的实践 2087.1.4  CD阶段的实践 2117.2  模型服务的发布策略 2117.2.1  传统软件工程的发布策略 2127.2.2  部署即发布 2127.2.3  制定机器学习模型服务发布策略的必要性 2137.2.4  影子测试策略与渐进式推出策略 2147.2.5  竞争策略 2167.3  零停机更新模型服务 2187.3.1  生产中Flask的局限性 2197.3.2  关于GIL、线程和进程的入门知识 2197.3.3  从单线程的Flask到uWSGI 2207.3.4  模型更新条件检查 2227.3.5  动态更新模型方案 2227.3.6  基于Kubernetes的扩展方案 2277.4  本章总结 228第8章  MLOps框架下的模型监控与运维 2308.1  机器学习模型监控简介 2308.1.1  模型的监控场景 2318.1.2  为什么监控很重要 2328.1.3  机器学习监控与传统软件监控的区别 2338.1.4  谁需要关注机器学习的监控结果 2348.1.5  生产中导致模型衰退或出错的原因 2358.2  数据科学问题的监控 2368.2.1  模型漂移 2378.2.2  决策边界的改变 2388.2.3  模拟漂移与模型重建修正 2398.2.4  数据科学问题监控的常见指标和方法 2408.3  运维问题的监控 2418.3.1  运维问题的监控与可观察性 2428.3.2  运维问题监控的指标定义 2428.4  在MLOps框架内增加监控功能 2438.4.1  机器学习的日志信息记录 2448.4.2  使用特征存储简化模型监控 2458.4.3  A/B在线实验闭环 2468.4.4  模型衰退检测 2478.4.5  模型维护 2498.4.6  模型自动持续训练 2518.4.7  API缓冲 2528.5  本章总结 252第9章  对MLOps的一些实践经验总结 2549.1  机器学习和MLOps平台比较 2549.1.1  聚焦传统机器学习与聚焦深度学习 2549.1.2  聚焦分析探索与聚焦产品化 2559.1.3  面向平民化数据科学与面向数据科学专家 2569.1.4  专业化平台与端到端平台 2569.2  自研MLOps平台 2579.2.1  自研MLOps平台的经验总结 2589.2.2  MLOps框架或平台的搭建原则 2619.2.3  MLOps的架构参考 2649.3  MLOps架构的成熟度评估 2669.3.1  对业务需求的定义 2679.3.2  数据准备 2679.3.3  模型实验 2689.3.4  模型部署 2689.3.5  模型监控 2699.3.6  模型的持续训练 2709.3.7  关于MLOps架构成熟度评估的思考 2719.4  本章总结 271
作者介绍
李攀登,非参数统计硕士, AlgoLink(专注于MLOps研发与应用)的创始人,出海游戏公司博乐科技数据专家。曾任万达集团算法专家,蓝色光标算法团队负责人,Teradata资深数据挖掘工程师,亚信科技高级数据挖掘工程师。研究方向为机器学习、推荐系统、MLOps,拥有机器学习算法应用相关专利7项,MLOps专利2项,软件著作权1项。
序言

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP