正版图书,可开发票,请放心购买。
¥ 42.29 4.8折 ¥ 89 全新
库存138件
作者郝王丽,沈媛媛主编
出版社北京理工大学出版社有限责任公司
ISBN9787576330878
出版时间2023-10
装帧平装
开本16开
定价89元
货号15508145
上书时间2024-12-30
基础篇
第1章Python实现留出法和交叉验证法/3
1.1留出法/4
1.1.1案例基本信息/4
1.1.2案例设计方案/5
1.1.3案例实现/5
1.2交叉验证法/7
1.2.1案例基本信息/7
1.2.2案例设计方案/7
1.2.3案例实现/8
第2章Python实现性能度量/12
2.1 PR曲线/13
2.1.1案例基本信息/13
2.1.2案例设计方案/14
2.1.3案例实现/15
2.2 ROC曲线/18
2.2.1案例基本信息/18
2.2.2案例设计方案/19
2.2.3案例实现 /20
2.3非均等代价/23
2.3.1案例基本信息/24
2.3.2案例设计方案/25
2.3.3案例实现 /26
第3章Python实现线性模型/31
3.1线性回归模型/32
3.1.1案例基本信息/32
3.1.2案例设计方案/32
3.1.3案例实现 /33
3.2对数回归模型 / 36
3.2.1案例基本信息/36
3.2.2案例设计方案/36
3.2.3案例实现 / 37
3.3逻辑回归模型 / 38
3.3.1案例基本信息/ 38
3.3.2案例设计方案/39
3.3.3案例实现 /39
3.4 LDA算法/ 42
3.4.1案例基本信息/42
3.4.2案例设计方案/42
3.4.3案例实现 /43
……
第4章Python 实现决策树 / 46
第5章Python实现神经网络/53
第6章Python实现支持向量机算法/72
第7章Python实现贝叶斯分类/89
第8章Python 实现集成学习算法/106
第9章Python实现聚类/121
第10章Python实现降维与度量学习/130
综合实践篇
第11章鸢尾花数据集分析/137
第12章疾病预测及分类/148
第13章球赛预测/184
第14章航班预测/ 203
第15章天气预测/ 214
第16章房价预测/223
第17章泰坦尼克号生存预测/233
参考文献/ 244
1.1.1案例基本信息
在留出法的应用案例中,选择sklearm库中的鸢尾花数据集进行实践,利用留出法对数据集进行划分,案例相关知识点及详细信息描述如下。
1.案例涉及的基本理论知识点
留出法直接将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另外一个集合作为测试集T。在训练集S上训练出模型后,用测试集T来计算测试误差,作为对泛化误差的评估,通常训练集占70%,测试集占30%。在训练集与测试集的划分过程中,需要注意以下两点。
(1)尽可能保持数据分布的一致性。例如,在二分类任务中,为了保留训练集S与测试集T类别比例的一致性,可采用分层采样法。以包含1000个样本数据且正、反例各占一半的数据集D为例,当按照7:3的比例对数据集D进行划分时,训练集共包含700个祥本数据,正例与反例的比例为1:1。同理,测试集T的样本数据为300个,正例与反例的比例为1:1。
(2)需采用若干次随机划分。数据集D分割方式的多样性导致在分割过程中即使确定了样本分布,也无法保证不同分割方式下得到的训练集S与测试集T能输出稳定不变的结果。因此,在使用留出法时,会采用若干次的随机划分来避免单次使用留出法的不稳定性。假设随机划分的次数为1000,则每次划分都会产生一对训练集与测试集,并通过实验评估计算得到相应结果,在重复进行1000次划分和实验后,取平均值作为留出法的结果。
……
— 没有更多了 —
以下为对购买帮助不大的评价