更新时间:2023-08-25 10:44:55
封面
版权信息
内容简介
前言
本书读者
源码下载与技术支持
本书作者与致谢
第1章 机器学习解决问题流程
1.1 机器学习基础
1.1.1 机器学习定义
1.1.2 机器学习流派
1.1.3 机器学习简史
1.2 机器学习解决实际问题的流程
1.3 机器学习平台介绍
1.3.1 阿里PAI
1.3.2 第四范式先知(Sage EE)
1.3.3 腾讯智能钛机器学习(TI-ML)
1.3.4 中科院EasyML
1.3.5 百度机器学习BML
1.3.6 华为AI开发平台ModelArts
1.3.7 微软Azure机器学习服务
1.3.8 谷歌Cloud AutoML平台
1.3.9 亚马逊SageMaker
1.4 本章小结
第2章 问题分析与建模
2.1 问题分析
2.1.1 明确和理解问题
2.1.2 拆解和定位问题
2.2 数据分析
2.2.1 描述统计分析
2.2.2 相关分析
2.2.3 回归分析
2.2.4 分类分析
2.2.5 聚类分析
2.3 问题建模
2.4 心脏病UCI数据集案例
2.4.1 问题描述
2.4.2 问题分析
2.4.3 数据分析
2.4.4 问题建模
2.5 本章小结
第3章 数据探索与准备
3.1 ETL技术
3.1.1 ETL工作方式
3.1.2 ETL实现模式
3.1.3 ETL发展历程
3.1.4 主流ETL工具
3.2 数据清洗
3.2.1 数据缺失处理
3.2.2 异常值处理
3.3 采样
3.3.1 拒绝采样
3.3.2 重要性采样
3.3.3 马尔可夫链蒙特卡洛采样
3.4 本章小结
第4章 特征工程
4.1 数据预处理
4.1.1 特征缩放
4.1.2 特征编码
4.2 特征选择
4.2.1 过滤式选择Filter
4.2.2 包裹式选择Wrapper
4.2.3 嵌入式选择Embedded
4.3 降维
4.3.1 主成分分析PCA
4.3.2 线性判别分析
4.4 本章小结
第5章 模型训练与评价
5.1 模型选择
5.1.1 基础知识
5.1.2 模型选择的要素
5.2 模型训练
5.2.1 留出法
5.2.2 交叉验证法
5.2.3 自助法
5.3 模型调优
5.3.1 超参数调优
5.3.2 神经架构搜索
5.3.3 元学习
5.4 模型评价
5.4.1 分类问题
5.4.2 回归问题
5.4.3 聚类问题
5.5 本章小结
第6章 模型部署与应用
6.1 机器学习模型格式
6.1.1 scikit-learn
6.1.2 TensorFlow
6.1.3 PyTorch
6.2 机器学习模型部署
6.2.1 模型在平台内应用
6.2.2 将模型封装成可执行脚本
6.2.3 基于容器和微服务的模型部署方式
6.2.4 模型部署方式对比
6.3 模型对外访问接口
6.3.1 REST架构
6.3.2 RPC架构
6.3.3 gRPC架构
6.3.4 模型对外接口对比
6.4 模型更新