A Minimal Book Example
1
url: your book url like https://bookdown.org/yihui/bookdown
1.1
数据科学简介
1.2
作者其他书籍
2
Python 基本知识
2.1
Python 基本数据类型
2.2
Python 变量赋值
2.3
容器类型
2.3.1
顺序序列
2.3.2
字典与集合
2.4
变量转换
2.5
容器索引
2.6
逻辑符
2.7
Python模块
2.7.1
创建属于自己的模块
2.8
条件判断
2.9
基础数学函数
2.10
错误处理
2.11
循环
2.11.1
条件循环
2.11.2
迭代循环
2.12
打印
2.13
用户输入
2.14
关于容器的常用操作 Generic Operations on Containers
2.15
关于列表的操作 list
2.16
关于字典的操作
2.17
关于集合的操作
2.18
文件
2.18.1
写文件
2.18.2
读文件
2.18.3
其他相关方法
2.18.4
一个常用的方法
2.19
函数定义
2.20
字符串操作
2.20.1
字符串格式化
2.21
Python 语法糖
2.22
Python 编程注意事项
2.22.1
检查代码风格
2.23
Python 获取帮助
3
Numpy
3.1
创建array 数组
3.2
创建特殊数组
3.3
Nupmy I/O
3.3.1
保存和加载数组
3.3.2
保存和加载文本文件
3.4
Data types
3.5
查看数组
3.6
查询帮助
3.7
数组函数
3.7.1
数组算数运算
3.7.2
比较数组
3.7.3
聚合函数
3.7.4
复制数组
3.7.5
数组排序
3.8
取子集,切片,索引
3.8.1
取子集
3.8.2
切片
3.9
操纵数组
3.9.1
数组置换
3.9.2
改变数组的形状
3.9.3
添加/删除 元素
3.9.4
合并数组
3.9.5
分开数组
4
Pandas 数据分析
4.1
Python 读写数据
4.1.1
读取数据
4.1.2
写入数据
4.2
pandas 数据结构
4.2.1
Series 数据操作
4.3
创建DataFrame
4.3.1
基本数据探索
4.4
重塑数据
4.4.1
将列聚集成行
4.4.2
将行拆分成为列
4.4.3
添加行
4.4.4
添加列
4.4.5
其他有用的函数
4.5
取子集/筛选行
4.6
筛选变量/筛选列
4.7
数据汇总
4.8
处理缺失值
4.9
创建新的列
4.10
聚合数据
4.11
合并数据集
4.12
绘图
5
6
Python 数据可视化
6.1
Matplotlib
6.1.1
绘图工作流
6.1.2
使用Matplotlib绘制各类图形
6.2
Plotly 绘制交互式图形
7
有监督机器学习
7.1
数据处理
7.1.1
标准化 与 归一化
7.1.2
非线性转换
7.1.3
对分类变量进行编码
7.1.4
离散化 (Discretization)
7.1.5
生成多项式特征
7.2
线性模型
7.2.1
线性回归(Linear Regression):
7.2.2
岭回归(Ridge Regression):
7.2.3
Lasso 回归:
7.2.4
逻辑回归(Logistic Regression):
7.3
支持向量机
7.3.1
SVM 原理总结:
7.3.2
使用网格搜索调整参数:
7.4
KNN
7.4.1
KNN 原理总结:
7.4.2
使用网格搜索调整参数:
7.5
决策树
7.5.1
决策树原理:
7.5.2
Sklearn 决策树示例:
7.5.3
使用网格搜索调整参数:
7.6
随机森林
7.6.1
基本原理
7.6.2
Sklearn 随机森林示例:
7.6.3
使用网格搜索调整参数:
7.7
Xgboost
7.7.1
XGBoost 原理总结:
7.7.2
Sklearn XGBoost 示例:
7.7.3
使用网格搜索调整参数:
7.8
特征选择
7.8.1
特征选择原理总结:
7.8.2
Sklearn 特征选择示例:
7.9
模型评估与交叉验证
7.9.1
模型评估与交叉验证总结:
7.9.2
Sklearn 模型评估与交叉验证示例:
8
无监督方法
8.1
聚类
8.1.1
K均值聚类:
8.1.2
层次聚类:
8.1.3
DBSCAN(基于密度的聚类):
8.1.4
谱聚类:
8.2
降维
8.2.1
主成分分析(PCA):
8.2.2
线性判别分析(LDA):
8.2.3
多维尺度分析(MDS):
8.3
离群点检测
8.3.1
1. Isolation Forest:
8.3.2
One-Class SVM:
8.3.3
Local Outlier Factor (LOF):
9
自然语言处理
9.1
分词 (Tokenization):
9.2
词袋表示 (Bag of Words, BoW):
9.3
TF-IDF (Term Frequency-Inverse Document Frequency):
9.4
词嵌入 (Word Embeddings):
9.5
文本分类 (Text Classification):
10
模型部署
10.1
Flask Web API:
10.2
FastAPI Web API:
10.3
Docker容器部署:
10.4
Serverless部署(如AWS Lambda):
10.5
ensorFlow Serving:
10.6
ONNX Runtime:
10.7
使用第三方部署服务:
11
因果推断
11.1
倾向性评分
11.2
Python 中的因果分析库
12
可解释机器学习
12.1
特征重要性分析:
12.2
局部可解释性模型:
12.3
SHAP值:
Published with bookdown
Python 数据科学
Chapter 5