‎人工智能‎尚学堂·百战程序员‎① 快速入门‎人工智能概念与本质‎人工智能的时代 人工智能的应用 人工智能流程对比人类思考的过程 人工智能的流程与本质‎人工智能基本概念与机器学习深度学习本质区别 回归和分类任务的本质 聚类和降维任务的本质‎KNN算法‎KNN原理 Anaconda运行环境安装 Pycharm开发环境配置安装 KNN的python代码实现 Scikit-learn模块讲解 KNN的sklearn代码实战‎② 算法基础‎python基础与科学计算模块‎Python基础语法‎循环控制 切片操作 数据类型 集合操作 常用内建函数 函数式编程 类与对象 继承 装饰器 生成器‎科学计算模型Numpy‎Numpy ndarray对象 Numpy数据类型 Numpy 数组属性 Numpy创建数组 Numpy切片和索引 Numpy高级索引 Numpy广播‎Numpy数组操作 Numpy数学和统计函数 Numpy排序、条件过滤函数 Numpy线性代数‎数据处理分析模块Pandas‎Pandas IO文件操作 Pandas索引和数据选择器 Pandas合并、连接 Pandas缺失值数据处理 Pandas数据离散化 Pandas统计计算‎数据可视化模块‎matplotlib绘图基础API 等高线图的绘制 通过可视化剖析LR逻辑回归损失 matplotlib画饼图、直方图、盒图‎matplotlib画风设置、各种柱状图以及颜色文字等设置‎seaborn的style和color seaborn面对单变量和多变量的图形绘制 seaborn_facetgrid‎AI数学知识‎微积分基础‎导数的定义 左导数、右导数、可导函数 导数几何意义、物理意义 基本函数求导公式 四则运算法则 复合函数求导法则‎神经网络激活函数的导函数求解‎高阶导数 导数与函数单调性 极值定理 导数与函数凹凸性 一元函数泰勒展开‎线性代数基础‎向量与其运算 行向量和列向量 向量加减、数乘、内积、转置 向量范数 特殊向量 矩阵与其运算 方阵、对称阵、单位阵、对角阵‎矩阵加减、数乘、矩阵乘法、转置 逆矩阵 行列式‎多元函数微分学‎偏导数 高阶偏导数 梯度 雅可比矩阵 Hessian矩阵 极值判别法则‎线性代数高级‎二次型 特征值和特征向量 特征值分解 多元函数的泰勒展开 矩阵和向量的求导公式 奇异值分解 奇异值分解计算方式‎奇异值分解性质‎SVD用于数据压缩 SVD用于PCA降维 SVD用于协同过滤 SVD用于矩阵求‎逆‎最优化‎局部最小和全局最小 迭代法求解 梯度下降法推导 牛顿法推导 坐标下降法 数值优化算法的问题 凸集 凸函数 凸优化问题‎拉格朗日乘数法 拉格朗日对偶 KKT条件‎概率论‎随机事件和随机事件概率 条件概率和贝叶斯公式 随机事件的独立性 随机变量 数学期望和方差 常用随机变量服从的分布 随机向量‎随机变量独立性 协方差与协方差矩阵 随机向量的常见分布 最大似然估计‎线性回归算法‎多元线性回归‎简单线性回归 最优解与最小二乘法 多元线性回归判别式 多元线性回归的数学假设 利用MLE推导出目标函数‎对数似然推导出MSE损失函数‎MSE求偏导得到参数解析解 多元线性回归的python代码实现 多元线性回归的sklearn代码实战‎梯度下降法‎梯度下降法原理与公式 学习率设置的学问 GD应用于多元线性回归的流程 全量梯度下降的原理与代码实现‎随机梯度下降的原理与代码实现‎Mini-Batch梯度下降的原理与代码实现 代码实现增加MBGD数据的随机性 代码实现动态调整学习率‎归一化‎归一化目的与量纲 归一化提高模型精度 最大值最小值归一化与缺点 方差归一化与好处 均值归一化与好处‎标准归一化的代码实战与技巧‎正则化‎提高泛化能力与防止过拟合 正则化用于损失函数 L1与L2正则项与范数的关系 结合GD讲解L1L2的几何意义 透过导函数讲解L1的稀疏性‎透过导函数讲解L2的平滑性‎Lasso回归‎Lasso回归原理与代码实战 ElasticNet回归原理与代码实战 升维的意义‎Ridge‎Ridge回归原理与代码实战‎多项式回归‎多项式回归进行升维原理 多项式升维代码实战‎线性分类算法‎逻辑回归‎Sigmoid函数特点 广义线性回归与逻辑回归的数学假设 证明伯努利二项分布属于指数族分布 推导出逻辑回归判别式‎推导出逻辑回归损失函数log loss‎推导出损失函数导函数用于最优化 逻辑回归解决多分类问题OVR 逻辑回归代码实战--鸢尾花数据集分类‎Softmax回归‎Softmax函数特点 广义线性回归与Softmax回归的数学假设 证明多项式分布属于指数族分布 推导出Softmax回归判别式‎推导出Softmax回归损失函数cross-entropy‎证明逻辑回归是Softmax的特例 剖析逻辑回归多分类和Softmax多分类的本质区别 Softmax回归代码实战--音乐曲风分类‎SVM支持向量机‎SVM与感知机关系 几何距离和函数距离 SVM支持向量机算法原理 SVM的损失函数 硬间隔SVM的优化步骤 软间隔SVM‎非线性SVM与核函数‎SVM在sklearn模块中参数详解 SVM人脸识别案例 SVM的概率化输出 SVM的OVO多分类 SVM的hinge loss‎SMO优化算法‎SMO优化算法的子二次规划问题思路 SMO把目标函数从二元函数变一元函数 SMO推导出新的α和旧的α关系 SMO对α进行剪裁‎SMO优化SVM算法代码实现‎③ 机器学习实战‎无监督学习算法‎聚类系列算法‎相似度测量方法 K-means算法原理 K-means图像应用案例 K-medoids算法 K-means++算法 Mini-batch K-means算法‎Canopy聚类算法‎Agnes层次聚类算法 Diana层次聚类算法 DBSCAN密度聚类算法 Spectral谱聚类 微博用户聚类分析案例‎PCA降维算法‎特征选择与特征映射 最大投影方差原理与推导 最小投影距离原理与推导 PCA过程的中心化 Kernelized PCA‎SVD奇异值分解用于PCA‎EM算法‎Jensen不等式 EM算法的E-step EM算法的M-step EM在GMM公式推导中应用‎GMM算法‎单一高斯分布的参数估计 混合高斯分布的似然函数 GMM的计算流程 GMM之图片前景背景分离代码实战‎GMM之根据声音判别性别代码实战 GMM之根据声音判别用户代码实战‎决策树系列算法‎决策树算法‎决策树的算法原理与数学表达 分裂指标_gini系数、信息增益、信息增益率 前剪枝、后剪枝 决策树ID3、C4.5和CART‎决策树算法优略比较 决策树之鸢尾花数据集分类案例 通过graphvis绘制决策树模型‎随机森林算法‎集成学习算法思想Bagging、Boosting、Stacking 用户画像集成学习方法案例 OOB数据集验证随机森林算法 随机森林副产品之特征选择‎Adaboost算法‎Adaboost算法原理 数据的权重与权重错误率 权重错误率调整到0.5训练下一个弱分类器 计算每个样本的权重Un‎应用Adaboost算法做人脸识别‎GBDT‎函数空间的梯度下降与负梯度 推导GBDT回归是拟合残差 Shrinkage衰减系数的作用 推导GBDT分类亦是拟合残差‎GBDT二分类模型训练和使用‎GBDT多分类模型训练和使用 GBDT副产品之特征组合用于降维 实现GBDT+LR架构代码实战‎XGboost算法‎XGBoost算法与决策树集成学习关系 XGBoost目标函数与正则项 XGBoost目标函数用二阶泰勒展开 推导简化XGBoost目标函数引入gh‎XGBoost目标函数加入树的复杂度 推导出XGBoost目标函数最终形式和叶子节点表达式 详解XGBoost算法参数与交叉验证‎XGBoost算法调用GPU显卡资源加速‎Kaggle实战‎药店销量预测案例‎Rossmann药店销量预测_kaggle的介绍 对数据字段的介绍_导包 自定义损失函数 对数据里面的目标变量sales的一个分析‎数据的预处理 模型的训练_评估 kaggle竞赛网站学习‎网页分类案例‎Kaggle网页分类竞赛介绍 评估指标ROC和AUC 评估指标ROC和AUC 竞赛其他相关提交成绩排行榜 数据导入‎MLlib对网页分类竞赛数据预处理‎MLlib对网页分类竞赛数据预处理_模型训练 MLlib对网页分类竞赛模型训练_模型训练评估_搜索最佳超参数‎使用SparkML对网页分类竞赛数据预处理_模型训练_交叉验证调参‎海量数据挖掘工具‎分布式概念‎分布式存储和计算概念 Spark计算框架特点 分布式计算Shuffle流程 Spark RDD五大特性 PySpark模块安装与配置‎代码实战WordCount计算和排序 代码实战蒙特卡洛计算圆周率Pi‎spark分布式计算框架‎算子操作Transformation和Action RDD持久化 宽窄依赖 Spark DAG优化 Spark架构运行剖析 读取分布式HDFS数据与并行度设‎置‎sparkMlib模块‎MLlib的LocalVector之稠密向量和稀疏向量 MLlib的有监督学习数据类型LabeledPoint‎sparkML模块‎ML中用到的DataFrame数据框操作 ML中用到的UDF函数 ML的pipeline流程思路‎④ 深度学习实战‎概率图模型算法‎贝叶斯分类‎朴素贝叶斯分类器 拉普拉斯估计 代码实战垃圾邮件分类‎HMM算法‎马尔可夫过程 初始概率、转移概率、发射概率 隐含马儿可夫原理 维特比算法‎最大熵模型‎熵、条件熵、相对熵、互信息 最大熵模型算法原理 有约束条件的函数最优化问题 最大熵和最大似然估计关系 IIS算法‎条件随机场‎条件随机场的性质 条件随机场的判别函数 条件随机场的学习 条件随机场的推断 CRF与HMM关系‎深度学习原理到进阶实战‎神经网络算法‎从生物神经元到人工神经元 激活函数Relu、Tanh、Sigmoid 透过神经网络拓扑理解逻辑回归分类‎透过神经网络拓扑理解Softmax回归分类‎透过神经网络隐藏层理解升维降维 剖析隐藏层激活函数必须是非线性的原因 神经网络在sklearn模块中的使用‎水泥强度预测案例及绘制神经网络拓扑‎TensorFlow深度学习工具‎TF安装(包含CUDA和cudnn安装) TF实现多元线性回归之解析解求解 TF实现多元线性回归之梯度下降求解‎TF预测california房价案例 TF实现Softmax回归‎Softmax分类MNIST手写数字识别项目案例 TF框架模型的保存和加载 TF实现DNN多层神经网络 DNN分类MNIST手写数字识别项目案例‎Back Propagation反向传播推导‎BP反向传播目的 链式求导法则 BP反向传播推导 不同激活函数在反向传播应用 不同损失函数在反向传播应用‎Python实现神经网络实战案例‎TensorBoard模块‎Tensorboard模块可视化‎⑤ 图像识别‎图像识别原理到进阶实战‎卷积神经网络原理‎感受野与卷积 卷积的计算 权值共享 Stride步长 Padding模式 Pooling池化 TF实现CNN卷积神经网络‎CNN分类MNIST手写数字识别项目案例‎卷积神经网络优化‎梯度消失与梯度爆炸 Dropout防止过拟合 Relu激活函数变形 Xavier Glorot初始化 Optimizer优化器 Data Augmentation数据增强‎Batch Normalization归一化 Cifar10图像识别案例‎经典卷积网络算法‎LeNet AlexNet VGG16 InceptionV3 ResNet DenseNet MobileNet 皮肤癌医疗图像检测项目 GAN生成对抗网络‎ 图像风格迁移项目‎OpenCV模块‎读取IP摄像头 RGB与HSV空间变换 直方图均值化 边缘检测 人脸检测 物体追踪 车道线检测 车牌识别案例‎古典目标检测‎图像金字塔 古典目标检测架构 ROI、IOU、FPS、NMS、mAP IOU代码实现 NMS代码实现 特征金字塔 SPP net ROI池化‎现代目标检测‎Fast R CNN Faster R CNN RPN网络、Anchor boxes Mask R CNN SSD Yolo V1 V2 V3 Cascade R CNN 模型压缩‎上采样_双线性插值_转置卷积‎上采样_repeat 线性插值 双线性插值 转置卷积_以及TF的API 双线性插值作为转置卷积核的初始参数 ROI Align‎FPN思想与网络结构 FPN应用于FasterRCNN_ResNetFPN‎图像识别项目‎⑥ 语言处理‎自然语言处理原理到进阶实战‎词向量与词嵌入‎TFIDF Word2Vec算法 Gensim模块 Skip-gram TF代码实现Word2Vec算法项目 FastText Word Embedding‎深度学习用户画像项目‎循环神经网络原理与优化‎Vanilla RNN Basic RNN实现MNIST手写数字图片识别 LSTM长短时记忆 GRU与双向LSTM 电影评论情感分析案例 Seq2Seq‎机器写唐诗案例‎CNN+LSTM+CRF POS tagging词性标注案例 NER命名实体识别案例 孪生网络 语义相似度分析案例‎Transformer和Bert ‎Attention注意力机制 Attention算法流程 Transformer Self-Attention机制 Multi-Head Attention Bert Bert as service开源项目‎自然语言处理项目‎词向量‎回顾了词向量里面训练的Topology Word2Vec项目代码_加载数据_构建字典 Word2Vec项目代码_构建一个个批次数据‎Word2Vec项目代码_正向传播的Graph构建_NCE损失的计算本质‎Word2Vec项目代码_评估比较相似度_最后的训练绘图 Word2Vec项目代码_总结串讲‎自然语言处理--情感分析‎Keras实战RNN以及词嵌入来做情感分析 数据预处理 代码讲解‎AI写唐诗‎AI写唐诗_数据的读取_字典的构建_文本的索引化 AI写唐诗_训练数据的构建 MultiRNNCell单元‎AI写唐诗_从词嵌入到构建RNN再到输出层概率输出 AI写唐诗_损失的计算_梯度的求解截断和更新_最终的训练代码‎AI写唐诗_模型的使用_增加随机性‎Seq2Seq聊天机器人‎从AI写唐诗到Seq2Seq再到Encoder-Decoder Seq2Seq版Chatbot的数据预处理 Seq2Seq版Chatbot训练和模型使用‎实战NER命名实体识别项目‎回顾CRF训练和使用过程 介绍代码目录结构 NER代码读取数据和预处理 feature进入BiLSTM进行正向传播的过程‎通过CRF层来计算Loss损失以及训练‎BiLSTM-CRF模型的预测代码 CRF中的特征函数们 对比逻辑回归_相比HMM优势 补充标注偏置问题_HMM做分词代码结构‎BERT新浪新闻10分类项目‎BERT新浪新闻10分类项目‎GPT2聊天机器人‎GPT2闲聊机器人‎⑦ 数据挖掘