本阶段将综合利用前面学习到的Python与数据分析之知识,来学习人工智能项目的开发流程,对二车手、旅游景点、工资、广告点击、音乐推荐等多种信息。
进行项目数据全方位的科学分析,来评估项目的可行性,为投资方决策项目提供科学、严禁的依据,降级项目投资的风险与可行性方案。
随着信息化的进步,数据量随之越来越大。而数据分析是一个可以让数据说话的一个岗位。因此,以后大家学完 Python后,数据分析也是一个主要的就业方向。
章节 | 内容 |
---|---|
章节1 二手车价格预测 | 1_二手车项目介绍 2_爬虫环境搭建与创建爬虫项目 3_爬虫页面分析 4_实现单页面数据爬取 5_实现多页面数据爬取 6_保存数据到CSV文件 7_获取平均价格最高的前10个品牌 8_top10品牌销量与品牌销量占比分析 9_查看某品牌价格分区的概率密度 10_特征工程_标签预处理 11_特征工程_标签特征处理 12_特征工程_品牌one_hot编码 13_数据建模 |
章节2 旅游景点票价预测 | 14_旅游景点项目介绍 15_爬虫环境搭建与创建爬虫项目 16_页面分析 17_爬虫_获取热门城市信息 18_爬虫_获取单页景点信息 19_爬虫_获取多页景点信息 20_爬虫_保存数据到CSV 21_数据分析_读取与了解数据 22_数据探索与清洗1 23_数据探索与清洗2 24_获取评论最多的前10个景点 25_查看景区等级和市区的关系 26_建模_数据预处理 27_建模与模型测试 |
章节3 工资分类预测 | 28_人口薪资普查项目介绍 29_了解数据集内容 30_环境搭建 31_加载数据集 32_查看缺失值 33_查看数据的分布 34_绘制所有数据的分布情况 35_数据预处理与特征工程1 36_数据预处理与特征工程2 37_特征衍生 38_特征编码 39_特征相关性 40_特征降维 41_数据建模与评估 |
章节4 广告点击转化率预测 | 42_项目介绍 43_数据集的介绍 44_环境搭建 45_基线版本的介绍 46_Baseline_统计应用ad点击转换率 47_Baseline_模型预测ad点击转换率 48_统计分析1 49_统计分析2 50_特征工程_年龄_省市_分类函数 51_特征工程_回流时间函数 52_特征工程_特征处理函数 53_训练模型与预测 54_获取特种的重要性 55_算法调参_GridSearchCV |
章节5 文本分类-自然语言处理 | 56_文本分类_项目介绍 57_环境搭建 58_分词的实现 59_去除敏感词汇 60_绘制词云图 61_自定义词云图背景与颜色 62_基于 TF-IDF 算法的关键词抽取 63_基于 TextRank 算法的关键词抽取 64_词袋模型的使用 65_LDA建模的使用 66_朴素贝叶斯简介 67_朴素贝叶斯_准备数据 68_模型训练 69_自定义分类器 |
章节6 音乐推荐系统 | 70_推荐系统介绍 71_推荐系统的解决方案 72_协同过滤介绍 73_协同过滤分类介绍 74_环境搭建与加载数据 75_surprise模块介绍与安装 76_构建训练集数据 77_推荐近似的相关歌单 78_针对用户进行预测 |
章节7 银行客户流失分析 | 79_银行客户流失分析介绍 80_银行客户群体与产品类别 81_客户流失预警的作用 82_数据的加载与描述 83_绘制每个特征分布 84_数值型特征分析_准备数据 85_数值型特征分析_绘制图表 86_字符型特征分析_绘制图表 87_数据预处理_填充缺失值 88_数据预处理_填充缺失值2 89_数据预处理_分类特征的数字编码 90_数据预处理_两个变量的比 91_数据预处理_调用函数 92_特征工程 93_建模与评估 |
章节8申请评分卡 | 94_评分卡项目_概念介绍 95_申请评分卡_概念介绍 96_了解数据情况 97_项目流程介绍 98_环境的搭建 99_加载数据与预处理 100_数据预处理_百分号 101_数据预处理_时间类型_缺失值 102_特征衍生 103_卡方检验介绍 104_卡方分箱原理 105_工具函数_坏样本率编码 106_工具函数_合并箱子方案 107_工具函数_计算WOE与IV值 108_调用工具函数 109_相关性检验 110_建模 |