教学大纲
01
课程性质和目的
数据分析与可视化为数据科学与大数据专业一门专业必修课程。该课程的先修课程有数据结构、程序设计等。旨在培养学生的数据分析、数据应用和数据可视化表达能力。
本课程的主要目的是培养学生的信息数据可视化处理能力。通过本课程的教学,使学生掌握数据可视化的一般原理和处理方法,能使用数据可视化工具对数据进行可视化处理。
02
教学内容和基本要求(60学时)
数据可视化的基础理论和概念、Python语言基础、Numpy数值计算、Pandas统计分析基础、Matplotlib可视化基础、Seaborn可视化、pyecharts可视化、时间序列数据分析、Scipy科学计算、统计与机器学习及图像数据分析等内容。
本课程的教学总时数为54学时。其中,课堂教学时数为30学时,实验教学时数为18学时。可以根据自己教学要求调整。
03
教学方法
多媒体机房教学、案例导向、项目驱动等教学方法、启发学生对学科知识的把握理解和实际操作能力。课程教学方法的改革以调动学生的积极性为核心。除讲授、提问、学生分析、讨论等常用的方法外,结合管理课程的特点,适应本科生培养的要求,探索并完善以 参与式、体验式、交互式和模拟教学等实践教学为基本形式的多种方法。并建立纸质、声音、电子、网络等多种媒体构成的立体化教学载体。
04
教学内容及安排(含实验)
理论部分
第一章数据可视化简介
教学要点:
数据可视化的意义、数据可视化的目标和作用、数据可视化释义。
教学时数:2学时。
教学内容:
第一节 可视化概述(1学时)
可视化的意义、可视化的目标和作用、可视化过程。
第二节Python可视化环境(1学时)
Anaconda的安装与使用
考核要求:
理解:数据可视化的意义、数据可视化的目标和作用
第二章Python编程基础
教学要点:
Python语言基本语法、内置数据类型、函数、文件操作。
教学时数:4学时。
教学内容:
第一节编程语言基础(1学时)
第二节内置数据类型(1学时)
第三节函数定义与使用(1学时)
第四节文件操作(1学时)
考核要求:
掌握Python基础语法,熟悉使用内置数据类型、函数的定义及使用。
第三章Numpy数值计算
教学要点:
Numpy数值计算方法。
教学时数:4学时。
教学内容:
第一节Numpy多维数组(2学时)
数组的创建、索引和切片、数组运算
第二节数组的运算(2学时)
数组读写、统计与分析
考核要求:
理解:多维数组的索引、切片以及读写与统计分析
第四章Pandas统计分析
教学要点:
Pandas中的数据结构、索引、查询与编辑、运算、聚合、交叉表透视表、可视化。
教学时数:4学时
教学内容:
第一节 Pandas数据结构与索引 (1学时)
Series、DataFrame、索引对象
第二节 数据查询与编辑(2学时)
数据查询、编辑,分组运算
第三节 数据透视表、交叉表及可视化(1学时)
数据透视表,Pandas可视化
考核要求:
1.理解:数据结构
2.掌握:数据查询、编辑、分组、可视化方法
第五章Pandas数据载入与预处理
教学要点:
数据载入、数据集成、数据清洗、数据标准化、数据转换。
教学时数:2
教学内容:
第一节数据载入与集成(0.5学时)
数据导入、数据合并
第二节数据清洗(1学时)
缺失值、重复值、异常值处理
第三节 数据标准化、数据转换(0.5学时)
数据标准化、特殊类型数据的转换
考核要求:
1.理解:数据载入与数据变换
2.掌握:数据清洗,数据转换
第六章Matplotlib数据可视化基础
教学要点:
Matplotlib可视化简介、绘图基础,rc参数设置、常用绘图。
教学时数:4学时
教学内容:
第一节数据可视化简介与绘图基础(1学时)
Matplotlib可视化简介,创建画布内容与子图、绘图的保存与显示
第二节 Matplotlib绘图rc参数设置(1学时)
Matplotlib绘图的常用rc参数设置
第三节Pyplot中的常用绘图(2学时)
常用绘图实现,词云生成
考核要求:
掌握:Matplotlib参数设置、常用绘图方法
第七章Seaborn可视化
教学要点:
Seaborn简介、风格设置、常用绘图实现。
教学时数:2学时
教学内容:
第一节Seaborn简介、风格设置(1学时)
Seaborn简介、风格设置
第二节Seaborn颜色设置,常用绘图实现(1学时)
Seaborn颜色设置,常用绘图实现
考核要求:
掌握:Seaborn风格设置、颜色设置、常用绘图实现
第八章pyecharts数据可视化
教学要点:
Pyecharts数据可视化简介、使用方法、常用绘图实现。
教学时数:2学时
教学内容:
第一节高维数据变换(2学时)
Pyecharts数据可视化简介、使用方法、常用绘图实现
考核要求:
掌握:Pyecharts使用方法、常用绘图实现
第九章Scipy科学计算
教学要点:
Scipy科学计算基础、线性代数运算、优化、稀疏矩阵处理及图像处理。
教学时数:2学时
教学内容:
第一节Scipy基础及线性代数基本运算(1学时)
Scipy中的常数和特殊函数、线性代数运算
第二节Scipy中的优化、稀疏矩阵表示、简单图像自处理(1学时)
优化问题,稀疏矩阵处理,图像处理
考核要求:
掌握:Scipy科学计算基础
第十章统计与机器学习基础
教学要点:
统计与机器学习基础与scikit-learn的用法。
教学时数:4学时
教学内容:
第一节 回归分析方法(1学时)
一元线性回归、多元线性回归、多项式回归、逻辑回归、岭回归。
第二节 分类分析(2学时)
主要分类算法及其实现。
第三节 聚类算法简介及实现(1学时)
K-means算法、层次聚类、基于密度的聚类。
考核要求:
1.理解:分类与聚类算法
2.掌握:分类与聚类算法简单实现
第十一章时间序列数据分析
教学要点:
时间序列数据分析介绍、日期和时间数据类型、日期范围、频率和移位、重采样、降采样和升采样。
教学时数:2学时
教学内容:
第一节时间序列分析基础、数据类型(0.5学时)
日期和时间类型数据、时间序列构造、索引与切片
第二节日期范围、频率和移位(0.5学时)
频率和移位、时期、重采样、降采样和升采样
第三节时间序列平稳性检验(0.5学时)
时间序列平稳性检验方法
第四节 数据序列预测基本方法
考核要求:
掌握:时间序列数据分析方法
第十二章文本数据数据分析与挖掘
教学要点:
文本数据分析与挖掘的过程与任务,典型的数据分析方法。
教学时数:2学时
教学内容:
第一节文本挖掘的过程和任务(0.5学时)
第二节文本挖掘的主要方法(0.5学时)
第三节 文本分类与聚类(1学时)
考核要求:
掌握:时间序列数据分析方法
第十三章图像数据分析
教学要点:
Python,OpenCV图像数据分析基础
教学时数:2学时
教学内容:
第一节 OpenCV简介、图像处理基础(1学时)
Python-OpenCV图像处理基础。
第二节 Python-OpenCV典型图像处理方法(1学时)
图像特征提取与分析。
考核要求:
1.掌握:Python-OpenCV图像处理基础与特征分析。
实验部分(18学时)
序号 |
实验内容 |
1 |
Python编程基础 |
2 |
Numpy数据分析案例分析与实现 |
3 |
Pandas数据预处理与可视化综合实验 |
4 |
Matplotlib可视化基础案例分析与实现 |
5 |
Seaborn可视化实战 |
6 |
pyecharts可视化分析实战 |
7 |
时间序列数据分析与可视化实战 |
8 |
统计与机器学习基础案例分析 |
9 |
数据分析与可视化综合案例分析与实现 |
05
AI辅助数据分析样章
06
教学用书
07
内容简介
本书从 Python 数据分析的基础知识入手, 结合大量的数据分析示例, 系统地介绍了数据分析与可视化方法, 带领读者逐步掌握 Python 数据分析的相关知识, 提高解决实际问题的能力。 本书共14 章, 主要内容包括数据分析与可视化概 述、Python 编 程 基 础、 NumPy 数 值 计 算 基 础、Pandas 统计分 析 基 础、 Pandas 数 据 载 入 与 预 处 理、 Matplotlib 数 据 可 视 化 基 础、 Seaborn 可 视 化、pyecharts 可视化、SciPy 科学计算、 统计与机器学习、 时间序列数据分析、 文本数据分析、 图像数据分析和综合案例等。
本书是甘肃省十四五普通高等教育规划教材。
08
教学进度表
09
配套视频演示
10
目录
上下滚动查看 ↓
第1章数据分析与可视化概述
1.1数据分析
1.2数据可视化
1.3数据分析与可视化常用工具
1.4为何选用Python进行数据分析与可视化
1.5Python数据分析与可视化常用类库
1.6Jupyter Notebook的安装和使用
1.6.1Jupyter Notebook的安装
1.6.2Jupyter Notebook的使用
1.7本章小结
1.8本章习题
第2章Python编程基础
2.1Python语言基本语法
2.1.1基础数据类型
2.1.2变量和赋值
2.1.3运算符和表达式
2.1.4字符串
2.1.5流程控制
2.2内置数据类型
2.2.1列表
2.2.2元组
2.2.3字典
2.2.4集合
2.3函数
2.3.1函数的定义
2.3.2lambda函数
2.4文件操作
2.4.1文件处理过程
2.4.2数据的读取方法
2.4.3读取CSV文件
2.4.4文件写入与关闭
2.5本章小结
2.6本章习题
2.7本章实训
第3章NumPy数值计算基础
3.1NumPy多维数组
3.1.1创建数组对象
3.1.2ndarray对象属性和数据转换
3.1.3生成随机数
3.1.4数组变换
3.2数组的索引和切片
3.2.1一维数组的索引
3.2.2多维数组的索引
3.3数组的运算
3.3.1数组和标量间的运算
3.3.2ufunc函数
3.3.3条件逻辑运算
3.3.4数组的集合运算
3.4数组读/写
3.4.1读/写二进制文件
3.4.2读/写文本文件
3.4.3读取CSV文件
3.5NumPy中的数据统计与分析
3.5.1排序
3.5.2重复数据与去重
3.5.3常用统计函数
3.6本章小结
3.7本章习题
3.8本章实训
第4章Pandas统计分析基础
4.1Pandas中的数据结构
4.1.1Series
4.1.2DataFrame
4.1.3索引对象
4.1.4查看DataFrame的常用属性
4.2Pandas索引操作
4.2.1重建索引
4.2.2更换索引
4.3DataFrame数据的查询与编辑
4.3.1DataFrame数据的查询
4.3.2DataFrame数据的编辑
4.4Pandas数据运算
4.4.1算术运算
4.4.2函数应用和映射
4.4.3排序
4.4.4汇总与统计
4.5数据分组与聚合
4.5.1数据分组
4.5.2数据聚合
4.5.3分组运算
4.6数据透视表
4.6.1透视表
4.6.2交叉表
4.7Pandas可视化
4.7.1线形图
4.7.2柱状图
4.7.3直方图和密度图
4.7.4散点图
4.8本章小结
4.9本章习题
4.10本章实训
第5章Pandas数据载入与预处理
5.1数据载入
5.1.1读/写文本文件
5.1.2读/写Excel文件
5.1.3JSON数据的读取与存储
5.1.4读取数据库文件
5.2合并数据
5.2.1merge数据合并
5.2.2concat数据连接
5.2.3combine_first合并数据
5.3数据清洗
5.3.1检测与处理缺失值
5.3.2检测与处理重复值
5.3.3检测与处理异常值
5.3.4数据转换
5.4数据标准化
5.4.1离差标准化数据
5.4.2标准差标准化数据
5.5数据变换与数据离散化
5.5.1类别型数据的哑变量处理
5.5.2连续型变量的离散化
5.6本章小结
5.7本章习题
5.8本章实训
第6章Matplotlib数据可视化基础
6.1Matplotlib简介
6.2Matplotlib绘图基础
6.2.1创建画布与子图
6.2.2添加画布内容
6.2.3绘图的保存与显示
6.3设置Pyplot的动态rc参数
6.3.1全局参数定制
6.3.2rc参数设置
6.3.3绘图的填充
6.3.4在绘图中显示公式
6.3.5文本注解
6.4Pyplot中的常用绘图
6.4.1折线图
6.4.2散点图
6.4.3柱状图
6.4.4饼图
6.4.5箱线图
6.4.6概率图
6.4.7雷达图
6.4.8流向图
6.4.9绘图中的表格设置
6.4.10极坐标图
6.5词云
6.5.1安装相关的包
6.5.2词云生成过程
6.5.3词云生成示例
6.6本章小结
6.7本章习题
6.8本章实训
第7章Seaborn数据可视化
7.1Seaborn简介
7.2风格设置
7.2.1Seaborn绘图设置
7.2.2Seaborn 主题设置
7.2.3设置绘图元素比例
7.3Seaborn中的常用绘图
7.3.1直方图和密度曲线图
7.3.2散点图
7.3.3箱线图
7.3.4散点图矩阵
7.3.5小提琴图
7.3.6柱状图
7.3.7多变量图
7.3.8回归图
7.3.9关系类图
7.3.10热力图
7.4本章小结
7.5本章习题
7.6本章实训
第8章pyecharts数据可视化
8.1pyecharts简介
8.2pyecharts的使用方法
8.3pyecharts常用图表
8.3.1柱状图
8.3.2饼图
8.3.3漏斗图
8.3.4散点图
8.3.5K线图
8.3.6仪表盘
8.3.7词云
8.3.8组合图表
8.3.9桑基图
8.3.10平行坐标图
8.3.11图
8.3.12地图
8.4本章小结
8.5本章习题
8.6本章实训
第9章SciPy科学计算
9.1SciPy中的常数与特殊函数
9.1.1SciPy的constants模块
9.1.2SciPy的special模块
9.2SciPy中的线性代数基本运算
9.2.1基本的矩阵运算
9.2.2线性方程组求解
9.2.3行列式的计算
9.2.4范数
9.2.5特征值分解
9.2.6奇异值分解
9.3SciPy中的优化
9.3.1方程求解及求极值
9.3.2数据拟合
9.4SciPy中的稀疏矩阵处理
9.4.1稀疏矩阵的存储
9.4.2稀疏矩阵的运算
9.5SciPy中的图像处理
9.5.1图像平滑
9.5.2图像旋转和锐化
9.6信号处理
9.6.1数据重采样
9.6.2信号的卷积
9.6.3信号的时频分析
9.7本章小结
9.8本章习题
9.9本章实训
第10章统计与机器学习
10.1Scikitlearn的主要功能
10.2回归分析
10.2.1一元线性回归方法
10.2.2多元线性回归
10.2.3多项式回归
10.2.4其他回归
10.3分类
10.3.1逻辑回归
10.3.2决策树规约
10.3.3KNN算法
10.3.4支持向量机
10.3.5朴素贝叶斯分类
10.4聚类
10.4.1KMeans聚类
10.4.2层次聚类
10.4.3基于密度的聚类
10.5主成分分析
10.6本章小结
10.7本章习题
10.8本章实训
第11章时间序列数据分析
11.1日期和时间数据类型
11.1.1datetime构造
11.1.2数据转换
11.2时间序列基础
11.2.1时间序列的构造
11.2.2索引与切片
11.3日期范围、频率和移位
11.3.1日期范围
11.3.2频率和移位
11.4时期
11.4.1时期基础
11.4.2频率转换
11.4.3时期数据转换
11.5重采样、降采样和升采样
11.5.1重采样
11.5.2降采样
11.5.3升采样
11.6时间序列的平稳性检验
11.6.1时序图检验
11.6.2自相关图检验
11.6.3构造统计量检验
11.7时间序列的拟合与预测
11.7.1ARMA模型
11.7.2ARIMA模型
11.7.3SARIMA模型
11.8本章小结
11.9本章习题
11.10本章实训
第12章文本数据分析
12.1文本数据挖掘的过程与任务
12.2文本分析的主要方法
12.3文本分类
12.4文本聚类
12.5文本可视化
12.6本章小结
12.7本章习题
第13章图像数据分析
13.1OpenCV简介与导入
13.1.1OpenCV简介
13.1.2Python中OpenCV的安装与导入
13.2cv2图像处理基础
13.2.1cv2的基本方法与属性
13.2.2cv2图像处理基本方法
13.3图像特征提取
13.3.1尺度不变特征SIFT提取
13.3.2局部二值模式LBP特征提取
13.3.3ORB特征点
13.4本章小结
13.5本章习题
13.6本章实训
第14章综合案例
14.1体检数据分析
14.2全球气温异常数据分析
14.3红酒数据分析
11
配套题库网站:www.qingline.net
12
部分教案样例
13
AI助教
上一篇:Meta计划面向用户推出AI助手