课程详细信息

课程代码 :
E032520
课程名称 :
数据挖掘
课程英文名称 :
Data Mining
课程简称:
类型 :
院系
开课学期:
春季
学科/院系:
(032)电子信息与电气工程学院(自动化系)
课程学分:
2
是否跨学期 :
总学时:
36
实验课学时 :
讨论学时 :
周学时 :
课程性质 :
专业课
课程层次 :
专业学位课程
课程分类 :
课程类型 :
专业学位非学位课
考试方式:
上课方式:
课程教材语种类型:
中、英文教材皆有
授课语言类型:
仅中文
成绩等级 :
通过不通过
是否绩点统计 :
开课状态 :
开课
任课老师:
课程简介 :
数据挖掘是一个从存储在数据库、数据仓库或其他介质种中的大量数据中发现人们感兴趣的知识的过程。本课程的目的是使学生掌握数据挖掘的基本概念、相关技术及其在不同数据处理和不同规则提取中的应用现状、应用前景和研究方向。教学内容主要包括:(1)数据挖掘的基本概念,功能,处理过程及应用领域;(2)数据预处理,包括数据样本的缺失处理、数据清理和数据降维;(3)针对不同的挖掘任务,介绍各种算法,包括概念描述、关联规则分析、分类回归和聚类;(4)提取的模式的评价和分析,数据结果可视化;(5)各技术的应用实例及前景,使学生对本课程知识有深入的理论与应用的了解。
课程英文简介:
Data mining is the process of discovering interesting knowledge from large amounts of data stored either in database, data warehouses, or other information repositories. Through the study in this class, we mainly make students master the basic concept of data mining, correlative techniques, and their applications. The main content of this class are as follows: (1) The basic concept of data mining, function of data mining, and their application. (2)data preparation including the dealing with missing value, data cleaning, data reduction etc.. (3) some different kinds of data mining methods, which can resolve different problems, There are concept description, association rules analysis, classification & regression, and clustering. (4)Pattern evaluation and analysis. (5) The test example of those data mining methods.
教学大纲:
第1章 序论 主要讲述 数据挖掘技术的发展,概念与处理步骤,功能,应用领域,及其研究发展方向 对学生的要求:了解数据挖掘的基本概念、研究方向和应用领域,结合自己专业知识,思考数据挖掘具体可以解决什么问题。 第2章 数据挖掘的数据预处理 包括数据清理(缺失数据、噪声或离异点数据的处理),数据集成与转换,数据的约解与降维及其应用实例 对学生要求:了解数据挖掘过程的第一步——数据预处理的重要性和必要性,掌握一些经典算法。 第3章 概念描述 包括概念描述与数据泛化的概念,面向属性的归纳(AOI),AOI方法与特征描述,AOI方法学习辨识规则,类别描述及其应用实例等。 对学生要求:了解概念描述的定义,掌握AOI技术,认识其在类别描述中的应用。 第4章 关联规则的提取 讲述基本概念,单维、多维关联规则,多层关联规则等等的提取方法。 对学生的要求:了解各种关联规则提取的方法与特点,掌握单维布尔关联规则提取的原理及算法实现。 第5章 分类与回归 讲述分类与回归的基本概念,具体的算法,如基于概率统计的Bayes分类、基于归纳的决策数分类、基于判别平面或多面体的分类方法、基于统计原理的支撑向量机分类与回归等等,并辅以实例描述。 对学生的要求:认识到分类和回归是使用最广泛的数据挖掘方法,掌握集中最基本的数据挖掘技术,实现算法编程与具体应用,并注意个算法实现的稳健性和有效性。 第6章 聚类分析 讲述聚类的基本概念和主要方法及其应用 对学生的要求:熟悉各种聚类算法,掌握几种聚类算法的实现与应用
教学进度:
第一章 4学时 学生了解数据挖掘的基本概念和解决问题的步骤,了解相关的研究团队和国际国内会议 第二章 8学时 熟悉传统的数据预处理方法,了解最新研究进展和方向,查阅文献选一篇或多篇熟悉并讨论 第三章 4学时 了解概念提取的算法和应用 第四章 8学时 了解关联分析的方法和应用;讨论第二章的文献阅读心得 第五章 4学时 熟悉分类与回归的技术与应用,了解最新研究进展和方向,查阅文献选一篇或多篇熟悉并讨论 第六章 8学时,熟悉和掌握聚类的原理与技术;讨论第5章的文献阅读心得
考试大纲:
数据挖掘课程采用大作业的形式考核学生成绩。大作业为翻译或程序设计。 程序设计的成绩按照以下几个板块进行评分: 1、程序编译是否成功;2、可移植情况;3、界面;4、运行结果;5、文档记录情况;6、程序注释情况;7、平时成绩。(对于调试没有通过的,那么2、3、4项的相应也就没有成绩了。所以希望学生在交作业时,除了源程序外,还要交一个已经编译好可以执行的执行程序) 翻译成绩按照以下几个考虑来评分: 1、翻译的内容是否准确;2、版面是否清晰美观;3、在论文翻译基础上,有没有自己的观点附在后面