线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

数据挖掘课程设计论文8篇

时间:2022-10-30 12:41:27

数据挖掘课程设计论文

数据挖掘课程设计论文篇1

关键词:数据挖掘技术;应用型本科;理论教学;实验教学

中图分类号:G642 文献标识码:A 文章编号:1009-3044(2016)22-0148-02

1 引言

数据挖掘总是让人觉得就是“高大上”、“深不可测”,而该领域当前主要是博士生、硕士生所研究的,另外,也只在一些研究生或重点大学的高年级的本科生中开设数据挖掘课程,在应用型本科院校中很少开设 [1]。

数据挖掘技术应用很广,应用较好的领域、行业有:金融保险业、电信、市场营销分析、医学、体育、生物信息学(Bioinformatics)等方面[2]。在商业领域中,主要应用如:客户细分、客户获得、公司风险管理、企业危机管理、欺诈行为检测和异常模式的发现等;在计算机领域中,主要应用如:信息安全(入侵检测,垃圾邮件的过滤)、互联网信息挖掘、自动问答系统、网络游戏(网络游戏外挂检测、免费用户到付费用户的转化)等[3]。这一技术的广泛应用,必然在相关的企业中迫切需求掌握这一技术的人才。所以,开设数据挖掘技术课程对于应用型本科来说是很有必要的。

但对于应用型本科来说,若是像重点本科院校或研究生课程那样,在教学中以研究型为主,会导致学生的培养要求与教学内容的深度和广度不适应,学生会感觉到学习得很吃力,而且他们今后工作中的需求与所学到的知识相差也较大。对于应用型本科的数据挖掘技术课程的内容的安排,不仅要反映出数据挖掘技术的特点及前沿,还应该结合学生的学习能力及兴趣,也还需要综合考虑本校该课程的学时分配、教学条件等,要具针对性,突出应用这一重点,目的是使学生能够“学以致用”。

本文从应用型本科的实际出发,讨论了数据挖掘课程的理论教学内容及方法、实验教学内容及方法,使学生能够掌握和应用所学的知识。

2 先导课程及课程的基本要求

先导课程有:程序设计语言、数据结构、数据库技术、Web技术、概率论等[4]。必须深入学习一门程序设计语言,从计算机发展和应用角度,推荐学习C/C++和Java;对于“数据结构”课程,掌握树的知识,数据挖掘中的很多算法都涉及树的应用;对于“数据库技术”课程,掌握数据库操作和应用,因为数据挖掘的主要对象是数据库中的数据;对于“Web技术”,因为Web已经存在于我们生活方方面面,对于Web挖掘相当重要,而且还具有巨大的应用价值;对于“概率统计”课程,要能够熟练掌握其中的思维方式、条件概率以及各种分布,在数据挖掘中的关联规则、分类预测等,都会涉及概率统计中的思维和方法。

课程的基本要求:①了解数据挖掘的重要性,了解国内外的发展的状况及未来发展的方向;②掌握数据挖掘中的一些基本概念、经典算法及相关技术;③对于实际应用问题,能熟练地运用数据挖掘技术及工具解决;④为以后进一步深造或进行高级应用开发打下基础。[5,6]

3 理论教学及方法

对于应用型本科生数据挖掘技术课程的教学,本人认为重要的是普及经典算法,若有多余时间,可以补充一些较难的算法。对于经典算法原理的讲解,采取的是一步步地对小数据集案例进行算法演练,以具体化比较抽象的算法,对于算法的优缺点,采取课堂讨论的方式,可以加深学生对算法的理解和吸收。本校的数据挖掘技术课程的理论教学是32个学时,课程的理论教学内容主要包括:

(1)绪论(4学时):①先举几个数据挖掘中有意思的例子。第一个:超市货架的组织―“啤酒与尿布”;第二个:基于拐点变化的股票趋势预测;第三个:网上购物―“定向营销”;第四个:农夫山泉用大数据卖矿泉水;第五个:阿迪达斯的“黄金罗盘”;第六个:网易的“花田”―定制爱情。通过例子让学生对数据挖掘有一个大致的认识,可以提起学生对学习本课程的兴趣,也让学生了解到目前的数据挖掘已经发展到何种程度。②讲解KDD与数据挖掘相关概念。③数据挖掘对象:关系数据库、数据仓库、事务数据库、空间数据库、时态和时间序列数据库、文本数据、万维网数据、流数据等等。④数据挖掘的方法与相关领域:分类预测型和描述型,通过例子简单介绍聚类、关联规则、分类算法的概念、应用领域等,使学生对要学习的算法有大致的认识。⑤数据挖掘软件与应用系统:介绍数据挖掘软件:IBM Intelligent Miner、SPSS Clementine、Microsoft SQL Server 2008 Data Mining、Weka;数据挖掘应用系统:介绍在商业领域和计算机领域的应用。

(2)数据预处理(2学时):先对数据进行概述,包括:数据集的三个特性:维度、稀疏性和分辨率,它们对数据挖掘技术具有重要影响;数据挖掘中一些很常见的数据集的类型:记录数据、基于图形的数据和有序的数据。然后分别详细介绍数据预处理的主要任务:①数据清理;②数据集成;③数据变换;④数据归约;⑤数据概念分层与离散化。每一项任务举例讲解。

(3)关联规则(6学时):主要介绍关联规则的相关概念、关联规则的经典算法Apriori及它的改进算法FP_Tree、规则的产生,简单介绍多级关联规则和多维关联规则、非二元属性的关联规则、关联规则的评估(提升度(lift) /兴趣因子的计算)等。

(4)聚类(6学时):主要介绍聚类的概念及距离的计算(欧氏距离、曼哈顿距离、明可夫斯基距离)、基于划分的聚类算法(基本K-means聚类算法及其拓展、PAM算法)、层次聚类算法(凝聚的层次聚类算法AGNES、分裂的层次聚类算法DIANA)、基于密度的聚类算法(DBSCAN);简单介绍层次聚类方法的改进―BIRCH算法、CURE算法以及聚类算法评价。

(5)分类和预测(10学时):①决策树(4学时):主要讲解决策树的概念、信息论、ID3算法和C4.5算法。②贝叶斯分类(2学时):主要讲解贝叶斯定理及朴素贝叶斯分类算法。③人工神经网络(4学时):主要介绍人工神经网络的概念及单感知器模型,简单介绍BP神经网络。

(6)数据挖掘模型的评估(2学时):简单介绍模型的过拟合、没有天生优越的分类器、模型选择和模型评估、评估分类器或预测器的准确率――简单划分和交叉验证、数据挖掘模型评估的错误观念。

对于9个需主要介绍的经典算法的讲解,如Apriori算法,先介绍算法的流程,然后通过超市购物篮的一个小数据集一步步地进行算法的演练,得出频繁项集,如下图所示:

又如决策树算法和朴素贝叶斯分类算法,通过如下所示的关于动物的数据集,一步步地进行相关算法的演练,通过建立决策树或计算概率问题,判断一个未知的动物X={1,0,0,1,?}是否会生蛋。

对于算法的优缺点,在讲解完算法的过程之后,采取课堂讨论的方式,与学生共同分析总结算法好在哪里,不足又在哪里,学生通过参与,可以加深对算法的理解与掌握。

4 实验教学及方法

对于应用型本科的学生来说,采用Weka进行算法编写是不切实际的,实验教学工具建议采用目前一些主流的数据挖掘软件,如 SPSS Clementine或 Microsoft SQL Server 2008 Data Mining等[7]。这些软件都具有必需的数据预处理工具及预设的挖掘算法,学生可以把注意力放在要挖掘的数据及要相关需求上,设定挖掘的主题,然后采用这些软件完成相关主题的数据挖掘过程,这样也可以积累一定的处理实际挖掘问题的实战经验,今后碰到项目时也可知道从何处下手。

本校的数据挖掘技术课程的实验教学是8个学时,共两次上机,采用Microsoft SQL Server 2008 Data Mining对Adventure Works DW 2008R2 示例数据库进行数据挖掘。课程的实验教学内容主要包括:

实验一:SQL Server 2008 数据多维分析环境的建立;

实验二:关联规则挖掘方法;

实验三:决策树挖掘方法;

实验四:聚类挖掘方法。

为了让学生更好地进行实践动手,在教学中分两步:第一步,具体的操作步骤的讲解,由老师进行;第二步,学生上机并详细的分析挖掘结果,要求学生熟悉使用Microsoft SQL Server 2008进行数据挖掘的步骤,以及几种常用的算法的挖掘过程:包括创建数据源、创建数据源视图、创建挖掘结构(主要参数的设置)、处理和浏览挖掘模型。如关联规则,要求学生分析挖掘的模型,找出有价值的规则出来。

5 结论

为迎接大数据时代带来的互联网经济机遇,很有必要同时也是时代迫使在应用型本科中开设数据挖掘课程。对这一类学校的教学也是一个挑战,需要老师们在教学过程中不断摸索和改进。在教学过程中,需要针对应用型本科生的学习能力、知识结构,设计好教学内容并采用适当的教学方法,从而使学生对学习的内容感兴趣,改进课堂教学效果,以提高学生实际动手能力,使学生对数据挖掘课程的整体结构、基本概念、经典算法有较深入理解和掌握,最终达到教学目的。

参考文献:

[1] 徐金宝.对应用型本科生开设数据挖掘课程的尝试[J].计算机教育,2007(14):27-29,57.

[2] 李姗姗,李忠. 就业需求驱动下的本科院校数据挖掘课程内容体系探讨[J].计算机时代,2015(1):60-61,64.

[3] 张艳.大数据背景下的数据挖掘课程教学新思考[J].计算机时代,2014(4):59-61.

[4] 李忠,李姗姗. 应用型本科院校IT专业数据挖掘课程建设[J].计算机时代,2014(11):65-69.

[5] 张增平,乔晓华. 针对应用型本科生数据挖掘课程的教学实践[J].内蒙古财经大学学报,2015,13(4):132-137.

数据挖掘课程设计论文篇2

关键词:大数据;数据挖掘课程;教学方法;人才培养

近年来,在社会发展和科学进步的过程中,以信息技术为中心的各领域产生了丰富的数据,引起了社会各界人员的高度关注。体量大、速度快、模态多和价值密度低是大数据具有的特点,其能够促进科学和社会经济的进一步发展,对国家安全也具有重要的影响。然而从大量数据中挖掘出有价值的信息和知识是需要专业的数据挖掘人才来实现的,因此,在高校数据挖掘课程教学过程中,教师要创新教学方法,运用科学的教学理论培养学生对数据的意识,从而促进教学质量的提高和大量数据人才的培养。

一、科学引导,培养数据意识

在我国的各大高校中,数据挖掘课程是理科和工科都开设的一门课程,其专业性质较强,最初开设这门课程的主要目的是在于让学生了解数据的相关概念和挖掘数据的相关技术手段,并能够在以后的社会实践中应用到数据挖掘技术。但社会经济的发展和科学技术的进步,给数据挖掘课程带来了较大的挑战,仅仅是了解数据的相关知识和掌握浅层次的数据挖掘技术是不能适应时展需求的。因此,需要开设数据挖掘课程的高校教师在教学过程中对学生要进行科学的引导,注重培养学生的数据意识,提高学生对数据挖掘课程的积极性。

数据驱动的理论分析和应用是数据挖掘课程的重点,具体性和抽象性是其具有的两个特点。数据挖掘课程的主要研究对象是具体的数据,并从数据中挖掘出有价值的信息和知识,能够对数据进行解释和理解,这主要体现出数据挖掘课程的具体性特点;而在进行数据挖掘过程中使用的理论、方法和技术等概念,体现的是数据挖掘课程的抽象性,其在课堂学习过程中的消化和理解的难度是较大的,因为时间较短。由于种种因素对数据挖掘课程造成影响,因此在设计数据挖掘课程的教学之前,首先要做的就是让学生对数据挖掘课程感兴趣,并在发展过程中使学生的数据意识得以培养和提高。

在设计数据挖掘课程的教学过程中,可以增加讲解什么是数据、数据有什么作用、所具有的重要性等的学时,加强学生对数据的认识和重视。处在大数据的时代环境下,要让学生了解什么是“大数据”,而生活中的哪些方面存在大数据、大数据是以何种增长方式在哪些领域进行发展的大数据能够发挥作用等。教师在教学过程中可以使用多媒体教学的方法,通过实例和声像的展示,让学生了解生活中存在的数量,并清楚的掌握数据挖掘的技术方法,并从大量的数据中挖掘出有价值的信息和知识,为社会发展和企业进步提供服务,让学生了解在企业的发展过程中,数据挖掘的重要性。为了增加学生对数据挖掘课程的兴趣和重视程度,在教学过程中,教师还可以将数据分析和数据挖掘的相关招聘案例融入到教学过程中,从数据挖掘课程以往的就业率、职位性质、工资待遇及未来的职业发展前景等方面来增加学生对数据挖掘课程的兴趣,有利于在以后的学习生活中更好地掌握数据挖掘技术和应用数据知识。

二、深化基础,加强理论体系

现有的数据中心技术因大数据的特征而很难满足数据分析的需求,去噪降维技术、数据储存、数据整合、数据特征表示、数据通信传输和处理,以及非结构化和半结构化处理等方面是其主要表现。基于此,数据挖掘技术面临的局势较为严峻,并且数据挖掘课程是一门综合性较强的学科,涉及的内容较为广泛、复杂,主要包括数据库技术、统计学知识、机器设备知识、信息检索技术和智能计算等学科内容。然而现阶段的高校在教学设计过程中难以在有限的时间里将这些学科全部开设,即使是将这些学科全部开设了,每个学科的课时就会较少,不利于各学科的深入学习,从而对数据挖掘技术的掌握造成不同程度的阻碍。为了解决这个问题,在高校进行教学设计的过程中,可以把大三或大四的学生作为数据挖掘课程的主要教学对象,因为这部分学生对自己的职业生涯有清晰的认识,并且在大一、大二的学习过程中有一定的知识基础。在大一学年和大二学年开设高等数学、统计学、算法分析、智能计算、数据库原理和计算机系统原理等学科,为数据挖掘课程的学习做好基础性的工作。在教学过程中,教师也可以向学生推荐数据挖掘课程相关的数据,最好的专业领域较为著名的案例,有利于鼓励学生学习数据挖掘课程的自信心。外语水平也是数据挖掘课程对学生的一个要求,因为只有掌握了高水平的外语,才能够了解国外的数据挖掘技术的发展水平,全面的掌握国内外的数据挖掘发展情况。所以在设计高校数据挖掘课程的教学过程中,要推进基础知识的深化以及理论体系的完善,为日后的数据挖掘课程的学习奠定知识基础。

三、联系实际,创新教学方法

实践是理论来源的基础,对于理论的检验,实践是最有效的途径。由于数据挖掘技术具有强烈的抽象性,以至于学生对大数据的认识较为模糊,让学生了解数据挖掘课程的内容和在实际生活中的应用所采取的方式就是教师的教学方法。案列教学法是教学过程中最好的教学方法,有利于学生对数据挖掘知识的了解和掌握,还有利于学生掌握良好的数据挖掘技术方法。通过案例教学法,让学生了解数据挖掘在生活中的重要作用,在处理大数据时具有很大的作用。

教师在积极转变教学内容和教学方法的同时,学生也应该积极探索提高学习质量的方法,在课堂教学过程中,虽然教师起主导作用,但是课堂的主体仍然是学生。对于教学内容,学生应该主动接受,与被动接受相比,会获得较好的学习效果,因此要让学生欣然地接受教师教学过程中的新内容和新方法。此外,在上机实验课程的教学过程中,对于案例中的具体案例需要学生亲自来演算,而教师在这个过程中主要是引导和指导,启发学生对深层次内容的创新思考。还可以在每次采集和试验案例之后,要求学生提交相应的分析研究报告,这样一来,学生对于大数据挖掘课程的接受程度能够被教师很好地掌握,从而完善教师的教学方法,提高教学质量。

四、增强兴趣,深入科学研究

数据挖掘在大数据下面临着巨大的挑战,数据挖掘学科是一门综合性的学科,其中涉及的其他学科较多,所以学习难度和教学难度较大。因此在教学过程中要充分发挥教师的主导作用,引导学生对数据挖掘课程的深入学习。例如,让学生间隔性地去了解大数据环境下数据挖掘技术解决了什么问题,甚至让他们调查如今各大型招聘网中有关大数据分析和数据挖掘等职位的情况,进而增强学生对数据挖掘的兴趣。此外,对于年级较高的学生来说,深造是其主要选择的方式,也可以通过出国或是考研等渠道进行知识资源的深入学习,从而掌握更多的知识,提升自身的综合素养。对于这样的学生,教师应该通过鼓励的方式使其选择研究数据挖掘方向的科学,为了充分有效地提高这部分学生的研究水平,教师可以给学生布置一些具体的课题任务,课题任务的研究内容一定要保证精细程度,甚至可以精细到数据挖掘过程中使用的一个方法的研究,这有利于学生深刻认识课题任务重要性的培养,同时还有利于学生较为准确地把握问题研究的方法和内容。提高学生对新型研究技术和研究方法的掌握,可以增加学生的经典文献的阅读量,在这个过程中,学生的创新性思维得到了有效培养,教师还要采取有效的措施引导学生进行学术性的创作研究。在实际的教学过程中,将科学研究引入到其中,有利于促进学生对新知识的理解和吸收,还能够使学生解决问题的能力得到有效提升,为学生研究大数据的挖掘提供有利保证,并且打下一个坚实的基础。

五、结语

在大数据环境下,数据挖掘课程是各大高校急需开设的一门课程,教师在教学过程中,要使用创新的教学方法,让学生真正地了解到数据挖掘技术对社会进步和企业发展的重大作用。教师还要结合教学经验,重点从培养学生的数据意识、加强理论体系、创新教学方法和深入科学研究等方面进行数据挖掘课程教学设计,为提高大数据环境下挖掘课程的教学质量提供参考依据。

参考文献:

[1]刘建伟.数据挖掘课程设计的教学探索[J].科技信息,2013,(23).

[2]黄美丽.“数据仓库与数据挖掘”研讨型教学实践探析[J].计算机时代,2012,(12).

[3]周森鑫,盛鹏飞,王夫芹.数据挖掘课程案例教学研究[J].计算机技术与发展,2012,(11).

数据挖掘课程设计论文篇3

关键词:任务驱动;探究式;课程改革

中图分类号:G642 文献标识码:A 文章编号:1009-3044(2014)06-1253-03

Applied Research of Task-driven Inquiry Teaching Model in Data Mining Course

HUANG Jian

(Zhejiang Wanli University, Department of Computer Science and Information Technology, Ningbo 315100, China)

Abstract: The task-driven inquiry teaching model is a teaching activities which students as the main body, teachers as the leading. It fits the data-mining course. Not only using task lead the student to inquiry learning, but also improve teachers during the teaching process. Based on the data mining course teaching reform practice, summarizes the task-driven inquiry teaching mode in general process and the specific content of the reform. Practice has proved, this teaching mode is good for improving undergraduate courses teaching quality.

Key words: Task-driven; Inquiry; Curriculum reform

数据挖掘是一门包括了数据库系统、专家系统、机器学习、统计学、模式识别、信息检索、人工智能等学科的综合性的学科,其目标是发现隐藏在大型数据集中的知识模式。此课程一般是在研究生教育阶段开设[1],但随着社会对应用型人才的需求越来越大,这就要求我们的学生毕业后不仅要有扎实的理论基础,更要有较强的创新能力和实践能力。

我校针对信息与计算科学及统计学两个专业开设了数据挖掘课程。该专业学生拥有较强的数学理论基础,并掌握了数学建模、统计学、数据库等相关学科。数据挖掘作为一门综合性课程,是融合学生各科知识,提高该专业学生应用实践能力,培养学生团队协作能力的很好的载体课程。

1 数据挖掘课程教学特点

数据挖掘技术是一个多学科交叉的综合研究领域。不过也正因为它涉及的范围很广泛,发展的时间也不是很长,因此要真正理解数据挖掘的本质并不是一件容易的事情。我校针对信息与计算科学和统计学两个理学专业开设此课程,并将此课程归类为实践类课程。经过笔者多年对传统教学方法的研究和改革,发现了在数据挖掘教学中存在的问题:

1) 理论教学困难:数据挖掘课程内容涉及领域广泛,如统计学、数据库、机器学习、模式识别等内容,并且所涉及的算法繁多。由于本科生的知识体系不健全,理论基础相对薄弱,造成了学习难度过大。此外,由于学时限制,无法在课堂中详细地讲述算法理论,导致了学生积极性不高,很难达到教学目标。

2) 实践环节无法让学生体会数据挖掘本质:数据挖掘是从数据获取、数据整理、预处理、数据挖掘分析、结果分析等一系列流程的综合。但由于课时关系,我们课程中的实践环节往往是针对某个特定的算法,让学生利用已经预处理好的数据进行算法的应用。数据挖掘成本很高,但是这个成本往往并不是金钱,而是时间,而数据整理和预处理的时间往往占到全部工作量的80%。不经过完整的数据挖掘流程训练,学生就无法体会数据挖掘的本质。

3) 软件应用缺乏:针对海量数据分析是必须要应用到计算机技术处理。当今针对数据挖掘应用的软件很多,如SAS公司的EM模块、SPSS的Modeler、WEKA、Matlab以及各数据库系统配套的OLAP功能等。在课堂中,不可能对任何一款软件都详细的进行讲解。这就使得学生很难进行算法的应用实践。

2 任务驱动探究式教学模式

针对目前教学存在的这些问题,广西大学梁斌梅提出了目标驱动的专业课教学法,利用导入课吸引学生、利用教学目标引导学生[2]。韩秋明等人编著的《数据挖掘技术应用实例》中采用了大量的行业数据,为数据挖掘教学模式的改革提供大量的应用实例[3]。结合本校的学生特点,参考国内的一些研究成果,该文提出了基于任务驱动探究式教学模式。课程整体主线由任务驱动,学生进行探究式自主学习。

任务驱动是基于构建主义教学理论基础上的教学方法,以学生为主体,以老师为主导的一整套教学新模式。而探究式教学是与直接接受式教学相对的,在任务驱动的同时,激发学生的好奇心,并驱使学生投入到知识获取的自主学习活动中。任务驱动探究式教学模式是将两者有机的结合起来,使学生能够明确学习目标、提高学习兴趣、提升学习动力,发挥学生的自主学习能力、创造能力,培养学生分析问题、解决问题的能力。通过自主学习,自行的完成阶段性的教学任务,以达到相应的教学目标。任务驱动探究式教学模式,适合操作性和应用性强的课程。任务驱动探究式教学模式的核心思想是在教学方面强调任务驱动,在学习方面则强调探究式学习。因此必须合理地设计课程教学方案,在“教”和“学”两个方面进行设计。老师必须在任务设计、实施进程管理、信息反馈等各方面做好衔接,保证学生能够时刻跟上任务进度,并保持足够的兴趣度。

3 基于案例驱动探究式教学模式的数据挖掘课程改革

任务驱动探究式教学模式是以学生为主体,教师主导的新型教学模式。教师的作用在于教学组织和任务布置的安排调度。利用任务引导学生学习相关知识,提高学生的学习主动性。因此,如何根据课程需要合理地进行课程任务设计,安排任务进度都是课程改革成功的关键。

3.1 课程内容重新整合

数据挖掘是一个由数据收集、数据预处理、数据分析挖掘、结论分析等各个步骤组成的整体过程。在现有的数据挖掘书中,针对数据收集、数据预处理部分往往比较简化,大部分篇幅都在讲述数据挖掘算法,如分类算法、关联算法、聚类算法。如果在课程内容设计时,仅仅对算法做重点讲述而忽略前期步骤,将会造成学生内容知识的脱节,无法体会数据挖掘整个流程,从而不能真正地理解数据挖掘思想本质。因此,本课程教学目标应该是重点培养学生分析问题、解决问题和团队协作能力,树立数据挖掘思维体系,了解数据挖掘基本算法,能够应用数据挖掘软件解决实际问题并得到结果。

根据这个教学目标对课程内容进行适当调整。首先,增加绪论内容并设置导入课。在导入课中增加生活中学生感兴趣的数据挖掘故事,经典案例以及各行业中的应用,从而提高学生学习的兴趣。其次,适当增加数据获取、数据预处理以及数据挖掘软件的介绍,使得学生能够明确数据怎么来、如何处理以及用什么工具处理等问题。最后,有选择地介绍基本的数据挖掘算法,所介绍的算法应该是常见、易懂并且能够很容易使用软件实现的,如决策树算法、K均值聚类算法、Apriori算法、朴素贝叶斯算法等。而针对比较难的算法,可以仅做介绍,让学生在今后遇到此类问题能够自主的进行学习。通过内容的调整,一方面使得学生不会因为数据挖掘算法繁多且复杂而惧怕,保证学生的学习兴趣,从而很好的引导其自主学习,提高教学效果。另一方面,数据挖掘算法在不断的改进,不可能在课程中覆盖所有。通过基本算法和工具的结合,能够很好地帮助学生从算法理论转变成算法实现,从而真正的进行数据挖掘工作。即使出现了新的算法,也能够举一反三,进行软件实现。

3.2 组织方式的改变

任务驱动探究式教学模式必须以课程任务为依托。改变以往以纯理论的教学方式,加入实践和课堂讨论环节,将理论知识讲解和课程任务有机地结合到一起。考虑到数据挖掘连贯性以及工程庞大性,可以考虑以项目化的方式进行。将学生6个人左右分为一组,自主的在老师所提供的数据共享平台中寻找感兴趣的问题进行分析研究。将整个项目分解成为数据搜集、数据预处理、探索性分析、数据挖掘、结果分析等一系列的小任务,安排阶段性的任务目标,层序渐进,逐步的建立学生完成项目的信心并最终完成整个项目。

学生是项目的负责人,在接受一个短期任务后,就要自主的开始进行任务的执行。老师仅仅在课堂中进行了基本知识的讲解,学生要完成任务就必须学习更多的课外知识。项目的研究内容是自己选择的,而且完成阶段性的任务并不是那么的遥不可及,所以学生有足够的兴趣和信心去完成。通过查阅资料、学习知识、任务分配、安排和组织实施等,完成教学任务的同时也锻炼了他们团队合作意识、沟通能力、自主学习能力。这些能力的培养才能使他们在知识不断更新的当今,紧密地跟紧前沿技术并更好的去解决实际问题。

3.3 任务进度控制和评价

课程的课堂教学时间是有限的,老师不可能在课堂中既完成理论教学,又给足时间让学生进行课程任务,所以项目的实施必须是在课后进行。学生要在课外进行大量的参考资料阅读、相互讨论及数据分析的工作。那么老师作为主导者,必须及时地了解学生阶段性任务的完成情况,对当前学生遇到的困难及时给出建议和意见,甚至在学生遇到真正的难题给予技术上的支持。所以本课程在理论课教学的同时,也开展了定期的讨论课,让学生定期汇报阶段性任务的完成情况,及时进行任务进度的控制。整个项目的实施流程和任务分解如图1。根据流程安排,理论引导学生任务的进行。通过学生任务的完成情况,老师在完成基本理论教学的同时,有针对性的对学生所遇到的问题进行讲解,最终目标是引导学生完成整个教学项目。一方面,学生自主学习能力提高,有足够的兴趣和能力去完成每个阶段的任务,并且会更加认真的在理论课中寻找自己想得到的知识。另一方面,由于学生自主寻找的项目多样性,选择的算法不可控性,同样促使老师不断的提高自身,教学内容不再一成不变,而是随时的更新。

图1 任务进度安排流程图

良好的进度控制需要一个完善的评价体系做辅助。只有做好每个阶段性的评价,引入一定的竞争机制,才能提高学生积极性和自信心。首先,必须做到极端性任务的目标和时间明确化。要完成什么,在什么时候完成,都必须事先和学生约定。对没有按时完成任务的组,必须做出相应的惩罚,如扣除本阶段的得分。除此之外必须分析原因,搞清为什么无法完成任务,有针对性地提出建议和意见,以便学生能够及时调整。其次,评价标准既要唯一又要区别对待。唯一标准指的是一样的进度,一样的任务,一样的要求。但是数据挖掘项目会根据研究领域不同、使用算法不同、数据质量不同而造成难度差异,一味的同等标准要求会造成选择难度较高项目的学生积极性下降。所以老师必须客观的分析每个项目难度,并区别对待。对于由客观难度造成任务进程落后的组,应当在解决问题后给予奖励。并且,在最终论文评定时,适当的加入一定的难度分,以鼓励学生培养自我挑战的精神。通过教师评价、组长评价、组间评价等评价方式,客观的合理的对整个项目实施作出最终的评价结果。

4 结束语

通过案例驱动探究式教学模式的改革,数据挖掘课程在教学效果上得到了实质性的提高。人才培养上卓有成效,老师也在教学过程中受益良多。通过教学模式的改革,使得原本枯燥、难懂的理论教学变得生动。学生的求知欲望得到了激发,课程的学习目标更加的明确,教学质量也有很大的提高。同时我们发现,学生的自主学习能力、汇报能力、论文撰写能力都有了明显的提高,并且有很多教学项目被用于毕业论文的研究。数据挖掘课程也因此被选为宁波市级的智慧产业核心引导课程。

参考文献:

[1] 胡建军.浅谈数据仓库与数据挖掘的本科教学[J].广西科学院学报,2007(3):29-210.

数据挖掘课程设计论文篇4

关键词: 数据挖掘; 知识体系; 案例教学; 教学评价

中图分类号:TP311 文献标志码:A 文章编号:1006-8228(2014)04-59-03

Abstract: With the advent of the era of big data, data mining has become an essential technology which has important social value in the field of business, healthcare, manufacture and administrative management, etc. In many universities, the course of data mining is an important course which is integrated with other disciplinary knowledge and plays an important role in talent cultivation. According to the characters of big data, the knowledge hierarchy data mining is presented, and case teaching and new teaching evaluation method in graduate students' data mining course are discussed. The result shows that the effect is good and it is welcomed by graduate students.

Key words: data mining; knowledge hierarchy; case teaching; teaching evaluation

0 引言

近年来,传统科学研究(如天文物理学、生物医学等)、电子商务、网络搜索引擎(如GOOGLE和百度等)和物联网等产生的数据已经以PB或ZB(10的21次方)来计算。以分布式数据仓库、流计算的实时数据仓库技术为代表的最新数据存储技术,让全世界的数据存储量越来越大,由人、机、物三元素高度融合构成的信息化的社会引发了数据规模的爆炸式增长和数据处理模式的高度复杂化,大数据(Big Data)时代已经到来[1]。因此,数据具有越来越强的可视性、可操作性和可用性,能够越来越细致、精准、全面和及时地反映人的思维、行为和情感,以及事物的特性和发展规律,要想让这些大数据以更加有效的方式为提升人类各方面的生产力和生活质量服务,离不开以非平凡的方法发现蕴藏在大量数据集中的有用知识为根本目的数据挖掘技术的支撑。

市场上对于有大数据背景知识又懂数据挖掘技术的专业人才的需求也将越来越大,作为一名高校计算机专业教师,根据自己三年来研究生数据挖掘课程的授课经历,结合当前大数据的时代背景,对数据挖掘课程教学进行了新的思考和探索。

1 明确大数据背景下学习数据挖掘知识的重要性

1.1 大数据的定义

“大数据”是最近几年才出现的新名词,尚无统一的概念,维基百科上的解释是:大数据是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的整合共享,交叉复用形成的智力资源和知识服务能力。

1.2 大数据的特征

大数据的特征可以总结为四方面,即4V。

⑴ 数据量浩大(Volume)――数据集合的规模不断扩大,已从GB到TB再到PB级,甚至开始以EB和ZB来计数。例如:1立方毫米电子显微镜重建出的大脑突触网络的图像数据就超过1PB。

⑵ 模态繁多、异构(Variety)――大数据面向的是一切计算机可以存储的数据格式,类型包括结构化数据、半结构化数据和非结构化数据,包括互联网上的各种网页、图片、音频、视频、文档、报表,以及搜索引擎中输入的关键词、社交网络中的留言、喜好和各种传感器自动收集的监控结果等等。

⑶ 生成快速(Velocity)――大数据往往以数据流的形式动态、快速地产生,具有很强的时效性,同时,数据自身的状态与价值也往往随时空变化而发生演变,数据的涌现特征明显。

⑷ 价值巨大(Value)――数据显性或隐性的网络化存在使得数据之间的复杂关联无所不在,将对信息科学、社会科学、网络科学、系统科学、心理学、经济学等诸多领域的研究和应用起到革命性的作用,价值巨大[2]。

Gartner、IBM和牛津大学2012年联合的关于大数据的研究报告指出:交易数据、记录数据、事件和电子邮件是四大主要数据;数据挖掘,数据可视化,预测,建模与数据优化是五大数据能力[3]。大数据的潜在价值只有通过数据挖掘才能显现,因此,国外的Google、IBM、Amazon、Oracle、Microsoft、EMC;国内的腾讯、百度、新浪、淘宝等知名企业已经开始着眼大数据,从不同角度进行数据挖掘,以便改善自身服务,创造更大的商业价值。所以,作为高校教师,首先要让学生了解大数据的基本特点,明确数据挖掘知识和技术对当今社会的重要意义。

2 利用概念图,构建数据挖掘课程的知识体系结构

在大学里,设置一门课程,不能只关注这门课程所含的内容,更要考虑教育培养学生基本专业能力、可持续发展能力等本质性的问题。

数据挖掘是一门结合数据库技术、统计学、机器学习、神经网络、知识系统、信息检索、高性能计算和可视化等多门学科知识的交叉学科[4]。而且,该课程既包括各种理论知识,又离不开相关的实践技术,整个教学过程是培养和提高学生的创新能力和综合解决问题能力的重要途径。因此,针对计算机专业的学生,教学的首要任务是构建起整个课程的核心知识结构(如图1所示),同时,简单介绍相关的统计学、机器学习等计算机专业学生不太了解的非专业知识。

课程核心知识结构是教学的主线,是学生必须要掌握的。首先,让学生明确数据挖掘前要先经过预处理,再存入数据仓库;其次,针对具体情况利用相关的挖掘工具和挖掘算法进行挖掘;最后,挖掘结果以可视化的形式有效地展示给用户。教学的重点是挖掘算法和挖掘工具。对于挖掘算法,以数据挖掘国际会议ICDM(the IEEE International Conference on Data Mining)的专家评选出的十大经典算法(见表1)为主[5],结合相关实例给学生介绍各种算法的基本思想和相关概念,重点介绍使用较多的分类、聚类、关联、序列和机器学习这几种算法,先为学生打下良好的理论基础。

3 以实例为切入点,注重理论结合实践

数据挖掘课程主要针对我校研究生开设,考虑到学生就业和当前市场需求,以及课程本身实践性强的特点,在教学过程中要注重理论结合实践,注意培养学生解决实际问题的能力。因此,在给学生介绍目前常用的数据挖掘工具(如IBM Intelligent Miner、SAS Enterprese Miner、SPSS Clementine、Weka等)的基础上,结合市场应用需求,以实例为切入点,分别分析数据挖掘在互联网日志分析、电子邮件分析、互联网广告挖掘、电子商务、移动互联网等各大领域中的实际应用情况和成功案例(表2)。同时,还可以从内容挖掘、结构挖掘和用户访问模式挖掘这三个方面简单介绍WEB挖掘的基本知识[6]。这样,课程本身就脱离了枯燥的理论,让学生对数据挖掘有了感性认识,激发学习兴趣。

⑵ 过滤垃圾邮件。\&互联网广告\&⑴ 通过大数据挖掘,精准定位各类客户的广告形式;

⑵ 准确评估广告效果。\&电子商务\&用数据提升整体营销;通过日志挖掘做客户分析;用序列算法分析商品上架时间;用聚类算法对商品分类、提升会员管理。\&移动互联网\&⑴ 锁定用户的数据价值,通过地理位置信息挖掘出有价值的东西;

⑵ 文本挖掘。\&]

在教学过程中,贯穿以“能力培养为目标”的实践教学理念,提供有效的网络资源,让学生自己动手动脑,分析成功案例,完成教师给定的虚拟挖掘任务,强化学生参与意识,教师在以学生为主体的教学过程中当好指导者和激励者,从而充分调动学生的主观能动性,掌握不同应用领域大数据的挖掘问题的基本解决方法,培养学生的创新能力。例如,给学生一个文本挖掘的分类题目,让他们熟悉从原始数据的清洗、预处理、降维、建立模型、测试、得到结论等一系列环节。

4 改革教学评价,实施分类化评价

数据挖掘课程是一门融合了多个学科的实践性很强的课程,对应的考核方式应该与其他专业课程有所区别,应该更重视学生学习过程中的表现和能力的提升。

理论知识的考核注重学生对数据挖掘基本概念、挖掘流程和主要挖掘算法的掌握情况,主要以试卷考核的方式为主,注意主观题和客观题的数量比例,采用统一考核方式和评判标准。对于实践技能的考核,主要强调的是学生对不同类型数据进行挖掘时应掌握的相关软件使用技能的考查,考核时除了要体现学生对实验原理的掌握外,更重要的是要反映出学生在实验方法的掌握、设计、操作过程中的实际能力,我们取消了以往把一次性考试结果作为总成绩的方法,而把学生平时课堂实验成绩作为总成绩的主要部分,考核成绩占课程总成绩一定比例。

教师教学质量的评价与学生考核成绩相对应,可采用单独评价和统一评价两种方式。单独评价是指将社会实践作为一个独立的质量评价过程对教师教学质量进行考核;统一评价是指将教师实践教学与理论教学综合起来统一考核,以一定比例计入教师总体评价。

无论是对学生,还是对教师,这种分类化的教学评价方式,不仅有利于学生实际能力的培养,而且对教师的教学水平也是一种促进,有利于课程教学质量的不断提高。

5 结束语

大数据时代,谁能发掘出数据背后的巨大商业和社会价值,谁就能在激烈的市场竞争中处于优势。数据挖掘作为计算机应用专业的研究生核心课程之一,也是学生今后就业必需的专业技能之一。以往的教学过程理论性强,枯燥乏味,考核形式单一,学生学习热情普遍不高,不利于学生专业能力的培养。本文结合当前大数据的时代背景,在构架课程核心知识体系的前提下,结合实际应用领域和案例,分析数据挖掘常见算法和常用工具,强调学生的参与和主观能动性的发挥,而采用分类化的教学评价又能比较客观、公正地评价学生对课程知识和专业实践技能的掌握情况以及教师的教学效果。课程开设三年来的教学实践证明,学生综合运用计算机专业知识的能力得到提高,理论与实践结合的创新能力得到锻炼,教师在教学过程中不断完善了自身的知识结构,提高了教学水平,实现了教学相长,得到了学生的好评。

参考文献:

[1] Anand Rajaraman, Jeffrey David Ullman.大数据:互联网大规模数据挖掘与分布式处理[M].人民邮电出版社,2012.

[2] 李国杰.大数据研究的科学价值[J].中国计算机学会通讯,2012.8:8-15

[3] Jiawei Han,Micheline Kamber,Jian Pei等.数据挖掘概念与技术(第3版)[M].机械工业出版社,2012.

[4] 王珊,王会举,覃雄派等.架构大数据:挑战、现状与展望[J].计算机学报,2011.10:1741-1743

数据挖掘课程设计论文篇5

关键词:课程建设;模块化教学;数据挖掘

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2014)30-0240-03

随着数据挖掘、商务智能技术的快速发展与广泛应用,亟需对信息管理专业的本科生加强对相关知识的介绍,此时进行课程改革,调整、增加授课学时和实践环节有重要意义。数据挖掘是一门与多学科交叉的新兴计算机专业课程,其课程内容丰富、应用范围广、实践工具类型繁多。在有限授课时间内,如何选择适合于信息管理专业的本科生的课程内容、案例与软件工具,选用何种有针对性的教学方法,是进行数据挖掘课程设计需要解决的主要问题。

一、国内外数据挖掘类课程建设研究分析

近年来,数据挖掘与商务智能技术发展迅速,充分借鉴国外相关研究,尤其是ACM SIGKDD课程委员会对数据挖据课程建设建议,对进行数据挖掘类课程的教学建设研究有重要意义。ACM(美国计算机协会)于1998年成立了SIGKDD(知识发现兴趣小组),致力于知识发现与数据挖掘的相关研究,ACM SIGKDD课程委员会连续多年多次更新其主要课程――数据挖据课程的建议,其中委员会将数据挖掘课程分为基础部分与高级主题,基础部分覆盖了数据挖掘的基本方法,高级主题既有数据挖掘基本方法的深入研究,又有更高级算法的介绍。国外很多大学的计算机科学学院、商学院都开设了数据挖掘类课程并同时进行相关研究。波士顿大学开设了“数据管理与商务智能”课程,课程主要包括基础、核心技术、应用三部分。许多国外著名大学建立了教学管理系统,提供大量的案例、在线讨论和在线辅导功能。国内很多学校都开设了数据挖掘的相关课程,我国大多数高校的课程大纲内容与国外大致相同,只是在实践部分选用了不同的商务案例。数据挖掘的应用领域广泛,因此可以根据开课学院和专业选择合适的实例。

二、根据信息管理专业本科生培养要求确定课程目标

数据挖掘课程是一门综合性很强的前沿学科,对计算机软硬件、数据库、人工智能技术、统计学算法、优化算法等基础知识都有较高的要求。因此该门课程开设在学生大三下学期,既有相关知识的基础,又为大四做毕业设计提供了一种思路。信息管理专业是计算机与管理相结合的专业,旨在培养具备信息系统开发能力与信息资源分析与处理能力的综合应用型人才。对信息管理专业的学生而言,本课程主要的目标是数据挖掘算法原理理解、数据挖掘算法在商务管理问题中的应用以及常用数据仓库与数据挖掘软件的熟练应用和二次开发。

三、基于模块化方法的课程内容分析

模块化教学模式是按照程序模块化的构想和原则来设计教学内容的一整套教学体系,它是在既定的培养目标指导下,将全部教学内容按照一定标准或规则进行分解,使其成为多个相对独立的教学模块,且各教学模块之间可以按照一定的规则有选择性的重新组合。学生可以根据个人兴趣和职业取向在不同模块之间进行选择和搭配,从而实现不同的教学目标和人才培养要求[1,2]。模块化教学本质上是以知识点与实践的细化为出发点研究的。商务智能方法本身非常丰富,实践应用也是课程的主要特点之一,因此十分适合使用模块化的知识分解方式。本课程的知识点模块管理分为两个层次,一是从宏观角度设计课程的基础内容模块和高级主题模块;二是从微观角度针对较为复杂的教学内容进行的知识点划分。

1.课程主要内容模块化分析。目前该课程包括十章理论内容,分别为数据仓库与数据挖掘的基本知识、数据仓库的OLAP技术、数据预处理、数据挖掘系统的结构、概念描述:特征化与比较、挖掘大型数据库中的关联规则、分类与预测、聚类分析、复杂类型数据挖掘和序列模式挖掘。根据模块化管理的宏观角度分类,课程内容的第一至五章属于基础理论部分和简单数据挖掘技术的介绍,可以作为基础内容模块;第六至八章为数据挖掘的核心算法,其中既有基础理论与技术方法,又可深入到较难的方法和复杂的应用,因此介于基础内容与高级主题之间;第九、十章可以算做课程的高级主题模块;另外,课程的实践模块既包含数据仓库的建设又包含数据挖掘算法的应用,难度也介于基础内容与高级主题之间。

2.复杂知识点的模块化管理。从微观角度对知识点进行设计主要针对的是上述的高级主题、以及难度介于基础内容与高级主题之间的章节,由于这些章节知识点在难度上有一定层次,讲授内容弹性比较大,因此需要在课程设计中明确一定课时量所要达到的难度。以商务智能技术中的分类算法为例:首先一般的入门课程都会介绍分类算法的概念和基本原理;接着开始介绍分类算法的基础算法――决策树,而决策树算法中又包含ID3等多种算法,并且除了决策树外,还有其他更高级的分类算法;在真正使用分类法进行预测时,还要分析预测准确度;最终要将所学知识加以应用。这样就形成了一个结构清晰、难度循序渐进的知识点模块的层次关系。在宏观角度、微观角度对教学内容进行分类的前提下进行相应的授课方法与考查方法的研究,才能真正有助于学生的学习。

四、授课与考核方法设计

对不同层次学生要求不同,这种不同既体现在知识点的要求上,又直接体现在任务的难易性程度上,这都需要教师在课程设计时充分考虑不同要求情况下的不同的授课方式,并使学生清楚自己需要掌握的程度。对于高级算法和实现部分,通常可以选择一到两章内容采用专题探讨式的教学方法。这种方法是指在教师启发和引导下,以学生为主体,选择某个基本教学单元为专题,学生自主研究作为知识传递的基本形式,将多种灵活的教学方式综合运用到教学环节的教学方法[3]。根据信管专业培养方案的培养目标、以及对学生调研的情况,实践环节比较适合选择成熟的商务智能工具进行数据的整合和多维数据建模,也就是直接使用现成的;或者使用数据挖掘软件进行数据建模,完善数据挖掘算法。可以针对学生管理基础课与IT基础课知识的掌握情况,选择合适的工具为学生设计综合性实验。实验中给出部分操作步骤,并在实验后期仅给出数据与工具,让学生自己设计数据仓库、进行数据挖掘、并对挖掘结果进行多种形式的展示。

五、结论

本文通过国内外数据挖掘课程内容、分类、教学方法的分析,针对信管专业本科生的培养要求,研究了数据挖掘课程建设的主要内容,并针对知识点的不同模块,实行不同的授课方式,使学生更加明确重点、难点和扩展内容,提高了学生的听课效率,对教学内容的模块化分类、以及相应的授课方式的研究成果仍可继续发挥作用,并进行更深入的研究和实践。

参考文献:

[1]韦艳艳,张超群.模块化教学与学习迁移[J].当代教育论坛,2018,(5).

[2]郑浩,陶虎,王晓辉.高校模块化教学模式及其效果评价方法[J].科技信息,2012,(25).

[3]陈帆,和红杰.启发式教学在Java语言教学中的应用[J].计算机教育,2010,(16).

数据挖掘课程设计论文篇6

关键词:数据挖掘技术;交互课堂;特点

课堂教学是一个具有一定周期性的过程,作为授业者的教师,通过不断的教学实践,对教学设计不断地进行优化、更新、管理及评价的过程。本文探讨通过数据挖掘技术建立一个可以对课堂交互中的信息进行有效整理、合理分析的信息处理模型,从而有效促进教学设计的不断更新。

一、课堂互动中信息的特点

在课堂教学中的信息交互是通过师生人际交流、教学过程等实现的,这决定了这些信息具有以下基本特点:

1.信息采集工作量大

在课堂互动中由于交流过程中所表达的信息类型较多,包括教师的讲授、提问、指示等方面的信息、教师接受学生的意见信息、教师给予学生的鼓励表扬、对学生的建议批评、学生答问信息、学生之间的讨论、思考问题等信息,还有一些是课堂上与正常教学行为不相关的其他信息、课堂外有学生的作业、教师的批改以及自身学习与发展方面信息等。对这些信息数据的采集、处理工作量比较大。

2.可量化性低

课堂内外互动中的信息绝大多数是由言语、肢体语言来交互的,其中一些类似如学生对教学内容与方式的反应、学习中的兴趣爱好、教师与学生互动中交流信息等不容易进行定性量化,导致处理起来比较困难。

3.信息的包容性大

在教学互动过程中的各类信息,如教师的教学方式、教学风格、教学内容的组织、师生的个人思维动态等都包含了各种各类的信息综合体,非常难以从这些信息的表面就判断信息的类属。同时这些信息有些还属于生物信息范畴,难以分析。

4.信息的不确定性

在课堂互动教学过程中对学生当前学习状态、知识的掌握程度的判断是基于教师的个人理解,具有不确定性,是具有一定的误差的。而在教学过程中对提问中学生的反应,判定学生的回答正确与否,都具有教师的主观性。

正是由于课堂互动中的信息具有以上特征,从而使得数据信息采集工作量大,定性量化比较困难。所以很久以来从事教育信息整合的研究者常喜欢于用质的定性研究来评价,随着当前数据处理科学的进步,如何更客观地对课堂中的交互信息进行定性、量化、处理变得尤为重要。通过对潜在信息数据中有价值的内容的提炼、整合、处理,可以及时从里面发现有用的数据信息,从大量互动数据中找到教育规律,用以教师对教学的改进。归根结底,我们对课堂互动中信息的数据挖掘,是为了处理过后的信息反馈与我们的教学,从而更加有效地改进我们教学系统的设计、评价等系统。

二、数据挖掘及其技术

数据挖掘(DataMining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,其目标是支持利用数据进行合理的决策。

根据信息存储格式的不同,用于挖掘的对象有关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库、空间数据库、时态数据库、异质数据库以及Internet等。其任务主要是关联分析、聚类分析、分类、预测、时序模式分析等。

数据挖掘的流程包括以下过程,这些过程不是一次完成的,其中某些步骤或者全过程可能要反复进行:(1)问题的定义;(2)数据准备;(3)数据挖掘;(4)结果分析;(5)知识表示。

三、交互课堂中数据挖掘技术的应用

在交互课堂的设计中我们可以根据课堂互动信息的相关特点,通过整合数据挖掘应用的数据处理优势,从包含海量信息的师生行动和语言互动中发掘并定性出有用的信息。然后通过对这些信息的统计等处理,让隐藏在自然语言下的信息变成电子信息数据,通过教师对数据挖掘规则的参与,有效利用这些信息,从而产生可以指导我们教学实践的数据挖掘结果。下面我们深入探讨一下课堂交互中的数据挖掘应用。

1.课堂互动中数据挖掘的主要任务

利用数据挖掘技术可从以下三个方面对零碎的、不容易识别的课堂互动信息进行挖掘。

(1)对教师教学信息的挖掘。①对教师教学风格、特点的信息挖掘:包括对教师语言特点、提问的比率、提问的开放性程度、与学生的互动能力等主观性因素进行量化,可视化。②对教学信息中可重复部分的挖掘:利用分类、统计、甄别等工具把一些共性的信息提炼出来,拆分教学内容,概括出课堂交互中所传递信息的共性点,分析交互的信息量,进行定性。还可以根据特定的课程进行分析。③教学设计、教学科目设置结构等信息:通过对不同的科目的教学设计的分析,可以了解科目类别之间的关系。通过数据挖掘后直观地分析表和图,系统可为教师提供教学设计对比,促进教学过程的改进。④教师对新技术应用的发现:随着社会的发展和进步,各种各样的信息技术手段在课堂交互中被利用,这些手段为改进课堂互动的效率提供了有效的环境。利用数据挖掘技术,对教师对新技术手段的应用效果及比例进行观察,对新技术手段对课堂交互的促进效果进行评估。⑤师生交互的模式:师生交互的模式有多种多样,数据挖掘利用课程、科目、交互的模式、交互的效果等等进行分析,找出各种因素之间的关联,为教师提供基于实际应用的合理模式推荐。⑥课堂互动过程变动信息:利用定性量化的课堂交互数据,通过数据挖掘得出所需评估科目在交互过程中的变化,以提高教师对交互课堂的教学进程的把握程度。

(2)学生相关信息的挖掘。可以从以下几个方面对学生的课堂反应和表现进行数据挖掘:①课堂参与的投入程度:首先观察学生的参与比例,其次定性参与学生的投入程度。可以对不同的参与程度定性为全部、大多数、少数等,对参与投入的定性可以为:积极、一般。②交互的状态:首先看交互中是不是有多方参与的信息互动,其次看互动中交互是否友善、是否合作良好。③思维反馈的状态:通过学生的反馈及主动性的互动,来看课堂交互的思维反馈状态是否良好。④情绪表现:首先看学生互动中是否有情感上的投入,比如紧张与愉快;其次看学生是否能根据课堂交互的进行及时转变状态,比如前一段谈论气氛热烈,转入后一段的静静聆听。⑤课程状态:首先看学生能否在课程进行中,感到有收获感;其次看学生对后续的课程交互是否抱有期待。

日常的教学实践证明,课堂交互中的学生投入与否,对交互的教学效果有着决定性的影响。假设学生的课堂交互状态不够,那么要找原因的话,就要从教师的教学设计或课堂气氛营造上来找。我们利用学生信息的数据挖掘技术,分析学生在交互的过程中的状态,形成直观的信息材料,为教师课堂教学的组织的改进提供支撑,同时也可以为教师教学效果评价提供依据。

(3)教师、学生课堂交互信息的挖掘。“师生交互”是教学设计实施中的关键环节,交互意味着师生有语言上的交流及行为上的互动。在课堂教学交互过程中一般互动是在授课者与听课者、课程设计与教学实际之间进行的。师生间的交互信息主要表现在师生的互动交流、教师为学生直接提供的课程内容、课程内容的问答和学生错误的反馈等。通过使用数据挖掘技术,深入挖掘教学中的交互信息,让老师改进自己的教学设计及课堂行为,提高实际教学效果,实现师生之间进行有效的互动。

2.挖掘课堂中互动信息的流程

建立课堂互动信息处理的数据挖掘系统现场记录或通过WEB在线应用收集交互信息信息的标准化和信息化处理课堂互动信息分类编码数据信息进行转换、处理数据挖掘挖掘结果分析反馈教学过程。

3.课堂互动信息数据挖掘方法

在数据挖掘方法的选择上,我们主要采用数据挖掘中应用广泛的统计学、关联分析等方法,同时通过数据库软件的数据技术对信息进行处理。在挖掘课堂互动信息的时候,我们需要对时序数据库和序列数据库进行数据挖掘,时序数据库中的数据是一些反映随时间变化的序列值或事件组成的数据库,这些值是等时间间隔采集的数据。利用统计类挖掘工具和数据库技术可以在时序数据和序列数据的挖掘中实现对课堂教育信息的趋势分析、相似性搜索、与时间有关数据的序列模式挖掘和周期性模式的挖掘。

4.基于课堂交互的数据挖掘系统设计

根据数据挖掘模型及课堂互动信息的特点,基于课堂交互的数据挖掘系统可由如下四个部分组成。

(1)数据采集模块:模块采集的信息主要包括课堂教学中教师、学生的各种行为、语言,师生间互动等信息。

(2)数据处理模块:解决语义模糊性,数据库按照元数据标准对数据进行清理、集成和变换,检查数据的完整性和一致性。

(3)数据分析模块:通过分析经过转换的数据,根据数据挖掘的基本策略,对数据进行分析处理,得出结果并输出。如,利用统计类数据挖掘工具对反映一般变化方向的教学趋势变化进行分析,采用加权平均或最小乘2法对时序图上的数据进行处理,以确定数据变化趋势,为后续的教学决策与评价提供依据。

(4)数据评价模块:对提取的信息进行分析,将结果与课堂教学的教育理论,学习理论相结合,根据起始目标的量规对课堂教学效果进行评价、反思教学。将有价值的信息区分出来,通过决策支持工具提交决策者。根据每个处理模块的结果可以决定是否重新进行某些处理过程,在处理的任意阶段可以返回以前阶段进行再处理。在数据挖掘技术实际运用过程中,教师可以根据自身对信息需求的不同,通过对数据挖掘的一些语义规则的选择和自定义得到不同的个性化结果。

数据挖掘课程设计论文篇7

关键词:实践教学研究;建构主义理论;信息管理专业;数据挖掘

中图分类号:G642.0?摇 文献标志码:A 文章编号:1674-9324(2014)15-0197-02

一、引言

随着数据挖掘、商务智能技术的快速发展与广泛应用,作为综合型应用型人才的信息管理专业的本科生必须在掌握一定理论知识的前提下熟悉数据挖掘的实践操作,能够根据实际数据构建数据仓库的多维模型、进行联机分析处理,并能结合案例主动思考分析,熟练选择合适的数据挖掘方法解决管理领域的问题,得出数据挖掘的结论。这就对数据挖掘课程的实践教学提出了很高的要求。数据挖掘是一门与多学科交叉的综合课程,其课程内容丰富、课程案例和使用工具具有多样化特征,这使得实践教学设计的方案的可选择性增强了,同时也对选择适合的内容、案例与工具并设计成一个完善的系统化的实验增加了难度。

二、基于建构主义理论进行实践教学设计

1.建构主义理论与实践教学目标。建构主义理论强调,学生通过以往的学习和经历已经形成了对客观事物的基本理解和认识,已具备了一定的知识结构,学习的过程是学生个人的知识储备与知识结构和外界影响相结合,并在结构过程中继续主动地建构自己新知识结构的过程[1]。

基于建构主义理论,给出数据挖掘课程实践教学的主要目标即为在原有理论知识理解的基础上,在新的教学实验情景下不断学习和理解,最终熟悉了实验情景、掌握了课程设计的应用,还能改达到对原有知识的深刻理解,进而能在新的实验情景和新的应用案例下有启发式的想法和思路,进行独立的思考和研究。具体包括:巩固已学习知识、加深对理论知识的理解,实验内容设计与教材理论体系一脉相承,有助于学生系统化理解本课程;深刻理解数据挖掘多步骤之间以分析为驱动、以数据相衔接的前后关系;训练学生对管理问题的抽象能力,培养学生学习兴趣。通过管理实例深刻体会到数据挖掘方法的重要性和实用性,培养学生对课程的兴趣,引导学生学会科学思考问题、提炼问题;熟悉主流软件,为学生踏入数据仓库与数据挖掘领域做好铺垫。实验使用业内流行的数据整合软件和商务智能软件进行实验设计,使得学生的实践适应技术的发展。

2.基于建构主义理论选择实验工具与实验案例。建构主义认为,学是与一定的情境相联系的。学习情境是学生可以在其中进行自由探索和自主学习的场所,一个良好的实践教学情景设计对学生学习要有明显的激发和引导作用。

在案例选择时,教师可以为学生提供一种典型的案例背景,在这种背景下的研究方法可以给予较多的辅导,使学生首先熟悉实验工具的环境,以及实验工具、实验案例与实验内容和原理的融合。再准备一些其他的经典案例供学生自由选择,鼓励学生用已有的知识来寻找最佳解决方案。这样,就促进了学生对知识、能力的迁移,并使得这一过程成为学生能力和自我有意识的调节过程。在确定软件选择方案方面,根据对国内外调研情况的分析[2],数据挖掘实践模块的工具的选择,可以分为以下三种情况:一是使用基本工具编程实现算法;二是直接使用具备数据整合、多维数据建模等方法的商务智能工具;三是使用数据挖掘软件进行数据建模或编程开发。根据信管专业培养方案的培养目标,后两种模式较为适合。可以针对学生基础知识的掌握情况,选择合适的工具为学生设计综合性实验,并在实验后期留一部分自由度,让学生自己设计数据仓库、进行数据挖掘,并对挖掘结果进行多种形式的展示。

3.基于建构主义理论设计实验原理与内容。建构主义理论认为,意义建构是整个学习过程的最终目标,即认识事物的性质、规律以及事物之间的内在联系,通过“同化”和“顺应”来完善和丰富个体的认知结构[1]。“同化”是利用原有认知结构中的有关经验去学习当前的新知识,并对新知识进行过滤或改变,原有框架的一部分。如果原有经验不能“同化”新知识,则要引起“顺应”过程,即对原有认知结构进行改造与重组。[3]

基于建构主义理论进行实践教学活动设计,需要围绕意义建构目标而展开,需要在安排实践教学课程前,明确理论课程的主要框架,并遵循已有的理论框架和逻辑结构安排实践环节,这样学生就能够更有效地从学习过程中理解当前实践内容所反映的事物性质、规律及其互相联系。

实验原理实际就是实验所选择的理论和方法基础,在实验设计时最好能依据课堂内容进行选择,并注意最好选择按照课堂内容的顺序前后衔接,这样更加符合建构主义的教育方法。实验内容就是以与学生专业相符合的案例和案例的数据,应用实验原理进行实验的设计。在本课程中主要的实验原理是:应用数据预处理抽取、转换和装载方法,对原始数据进行整合和装载;应用数据仓库的OLAP技术,建立星型模式的多维数据模型,并进行OLAP操作,应用多维数据展示技术进行数据展示;应用数据挖掘分类与预测方法,对多维数据建模、预测,并使用报表工具展示挖掘的结果。主要实验内容包括:数据集成与转换,使用Pervasive软件实现数据存储格式转换、集成;进行Mstr商务智能软件的基本配置,并将实验1的数据装载到软件的数据仓库表中,为实验3做准备;数据仓库与多维数据的OLAP操作,使用商务智能软件针对原始数据建立星型模式多维数据模型,实现多维数据模型的OLAP操作,掌握商务智能软件的数据展示功能;数据挖掘方法应用,创建季度指数度量,进行数据挖掘前的数据转换,并创建训练度量实现对销售量的预测。

4.基于建构主义理论设计实践教学方式和方法。在建构主义理论下,教师需要由传统的知识的传授者与灌输者转而成为实践教学的设计者、组织者、引导者。教师要引导学生形成分析问题的思路,启发学生对实践活动进行评价、反思和讨论,帮助学生深刻理解学习内容并形成新的认知结构。从课程内容安排上分析,建构主义强调“支架式教学”,即为学习者的知识建构提供一种概念框架[4]。为此,要在安排实验前对实验任务加以分解,形成逐渐递进式的概念框架,便于由浅入深逐步引入实践内容。例如,对于第三个实验――数据仓库与多维数据的OLAP操作,教师首先带大家回顾多维数据模型的星型模式、OLAP操作和多维数据展示三部分理论课内容,再分析案例数据,引导学生思考如何对案例数据进行处理,然后给出答案,加深对原来这三部分内容的理解。从对学生的引导和教学方法上来说,应该充分发挥学生的主动性,鼓励学生大胆探索,主动观察和认识客观事物,并鼓励学生在在实践中重新整合头脑中原有的知识,通过讨论、思考的过程加深对客观事物的认识。在条件允许的前提下,为学生提供更多的案例训练的机会,加深对知识的理解和知识架构的丰富与完善。本实验选用的实验模式为小组讨论、教师引导、上机实验相结合的方式,使用的具体方法有录制实验教学视频,引导学生思考初始数据蕴含的管理问题,画出课程知识点与实验过程、软件使用关系图等方式。

三、实验效果与结论

使用建构主义理论设计实践环节,事前给学生做好知识架构的铺垫,针对入门级实践,进行原理的讲解与回忆、进行实验过程的引导思考与详细讲授,同时提供更多情景资源给学生训练;对深入研究型的部分,给学生较大自由度,由学生自己完成。该门课程多数学生能够独立完成实验过程,并且能够在实验过程中较好地理解实验原理,分析管理问题。本实验综合效果较好,随着数据挖掘在信息管理专业中重要性的增强,在教学实践中增加课时的可能性很大,继续使用建构主义理论进行实践环节设计对学生也更有好处。

参考文献:

[1]张向葵.教育心理学[M].北京:中央广播电视大学出版社,2003.

[2]韩家炜.数据挖掘:概念与技术[M].北京:机械工业出版社,2001.

[3]赵学凯,赵芳.教学建设与改革[J].北京教育,2007,(01).

[4]齐宏,王爱萍.实践教学环节的认知理论基础与教学设计[J].开放学习,2007,(7).

数据挖掘课程设计论文篇8

关键词:统计学;数据挖掘;案例驱动

中图分类号:G712 文献标志码:A 文章编号:1674-9324(2014)40-0069-02

一、前言

近年来,数据获取和数据存储技术快速发展,各种数据库、数据仓库中存储的数据量飞速增长。人们关注的焦点要从噪声、模糊的随机数据中提取重要的信息、知识,数据挖掘的出现,提供了一种有效解决“数据丰富而知识贫乏”问题的方法。

数据挖掘作为统计专业的核心课程,是学生必须掌握的职业能力课程。根据高职生的知识结构体系和培养目标,我们采用案例驱动教学方法,以学生为主体,案例为主线,教师为主导,对案例进行分析,学习案例所涉及的相关知识点,从而会利用相关软件工具对数据进行分析,挖掘数据间的知识。

二、数据挖掘中案例驱动教学的实施

(一)合理高职高专统计专业数据挖掘课程教学目标

数据挖掘是集数据库技术、统计学习、机器学习、模式识别、可视化等学科的一个新兴交叉学科,又包含了聚类分析、关联规则分析、分类等,每一种挖掘又有不同算法,是一门理论性、实践性及综合性较强的课程。其知识内容丰富,内容深浅不一,各种方法变化快,新方法层出不穷,这对师生都提出了严峻的挑战。

高职高专将培养高等技术应用型专门人才为根本任务,以适应社会行业发展需求为基本目标,结合本院统计专业学生的专业技能特点,我们将本门课程的教学目标定位为:掌握数据挖掘课程涉及的基本概念,提高信息分析能力,能从收集到的数据信息中利用有效的软件工具CLEMENTINE进行知识“挖掘”;要根据实际情况制定合理完整的数据模型并进行评估,这些评估要具有可视性,才能有效地解决问题,而使数据挖掘更具有合理性。

(二)如何驱动教学来设计数据挖掘案例

1.介绍案例驱动教学法。案例驱动法是在“哈佛大学”的情境案例教学课起源,是一种探索性和协作性学习的教学模式。整个授课过程围绕着同一个目标和几项任务“教授”,学生通过对课程的学习、资料的查找和知识的整合,通过充分思考和与实践相结合,提高自身能力。这种案例驱动的教学法可以让学生提高学习兴趣,发展学生自身的能力。同时能让教师更好地发挥促进学生学习、引导学生成功的功能。

案例驱动法是把教学内容和目标通过一个任务来体现,把教材内容重新整合,老师的授课和学生的接受都围绕这个任务完成。

案例驱动法可以充分发挥学生的主体地位,从而改变传统的关于师生关系的观念,让学生从被动学习到主动学习,真正爱上学习,提高自己的创新、自学和实践能力,同时要求老师在授课中给予学生正确的引导、促进、组织和控制,这样可以增强同学间的协作精神和学生的独立意识。通过学生的自主学习和探索,可以改变原来枯燥的学习方式。对于数据挖掘这门课程,内容深奥,既要求学习一定的理论知识,又要求掌握数据挖掘的使用方法,因此我们引入使用案例驱动的教学方法。

2.数据挖掘案例教学的实施规划。利用CLEMENTINE软件工具进行数据挖掘,将数据挖掘看成一个以数据为中心的循序渐进的螺旋式数据探索过程,该过程分为业务理解、数据理解、数据准备、建立模型、方案评估和方案实施六大部分。因此,在教学过程中,我们围绕数据挖掘的六大部分,在每一部分,讲解基本的数据挖掘技术原理;对于数据挖掘算法,只要求掌握相关算法使用的方法和使用的场合,并会使用专业的数据挖掘工具CLEMENTINE,此应用的前提条件要求对学生进行数据挖掘;将教学的亮点和重点放在案例分析和实际应用上,要对学生进行动手能力的训练。

在教学的过程中,最重要的是案例的选取。通过参考教学大纲和教学目标,对教学案例进行精心设计,可以提高学生的分析能力,提高学生发现问题和解决问题的能力,才能更好地将教案落实,并形成具体的项目。根据数据挖掘课程的特点和具体内容,我们通过某些小案例引入一些相关知识,并且采用学生能够接受的一个大案例让学生使用成绩数据模型组织整个教学过程。

我们的课程内容按数据挖掘过程分为六大部分,按照每一部分的教学目标我们设计了多个不同的小案例如下。

(1)药物研究数据和学生参加社会活动数据案例:通过这两个数据模型掌握在CLEMENTIME软件工具中利用软件中SOURCES选项卡的多种节点读入多种文件类型(如TXT文件、EXCEL文件、SPSS文件等)的数据,掌握读入数据的数据类型,掌握APPEND节点、MERGE节点合并数据的方法。

(2)移动客户数据案例:通过利用移动数据让学生掌握TYPE节点进行变量说明的方法,会使用该节点进行有限变量值和无效值的调整,会使用DATA AUDIT节点对数据质量进行评估和调整;掌握数据中对离群点、极端值和缺失值的调整,对数据进行质量管理;会使用AGGREATE对数据进行分类汇总;利用FILLER节点对变量值重新计算,会用RECLASSIFY节点实现变量值进行调整;会对数据进行筛选、样本子集划分等处理;了解数据分析特征,把握数据间相关性强弱的基本手段;利用压缩样本量、简约变量值或变量降维等方法对样本量庞大的数据进行精简。

(3)决策树模型案例:了解C5.0决策树算法,会建立决策树模型,学会归纳和提炼现有数据包含的规律,建立分类预测模型,会分析结论,用于对未来新数据的预测。

(4)人工神经网络模型案例:了解人工神经网络算法,掌握人工神经网络建立的步骤,建立B-P反向神经网络模型,预测分析结果。

(5)贝叶斯模型案例:了解贝叶斯网络算法,掌握贝叶斯网络结构的组成和构建,会用TAN贝叶斯和马尔科夫毯网络解决从庞大数据中寻找输入变量之间的相关性,输入变量的组合取值对输出变量的影响,用网络结构直观展示它们的关系。

在设计小案例的同时,我们还选择学生既熟悉又感兴趣的综合项目案例选题:学生成绩数据、图书管理数据、电信服务数据等,让学生带着问题进一步学习课程,在学习中寻找方法解决项目中遇到的问题。当课程结束后,各项目组呈交项目数据模型和报告,且项目组长要向所有同学按数据挖掘的六大部分讲解分析报告。

3.案例驱动教学的成效。围绕案例进行教学的“数据挖掘”课程除了采用案例驱动教学法,还要增加学生的实际训练能力,都取得了明显的效果,从以下五个方面体现:①学生要主动提出问题,同时积极主动地参与课堂教学,才能提高学生分析和处理问题的能力;②增强学生的自主学习能力,要求学生通过小组讨论的形式和实际训练让学生以积极主动的态度处理和解决一些技术问题,从而提高自学能力;③学生间要注意培养团队合作能力的,也要具有竞争意识;④课程学习结束后,普遍反映对利用CLEMENTIME软件工具进行数据挖掘的自信心提高,能够进一步提高对专业的认知,独立解决一些数据统计分析的问题。

三、结束语

数据挖掘是统计专业的专业课程,其内容繁多、深奥,把基于案例驱动的教学模式引入《数据挖掘》课程,学生在学习过程中,实现了整个数据挖掘的流程,在基于项目的技术应用中深入理解了数据挖掘的理论知识。学生要将所学的理论知识和实践相结合,从而有效提高自己的操作技能和知识水平,培养了自己应用数据挖掘技术解决实际问题的应用能力和创新实践能力。

从教学效果来看,通过将理论教学和实践相结合,案例教学法整合了各种学习工具和教学资源,这样才能充分发挥学生的主观能动性,培养和提高学生的主观能动性,同时增强学生分析和处理问题的能力,今后,我们将继续完善数据挖掘的教学案例,研究和总结教学经验,使整个教学环节更加完善合理。

参考文献:

[1]刘云霞.统计学专业本科生开设“数据挖掘”课程的探讨[J].吉林工程技术师范学院学报,2010,(26).

[2]覃义,杨丹江,刘忆宁.《数据挖掘》本科教学的体会与创新[J].科技信息,2012,(10).

[3]李国荣.培养统计专业学生动手能力和创新能力的探索[J].统计教育,2007,(9).

[4]白忠喜,鲁越青,梁伟,等.校政企共建基地开展基于项目驱动的实践教学改革[J].中国大学教学,2011,(2).

[5]焦国华,黄健柏,黄晖.数据挖掘技术在钢铁行业的应用[J].系统工程,2010,(28).

推荐期刊
  • 数据
    刊号:11-5323/C
    级别:省级期刊
  • 大数据
    刊号:10-1321/G2
    级别:统计源期刊
  • 大数据时代
    刊号:52-1163/G2
    级别:省级期刊
  • 数据通信
    刊号:11-2841/TP
    级别:部级期刊