线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

数据通信概论8篇

时间:2024-01-03 14:38:32

数据通信概论

篇1

论文摘 要 智能交通系统 (ITS) 是集成于信息技术、传输技术、电子技术、及计算机处理技术等多种类电子工程技术,而建立起的实时、高效、准确的综合运输和管理体系。其中,数据压缩和数据融合技术使得ITS技术更具有现实意义。本文基于智能交通系统中信息的特征,探讨了数据压缩和数据融合技术涉及的关键技术及要求,分析了技术应用及现实突破。

1 ITS信息及特征分析

1.1 智能交通信息(ITS)

交通系统由包括4个基本要素:人(交通出行者、驾驶员和管理者)、物(货物)、各类交通工具和相应的交通设施构成。交通信息是指所有与交通系统的四大要素相关联的信息,是ATMS的关键基础。面向ATMS的基础交通信息主要是指与交通运行状态和交通管理有关的交通信息,是交通信息中最直接、最基础的信息。基础交通信息包括基础交通地理信息、交通实时状态信息、交通控制和管理信息、交通政策法规信息、公共交通信息。

1.2 基础交通信息的属性特征

基础交通信息是一种在大范围内、全方位发挥作用的,实时、准确、高效的综合运输和管理系统,其应具有以下一些基本属性特征:1)准确性;2)及时性;3)共享性;4)信息的采集具有实时性和动态性;5)具有海量信息特征;6)增值性。

2 数据压缩处理技术

交通信息一方面时采集到的信息烦杂多样,要想利用这些不同类别的信息,需采用不同的处理方法;另一方面,交通信息的一个显著特征是它的空间性和随机性,因此对它的研究分析需要建立在广泛统计的基础上,应用各类信息处理技术和统计分析方法来探索它的规律性。

所谓多媒体技术就是能对多种载体(媒体)上的信息和多种存储(媒质)上的信息进行处理的技术,特点主要表现在它的综合性和交互性。交通信息是属于多媒体信息范畴。若要实时的综合处理声音、图像、视频、文字等多媒体信息,其数据量是非常大的。要传输或存储这样大的数据量是非常困难的,必须对其进行压缩编码,在满足实际需要的前提下,尽量减少要传输或存储的数据量。

数据压缩主要依靠信源编码技术。一般的,图像压缩技术可分为两大类:无损压缩和有损压缩技术。在多媒体应用中常用的压缩方法有PCM(脉冲编码调制)、预测编码、变换编码、插值和外推法、统计编码、矢量量化和子带编码等;混合编码是近年来广泛采用的方法。新一代的数据压缩方法,如基于模型的压缩方法、分形压缩和小波变换方法等也已经接近实用化水平。

3 信息融合技术

信息融合技术在单纯数据采集融合(即一次融合)阶段称为数据融合,是研究多种信息的获取、传输与处理的基本方法、技术、手段以及信息的表示、内在联系和运动规律的一门技术。融合是指采集并集成各种信息源、多媒体和多格式信息,从而生成完整、准确、及时和有效的综合信息,它比直接从各信息源得到的信息更简洁、更少冗余、更有用途。

先进的交通管理系统(ATMS)是一个典型的多传感器系统,信息融合技术给交通信息加工和处理提供了一种很好的方法,信息融合技术的最大优势在于它能合理协调多源数据,充分综合有用信息,提高在多变环境中正确决策的能力。

在信息融合领域使用的主要数学工具或方法有概率论、推理网络、模糊理论和神经网络等,其中使用较多的是概率论、模糊理论、推理网络。当然,除了这几种常用的方法之外,还有其他很多解决途径。

3.1 概率论

在融合技术中最早应用的就是概率论。在一个公共空间根据概率或似然函数对输入数据建模,在一定的先验概率情况下,根据贝叶斯规则合并这些概率以获得每个输出假设的概率,这样可以处理不确定性问题。贝叶斯方法的主要难点在于对概率分布的描述,特别是当数据是由低档传感器给出时,就显得更为困难。另外,在进行计算的时候,常常简单地假定信息源是独立的,这个假设在大多数情况下非常受限制。卡尔曼滤波方法则根据早先估计和最新观测,递推地提供对观测特性的估计。另外,概率论和模糊集理论的综合应用给解决多源数据的融合问题提供了工具。

3.2 模糊理论

模糊集理论是基于分类的局部理论,因此,从产生起就有许多模糊分类技术得以发展。隶属函数可以表达词语的意思,这在数字表达和符号表达之间建立了一个便利的交互接口。在信息融合的应用中主要是通过与特征相连的规则对专家知识进行建模。另外,可以采用模糊理论来对数字化信息进行严格地、折衷或是宽松地建模。模糊理论的另一个方面是可以处理非精确描述问题,还能够自适应地归并信息。对估计过程的模糊拓展可以解决信息或决策冲突问题,应用于传感器融合、专家意见综合以及数据库融合,特别是在信息很少,又只是定性信息的情况下效果较好。

3.3 推理网络

推理网络的构建和应用有着很长的历史,可以追溯到1913年由一位名叫John H W ig-more的美国学者所做的研究工作。近来,许多对于分析复杂推理网络的理论往往基于贝叶斯规则的推论,并且都被归类于贝叶斯网络。目前,大多数贝叶斯网络的研究都包括了对于概率有效传播的算法拓展,同时它在整个网络中也充当了新证据的角色。同时贝叶斯网络在许多A1任务里都己作为对于不确定推理的标准化有效方法。贝叶斯网络的优点是简洁、易于处理相关事件。缺点是不能区分不知道和不确定事件,并且要求处理的对象具有相关性。在实际运用中一般不知道先验概率,当假定的先验概率与实际相矛盾时,推理结果很差,特别是在处理多假设和多条件问题时显得相当复杂。

参考文献

[1]杨兆升.基础交通信息融合技术及其应用[M].北京:中国铁道出版社,2005.

[2]史其信,陆化普.中国 ITS 发展战略构想[J].公路交通科技,1998,3.

篇2

关键词:数据标准化;数据元素;数据;信息分类与编码

1 引言

从国际上关于数据标准化所经历的历程可以看出:企业信息系统建设的核心是数据。按照James Martin信息工程理论:数据是稳定的、处理是多变的。所以从这一理论可以看出企业信息系统建设的核心之核心是数据资产。国际上的数据建设也是从一个无序向有序逐渐过渡的,一直将数据“孤岛”向数据集成化发展。

2 数据元素基本理论

2.1 数据元素规范与标准化框架

(1)数据元素的组成。

数据元由对象类、特性和表示三部分组成,其中对象类用于收集和存储数据的事物,例如,人、井、岩芯、管线、储罐都是对象类等;特性是用来区别和描述对象的,例如,颜色、性别、年龄、收入、地址、价格等均为特性;数据的表示部分中最为重要的方面是值域,值域是数据元允许(或有效)值的集合。对于值域,数据元中存在两种类型的值域,一种是所谓取值是固定的,即取值是可枚举的,例如,人眼睛颜色这个数据元,其取值可能包括:Brown、Gray、Green、Hazel、Blue,另一种是概括的,即数据元取值是有定义域约束的,其取值可能是有限的,但是无法列出全部值,例如人的年龄,其取值范围可能是1-200,并且每位要求是十进制表示。为便于理解,

(2)数据元结构模型。

① 数据元概念(DEC):对象类与特性联合在一起形成数据元概念,数据元概念在数据分类中是非常有用的,一般来讲,数据元概念是一个抽象意义上的数据元,但这类数据元的对象类已经限定,只有经过对数据元概念中的各个要素再进一步的限定,才使数据元概念变成真成有意义的应用数据元素。所以,数据元概念本身具有抽象性与分类性。

② 通配数据元:特性与表示联合在一起形成通配数据元,通配数据元素也具有抽象意义,对于这类数据元来讲,它的特性与表示已经确定,所以它具有通配性,如果将这类数据元与具体的对象类联系在一起,那么该类数据元就可以具体化为有意义的应用数据元。

③ 数据元类型:数据元概念与通配数据元形成数据元类型。

数据元是由数据元概念和表示两部分组成。当一个表示被联合到一个数据元概念上时,就能够产生数据元。数据元和数据元概念间存在多对1的关系,也就是一个数据元必须对应一个数据元概念,而一个数据元概念可以有多个数据元,换句话说,多个数据元可以共享一个数据元概念,数据元结构模型见图1。

数据元与表示之间的关系是一对一的关系,也就是一个数据元需要一个表示。当数据元的概念模型相同而表示不同时就是两个不同的数据元,数据元中的表示是描述数据元中的数据元概念中的特性,即数据元中的特性有且仅有一个表示。

在数据元概念中对象类和特性之间是一对一的关系,一个对象类需要只需要一个特性(或者特性类),一个特性(特性类)只描述一个对象类,当一个特性和一个对象类建立关联时就产生了一个数据元概念。

同实体关系类的数据模型相比,模型中的实体相当于数据元中的对象类,而实体的属性本当于数据元中的特性和表示。

3 数据元的元模型

经过对数据元理论与实际数据规范化应用的研究,我们提出了数据元的元模型,见图2。

该框架模型是将对象类、特性类、分类模式由此演生的基本数据元和应用数据元、值域以及数据标准值、实例标准值以及标准实体有机的关联在一起。揭示了数据元与应用的紧密关系。整个模型高度概括了数据标准化的核心工作。

4 数据元素与信息编码间的关系

如何对企业的各种信息进行有效的分类,并对其进行编码这是信息化过程中一个非常重要的过程。其实数据元素与信息分类及编码有着密不可分的关系,在表2中给出了数据元素分析方法与信息分类与编码的对应关系。

5 数据元应用的领域

数据元素理论属于信息标准化的基础理论,即是数据规范化理论基础。数据元分析在信息分类、数据的集成参考模型、数据模型优化设计、数据元字典以及制订数据交换标准等方面得到应用。

数据元的研究,目前在国际上相当流行,而在国内的研究还处于起步阶段。通过几年的研究,目前,我们已经将这一方法论用于石油上游的数据规范化中,并取得了良好的效果,目前,正在将这一方法论用于中石油的ERP数据平台中的数据规范化中。相信,随着这一方法论的在石油石化领域的不断应用,必将为石油石化信息化建设起到科学的指导与推动作用。

篇3

关键词 ITS集成;电子信息技术;数据处理;信息融合

中图分类号TP39 文献标识码A 文章编号 1674-6708(2011)55-0209-02

1 ITS信息及特征分析

1.1 智能交通信息(ITS)

交通系统由包括4个基本要素:人(交通出行者、驾驶员和管理者)、物(货物)、各类交通工具和相应的交通设施构成。交通信息是指所有与交通系统的四大要素相关联的信息,是ATMS的关键基础。面向ATMS的基础交通信息主要是指与交通运行状态和交通管理有关的交通信息,是交通信息中最直接、最基础的信息。基础交通信息包括基础交通地理信息、交通实时状态信息、交通控制和管理信息、交通政策法规信息、公共交通信息。

1.2 基础交通信息的属性特征

基础交通信息是一种在大范围内、全方位发挥作用的,实时、准确、高效的综合运输和管理系统,其应具有以下一些基本属性特征:1)准确性;2)及时性;3)共享性;4)信息的采集具有实时性和动态性;5)具有海量信息特征;6)增值性。

2 数据压缩处理技术

交通信息一方面时采集到的信息烦杂多样,要想利用这些不同类别的信息,需采用不同的处理方法;另一方面,交通信息的一个显著特征是它的空间性和随机性,因此对它的研究分析需要建立在广泛统计的基础上,应用各类信息处理技术和统计分析方法来探索它的规律性。

所谓多媒体技术就是能对多种载体(媒体)上的信息和多种存储(媒质)上的信息进行处理的技术,特点主要表现在它的综合性和交互性。交通信息是属于多媒体信息范畴。若要实时的综合处理声音、图像、视频、文字等多媒体信息,其数据量是非常大的。要传输或存储这样大的数据量是非常困难的,必须对其进行压缩编码,在满足实际需要的前提下,尽量减少要传输或存储的数据量。

数据压缩主要依靠信源编码技术。一般的,图像压缩技术可分为两大类:无损压缩和有损压缩技术。在多媒体应用中常用的压缩方法有PCM(脉冲编码调制)、预测编码、变换编码、插值和外推法、统计编码、矢量量化和子带编码等;混合编码是近年来广泛采用的方法。新一代的数据压缩方法,如基于模型的压缩方法、分形压缩和小波变换方法等也已经接近实用化水平。

3 信息融合技术

信息融合技术在单纯数据采集融合(即一次融合)阶段称为数据融合,是研究多种信息的获取、传输与处理的基本方法、技术、手段以及信息的表示、内在联系和运动规律的一门技术。融合是指采集并集成各种信息源、多媒体和多格式信息,从而生成完整、准确、及时和有效的综合信息,它比直接从各信息源得到的信息更简洁、更少冗余、更有用途。

先进的交通管理系统(ATMS)是一个典型的多传感器系统,信息融合技术给交通信息加工和处理提供了一种很好的方法,信息融合技术的最大优势在于它能合理协调多源数据,充分综合有用信息,提高在多变环境中正确决策的能力。

在信息融合领域使用的主要数学工具或方法有概率论、推理网络、模糊理论和神经网络等,其中使用较多的是概率论、模糊理论、推理网络。当然,除了这几种常用的方法之外,还有其他很多解决途径。

3.1 概率论

在融合技术中最早应用的就是概率论。在一个公共空间根据概率或似然函数对输入数据建模,在一定的先验概率情况下,根据贝叶斯规则合并这些概率以获得每个输出假设的概率,这样可以处理不确定性问题。贝叶斯方法的主要难点在于对概率分布的描述,特别是当数据是由低档传感器给出时,就显得更为困难。另外,在进行计算的时候,常常简单地假定信息源是独立的,这个假设在大多数情况下非常受限制。卡尔曼滤波方法则根据早先估计和最新观测,递推地提供对观测特性的估计。另外,概率论和模糊集理论的综合应用给解决多源数据的融合问题提供了工具。

3.2 模糊理论

模糊集理论是基于分类的局部理论,因此,从产生起就有许多模糊分类技术得以发展。隶属函数可以表达词语的意思,这在数字表达和符号表达之间建立了一个便利的交互接口。在信息融合的应用中主要是通过与特征相连的规则对专家知识进行建模。另外,可以采用模糊理论来对数字化信息进行严格地、折衷或是宽松地建模。模糊理论的另一个方面是可以处理非精确描述问题,还能够自适应地归并信息。对估计过程的模糊拓展可以解决信息或决策冲突问题,应用于传感器融合、专家意见综合以及数据库融合,特别是在信息很少,又只是定性信息的情况下效果较好。

3.3 推理网络

推理网络的构建和应用有着很长的历史,可以追溯到1913年由一位名叫John H W ig-more的美国学者所做的研究工作。近来,许多对于分析复杂推理网络的理论往往基于贝叶斯规则的推论,并且都被归类于贝叶斯网络。目前,大多数贝叶斯网络的研究都包括了对于概率有效传播的算法拓展,同时它在整个网络中也充当了新证据的角色。同时贝叶斯网络在许多A1任务里都己作为对于不确定推理的标准化有效方法。贝叶斯网络的优点是简洁、易于处理相关事件。缺点是不能区分不知道和不确定事件,并且要求处理的对象具有相关性。在实际运用中一般不知道先验概率,当假定的先验概率与实际相矛盾时,推理结果很差,特别是在处理多假设和多条件问题时显得相当复杂。

参考文献

[1]杨兆升.基础交通信息融合技术及其应用[M].北京:中国铁道出版社,2005.

[2]史其信,陆化普.中国 ITS 发展战略构想[J].公路交通科技,1998,3.

篇4

一、前言

数字图书馆(Digital Library,以下简称DL)是虚拟的图书馆,其目的是在网络环境下构建共享的可扩展的知识网络系统,提供超大规模的,分布式异构数字化信息的智能检索和服务的知识中心[Bor99], 从上世纪90年代,不同的研究者从不同的角度对数字图书馆进行了研究[Fox93][Bak96],但是由于没有一个单独的数字图书馆能够拥有满足用户需求的所有资料和信息,因而完全自足的图书馆是不可能的[Pede00], 所以当人们寻找所需资源时,需要访问多个数字图书馆(DL),同时由于每个DL是自治的,异构的,这样查询请求不得不按照每个DL提供的方式进行提交。为了解决该问题,人们提出联盟数字图书馆。所谓联盟数字图书馆(Digital Library Federation,以下简称DLF)是指正式或非正式合作的操纵DLs的一些组织,它们同意支持一组共同的服务和标准,以便在成员间共享DLs的资源和服务,其目标是向用户提供一个将异构,分布式DLs无缝集成的视图,实现对DLs资源的透明访问[Bir2001] [AnVi99]。

在数字图书馆联盟中,为了实现互操作,一个挑战就是实现数据的共享,信息集成技术被采用来解决该问题[Nik1998]。该技术[Lenz2002] [Halevy2006] 可以聚集分布的不同数据源,为用户提供统一的视图进行访问。在中介模式下,所有数据源映射到一个单一的领域概念,实现集成,因而集成系统依赖于数据源与中介模式的语义映射关系[Renee 2000]。

在数字图书馆联盟中,由于每个DL具有自治性和动态性,联盟中的DL不断改变其状态(加入,激活,休眠,或退出),每个DL的数据也在不断变化和增长(包括可用数据库种类的变化和数据量的增加),如果实现手工的模式匹配和映射是耗时费力低效的[Alon 2005], [Shvaiko 2005]。因而为了满足高速增长的web数据和电子商务集成的需求,出现了支持自动化匹配的研究的方法和工具[E. Rahn 2001]。然而在现实应用中,由于信息的异构性和自动匹配工具的局限性,使得创建和维持精确的映射关系几乎是不可能的事情,从而导致映射经常是不准确的[Dong2007]。

数据的不确定性问题在今天变得日益突出,在诸如数据集成,科学数据,IR,的各个领域里面,出现了快速增长的大量不确定数据,这会在数据本身,数据实例间的映射上(如上文所说),或者是查询处理当中产生不确定性。对于这些不确定性,给越来越多的组织和用户带来管理的问题:清理的成本过高(如web 数据的集成),甚至是不可能清理的;在[Dalv 2007]中提出了数据不确定性所面临的挑战和要解决的问题。

本文的主要工作如下:

1 提出基于构建数字图书联盟的模型。

2 把不确定性引入传统的数据集成理论模型,建立了一个具有概率性的数据集成模型。

3 对于模式匹配的不确定性,重点讨论了BY-TABLE下的数据概率表示和查询回答。

二、数字图书馆联盟(DLF)的信息集成模型

下面通过对利用数据集成技术构建的数字图书馆联盟的查询过程描述来说明集成中的不确定性。

图1描述了一个数字图书馆联盟DLF的信息集成模型,DLF中的全局模式Global Schema提供联盟中共有的概念标准,每个DL可把自己的数据源(DL source)通过局部模式(Local Schema)与全局模式进行映射;用户可通过DLF portal在全局模式上提交查询;Metadata Repository提供了共有的元数据标准,查询引擎(Query Engine)负责接收用户查询请求,并对查询计划进行优化和执行;当查询到达每个DL时,由wrapper负责对查询进行解释并完成本地查询。

图1 数字图书馆联盟DLF的信息集成模型

在该集成系统中,如果映射通过自动或半自动方式建立,会不可避免地考虑映射的概率。当一个查询提交到集成模式上时,查询的结果会出现不止一种带有概率的查询重写形式。

三、 概率的数据集成模型

基于[Lenz2002]提出的数据集成的参考模型,本文定义了概率性的数据集成模型(如图2),其形式化描述如下:

图2 概率性的数据集成模型

一个数据集成系统Δ 是一个四元组 ,其中:

G是全局模式,用使用了一组相关字母表Ag的逻辑理论来表达;S是源数据的模式,用使用了一组相关字母表As的逻辑理论来表达;

四、模式映射的概率

在进行模式的自动映射时,可能会产生几种候选的模式对应关系,每一种都有其出现的概率,其元组的概率分布情况分为两类[Dong2007]:1) 在所有的数据上会采用一种相同的映射关系,称为by-table 映射,这是本文所关注的。2) 在源数据的关系中,会出现多个元组的子集采用不同的映射关系 称为by-tuple映射。

本文中,我们讨论的是关系型数据模型,一个模式是一个关系集,每个关系是一个属性集。我们选取SQL中select-project-join(SPJ) queries 来进行讨论;同时,我们把LAV的形式限定在S中每个关系由G中一个模式采用project来表示。

假若在DLF上的全局模式G中,有一个关系DLF_DIRECTORY(题目, 出版者,时间,创作者,科目,格式,类别);一个电子图书馆DL_1,其局部模式中存在一个关系DL_DIRECTORY(名称,发行者,日期,作者,主题,规格,类型),其数据实例如图3;在DL_1上,进行模式自动匹配产生的可能的匹配及其概率如图4,用逻辑表达式可表达为:

DL_DIRECTORY(名称,发行者,日期,作者,主题,规格,类型)

?DLF_DIRECTORY (题目, 出版者,时间,创作者,科目,格式,类别)

DL_DIRECTORY (名称,发行者,日期,作者,主题,规格,类型)

?DLF_DIRECTORY (科目, 出版者, 时间, 创作者, 题目, 格式, 类别)

DL_DIRECTORY (名称,发行者,日期,作者,主题,规格,类型)

?DLF_DIRECTORY (题目, 创作者, 时间, 出版者, 类别, 格式, 科目)

六、相关工作

在数据集成领域,[Levy 2000]提供了几种语言来描述数据源的内容,以及数据源之间的交换和相关的重新算法。[Lenz2002]从讨论了一系列理论问题,包括对集成系统的建模,查询处理机如何处理不一致的数据源和查询的推理。[Cal 2005]对数据集成系统进行了抽象,并且把全局模式表达为本体形式。

目前概率数据的研究集中在概率数据库和概率数据管理上。关于概率映射的话题近些年才开始[Dalv 2007] [Das 2006][Suciu2005],[Gal 2006]通过使用半自动的映射工具提高排在前面的映射的准确度来得到top-k个模式映射。[Nott 2007]综合了IR和机器学习技术来发现适宜的若干映射。然而以上理论均没有把映射和不确定性作为一个整体来讨论。[Dong2007]为概率映射提供了两种可能的语义:BY-TABLE和 BY-TUPLE,并且在近似的模式映射上使用了复杂的查询算法。

七、结论

篇5

出版企业可利用的大数据的具体形式

对于“大数据”(Big Data),研究机构Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。举个例子,1分钟的时间内,新浪发送2万条微博,苹果下载4.7万次应用,淘宝卖出6万件商品,人人网发生30万次访问,百度产生90万次搜索查询。由此可见,数据规模的急剧膨胀,各行业累积的数据量越来越巨大,数据类型也越来越多、越来越复杂,已经超越了传统数据管理系统、处理模式的能力范围,于是“大数据”这样一个“无穷大”的概念才会应运而生。大数据的特点可以被归纳为:数量巨大、类型多样、实时快速、价值高但密度低。正式基于这样的特点,出版企业可以结合产业的优势对大数据进行充分的挖掘和利用。

(1)Web文本挖掘。大数据的核心是挖掘庞大数据库的独有价值。面对因为网络的飞速发展而带来的信息膨胀,尤其是以半结构化或非结构化为主的文本信息,人们迫切需要研究出方便有效的工具去从中提取符合需要的“简洁的”“精炼的”“可理解的”知识,Web文本挖掘技术由此产生。而利用Web文本挖掘发现大数据的价值也成为可能。

文本挖掘是近几年来数据挖掘领域的一个新兴分支。文本挖掘也称为文本数据库中的知识发现,是从大量文本的集合或语料库中抽取事先未知的“可理解的”有潜在实用价值的模式和知识。而随着网络技术的飞速发展,特别是Web应用的不断普及,网络信息急剧增加,信息类型也越来越复杂。如何从这些大量自由、非结构化或半结构化的信息中获得所需求的知识,传统的数据挖掘技术已不适用,解决问题的一个途径就是将传统的文本挖掘技术和Web综合起来,进行Web文本挖掘。Web文本挖掘就是以万维网上的数据为分析对象,以抽取有用知识为目标,把传统文本挖掘技术和万维网相结合的研究技术。

(2)出版企业可利用的Web文本数据。网络上图书评论的数量极为庞大,有些畅销书可能包含成千上万的评论,借助Web文本挖掘技术能自动地对图书评论进行分析和处理,挖掘出有用的信息。通过对图书在线评论的挖掘管理,出版企业可以用较低的成本收集、整理读者对于各类图书的关注兴趣和欣赏特点,同时也可以获得畅销图书迎合市场需求的关键因素。在此过程中,企业获得了知识资源,同时培育了持续的竞争优势。因此,可以将各大图书销售网站的读者评论作为出版企业可利用的大数据分析的首要来源。

在企业的销售网站或其借助的其他互联网销售平台上,通过建立在线评论客户知识管理系统,收集、整理和分析客户评论,将客户评论转化为企业的知识,从而为企业价值链的各个环节提供客户的信息和知识的共享,并将客户知识延伸到企业的决策制定中,为企业有效开展客户知识管理提供有效的解决方案。同时,基于评论挖掘构建的客户知识管理系统,具有与用户需求同步的快速响应能力,即具有将用户需求迅速转向图书的策划和印制的能力。这就使得出版企业以响应市场需求为中心,实时挖掘客户知识,提高优化客户关系的决策能力,准确及时地向客户提供所需的图书产品。

大数据在选题策划中的应用

信息收集和预处理

相对于传统数据库中的完全结构化的数据而言,Web数据的最大特点就是半结构化。从评论挖掘的角度来看,Web上的网页包含的信息并不都是有用的,体现网页的主题信息的是“主题”内容;与主题内容无关的导航条、广告信息等内容则是“噪音”内容。网页净化过程就是去掉包含噪音内容的内容块,只保留网页中包含主题内容的内容块。因此在评论挖掘的数据预处理阶段,首要任务就是完成Web网页净化过程,去除网页内容中的音频、视频、图片等其他非文本信息,还有各种网页本身的标记语言,最后仅剩下网页中的文字评论内容,从Web页面中提取出文本评论信息。

评论页面的下载可以采用聚焦爬虫技术,所谓聚焦爬虫,是能实现自动下载网页功能的程序,它根据指定的抓取目标,有选择地获取万维网上的网页及其相关的链接,抓取所需要的信息。通过对Web页面的语义结构进行描述,产生适合计算机自动处理的描述文件和指令文件,实现持续地、大批量地提取Web信息。

图书特征提取和情感分析

评论内容是中文语句,要从中提取词语,进而获得读者关注的图书特征,首先需借助中文分词技术。中文分词技术属于自然语言处理技术领域,它通过词性标注将一个汉字序列切分成相互独立的词,文本挖掘的基础是中文分词,一段中文要使得计算机自动识别语句语义,必须通过准确的中文分词处理。在中文分词和词性标注的基础上,使用汉语分词软件的关键词提取功能提取评论内容中的关键词,按照权重排序找出高频名词或名词性短语作为候选词汇,通过人工定义和筛选,得到读者评论中的图书属性特征词集合。

挖掘出的图书的读者关注特征,是读者图书评论中最集中和最热点的特征,但每项特征具体的评价倾向性还需进一步分析和处理,即通过提取读者对每项关注特征所持有的褒贬态度,分析其评价情感倾向性。情感词可以细分为情感特征词汇和情感强度词汇。客户评论中的情感特征词是客户表明自身观点和态度的词汇,而情感强度词是指评论中用于加强语气的程度副词,如“最”“非常”和一些否定词。这些词的修饰会加强或减弱,甚至改变原来词汇的情感倾向,在判断评论的情感时要考虑这些强度词语的作用。

利用信息完成选题策划

采用Web文本挖掘技术,从海量的读者评论中挖掘出的图书特征和其情感倾向,为图书的选题策划提供了充分的信息资料,这将为图书选题的市场前景分析提供保障,最大限度地降低图书出版的风险.使出版社的图书在市场竞争中始终处于有利地位。利用挖掘出的信息完成图书选题策划主要分为以下几个阶段:

(1)筛选正向评价的图书特征。选题策划应该从挖掘出的读者关注特征中筛选其正向评价,从而确定目前市场中读者主要感兴趣的图书特征。例如,假设从亚马逊图书网站的少儿图书销售排行榜的前2本图书的读者评论中挖掘出了读者关注的图书特征为“百科,科学,绘画,配图,价格,拼音,习惯,动物,纸质,图案,常识”,然后可以利用软件技术筛选其中正向评价的特征,假设筛选出的是“百科,科学,绘画,价格,拼音,习惯,动物”。那么这些正向评价的特征就是选题策划中应该重点考虑在图书题目和设计中的要素。

(2)建立图书选题策划概念层次树。虽然正向评价的图书特征已经找到,但并不是都能在最终的题目中展示的,一部分可以稍作修改列入图书题目,另一部分则只能体现在图书的装帧设计环节,例如纸张、配图、拼音和价格等。所以需要为图书建立选题策划概念层次树。经过严格划分层次的树状结构是图书选题策划概念树的结构形式,图书选题策划的总概念作为根节点,较小或最小子概念作为叶子节点,图书特征属于叶子节点。上层概念名称概括的是其包含的所有子概念属性,子概念名称是详细划分父概念后从不同的角度描述的父概念。兄弟概念指同一个父概念所包含的所有子概念,它们属于平等关系。用产品评价概念树表示的概念层次有两个特性:第一,树的节点表示概念,树枝表示有序关系;第二,有序关系包括了包含关系、属性关系、部分整体关系。例如,图1就是一个图书选题策划的概念层次树,主要分为选题内容设计和装帧设计两个分支,设计者可以根据选题策划的领域知识和工作经验进行概念层次树的完善和更新。

图1 图书选题策划的概念层次树

(3)确定图书题目和装帧设计要素。将筛选出的图书正向评价特征,对照图书选题策划概念层次树,确定图书题目要素和装帧设计要素。例如,延续前面在亚马逊网站评论中筛选出的正向特征,能够列为图书题目要素的是“百科,科学,习惯,动物”,而列为图书装帧设计要素的是“绘画,拼音,价格”,这就为图书选题策划提供了迎合市场需求的准确决策信息,可以有效地帮助出版企业识别和判断选题的市场价值,并实时捕捉读者的心理期望和偏好。

选题策划基于数据更高于数据

篇6

考虑只包含一个数据源和一个信道无线通信系统模型。假设时间是离散的,初始时刻系统内无数据分组残存。数据分组到达信道的过程为周期过程,即每隔时间τ有一个大小固定为L的数据分组到达信道。对于信道而言,马尔科夫on-off信道模型下的传输时延与Gilbert-Eliotton-off信道模型下的系统性能已有详细的论证,这说明讨论一般on-off信道模型的价值性与必要性。本文将信道定义为一种无记忆的伯努利on-off信道,即系统在任意单位时间间隔内以概率p提供恒定速率为C的服务,以概率(1-p)不提供服务,并且系统服务是关于时间独立的,实际服务并不会根据已有的服务进行调整。并且,信道传输数据分组需要消耗能量。数据分组在某些时间段内的到达率可能会大于信道的传输速率,但是不会一直大于信道传输速率,否则将导致数据分组无限积压、系统不稳定。数据分组到达时信道若处于关闭状态,则这些数据分组被寄存在一个容量无限的缓存器中,这样就保证了不会有数据分组丢失,从而保证了系统传输的可靠性。规定信道的传输速率必须大于数据分组的平均到达率,但是一定时间段内系统仍可能有数据分组的积压,本文只分析这一特定时间段内的系统能量消耗。

2随机网络演算的基本特性

网络演算分为确定性网络演算和随机网络演算。确定性网络演算常用于分析系统的最差性能,随机网络演算常用语分析动态系统的性能。这一部分主要介绍了随机网络演算到达曲线、服务曲线和时延界限的定义与特征以及如何运用它们去解决第二部分中的提到的最优化问题。

3数值分析及仿真结果

3.1信道服务概率、概率性时延约束与时延约束的关系

在概率性时延约束确定的情况下,信道服务概率的最小值是随着时延约束的增加而减小的。当时延约束为一个给定值时,其对应的纵坐标的值为信道服务概率可取的最小值,这样才能保证最小传输速率有意义。当时延约束为一个给定范围时,范围起始值对应的纵坐标的值为信道服务概率可取的最小值。在接下来的讨论中,信道服务概率和时延约束的取值必须符合上述约束条件。

3.2最小能量消耗与时延约束的关系

下面讨论最小能量消耗与时延约束的关系。令噪声功率谱密度N0=10-7W/Hz,信道带宽为W=11MHz,固定的数据分组大小L=1Mbit/s,数据分组达到时间间隔τ=0.1s。选取时延约束为[0.7s,4s],信道服务概率p=0.99,概率性时延约束p0=0.1。每一个时延约束都对应着唯一的最小能量消耗,这表示在一个确定的时延约束下的最优化问题有唯一解。另外,最小能量消耗随着时延约束的增加而减少,这是因为时延约束的增加将导致最小传输速率的减少,使最小能量消耗减少。

4结束语

篇7

关键词:数字喷泉码 LT码 度数分布 应用模型

中国分类号:TN911.22 文献标识码:A 文章编号:1672-3791(2013)07(c)-0001-02

数字喷泉码是近年来兴起的一种新型信道编码技术。在1998年,M.Luby等国外专家提出数字喷泉码原理后[1],其理论与应用也越来越受到关注。它具有一些特殊的优点,数字喷泉码不需要数据重传信道,可以大大节省信道资源。在通信中,有效性和可靠性是一对矛盾,信道编码技术是保证信息传输可靠性的必要方法。信道编码实质上是通过增加信息的冗余来提高信息传输的可靠性。在信号衰减很严重,传输信号淹没在噪声中时,可靠性问题就尤为严重的凸现出来了。为了使信号具有较强的抗噪声干扰的能力,需要对信号加以改造,使信号内部结构具有更强的规律性或相关性,以保证在噪声干扰下仍能发现错误,甚至纠正错误,恢复原来的信息。

数字喷泉码作为一种信道编码可以改进无反馈信道的通信方式,它是一种前向纠错编码技术。信息在发送端经过纠错编码后送入信道,接收端通过纠错译码自动纠正传输中的差错,这样的方式叫做前向纠错(FEC)[2],前向则是指过程是单向的,没有反馈。这种方法具有较低的开销和较精确的差错恢复能力。而传统的FEC存在一些缺陷[3]:(1)在传输过程当中,数据组与组之间有时延。(2)当接收端在没有接收到系统所要求数据包个数的情况下,需要发送端重传整个数据块,不符合实时传输。而对于数字喷泉码,不需要发送端与接收端之间的交互,可以大大减少传输时延。而且,当没有接收到应有的数据包个数时,不需要重传整个数据块。

数字喷泉码的应用环境主要是删除信道,删除信道主要是指的一种类似于纠错概率很高的噪声信道,在其中传输的数据要么彻底丢失,要么完全正确无误的被接收。

1 数字喷泉码

数字喷泉码可以从K个原始数据分组生成得到无穷多个编码分组,是一种无码率的码。当接收端收到足以译码的编码分组的个数时,便能成功译码,该种码便被形象的称为喷泉码。数字喷泉码不需要数据重传信道,可以提高信息传输的可靠性。在数字喷泉码的研究当中,将其分为三类[4,5]:(1)随机线性喷泉码。(2)LT码(Luby Transtion Code)(3)Raptor码。严格意义上说,随机线性喷泉码不算是喷泉码,其编译码复杂度太大且成功译码概率较低;LT码是第一种可以实现的喷泉码算法,它也是一种稀疏码,其编译码过程是做二分图的过程;Raptor码是在LT码基础上进行的编码,其编码时平均度数较低。本文主要研究LT码,将会详细讨论LT码的编译码过程[5,6],其余两类具体编码可参见参考文献[7,8,9]。

1.1 LT编码

(1)从合适的度数分布当中,随机地选择一个值,该值即为该编码分组由几个原始数据生成,叫做该次编码分组的度数。

(2)从原始数据分组(比特)当中随机的选择个数据,将该个数据进行模2和。

(3)重复以上步骤,生成编码分组。

1.2 LT译码

喷泉码的译码,目前普遍采用MP(message passing)算法,过程如下。

(1)在得到的编码分组数据当中,找到度数为1的编码分组,若没有,则译码失败。

(2)在二分图当中,将该度数为1的编码分组直接复制为原始数据分组。

(3)将上一步生成的原始数据分别模2和到与之相连的其余编码分组当中,并且去除该原始数据和这些编码分组的连接关系。

(4)将上一步当中的编码分组数据的度数减少1。

(5)重复以上四个步骤,直至恢复原始数据,译码完成。

1.3 LT码的度数分布

在上述LT码的编码过程当中,需要一个合适的度数分布,这是该种算法最关键的问题,它必须满足以下两个条件。

(1)在一定意义上度数分布较高,使得生成的编码分组能够尽可能包含所有原始数据。

(2)要求编码分组的度数不能太高,使LT译码能够成功开始以及进行下去。

2 LT码编译码过程的研究与仿真

2.1 有关参数的研究

在数字喷泉码编译码过程当中,一个重要的指标就是译码失败的概率。根据提出的理论,它不需要反馈信道,通过发送端可以给出无穷多个编码分组,是无码率的,只要接收端收到足够的编码分组,便能以高概率译码。而进行整个过程时,度数分布是一个重要的概念,直接关系到译码能否开始进行以及译码成功的概率。

在本文的研究过程中,信源(原始数据)选择的均是相关性不大的随机数据比特。通过对鲁棒孤子分布的参数进行改进,得到最优化参数情况下的译码失败概率,本文在对参数的研究过程当中,得出参数c较参数的影响大,c会直接影响译码失败概率,而的变化基本对译码失败概率没有影响。据图1和图2可得出最优化的参数c在0.2处转折,可选择c大于或等于0.2,这里我们选择c=0.2,因影响较小,对可以根据实际应用情况而定,研究当中我们选择=0.01。

用最优化的参数可以使译码失败的概率降到相对很低的范围。

2.2 接收数据量对译码性能影响的研究

如上所述,数字喷泉码是一种无码率的码,而在数字喷泉码的研究过程当中,得出数字喷泉码能成功译码所需接收的最少数据量有三种[5,6]:、以及。其中N是接收数据量。本文针对固定的原始数据比特K=512比特,当接收到的编码分组个数不同时得到的译码效果如图3所示。

图3中显示了接收数据分别为以上三种情况时的译码性能。由图可以看出,随着接收端收到的数据比特数的增加,译码失败概率在减少,当收到的数据比特数在接近K值时,该概率减少非常迅速,之后速度下降,基本维持稳定。在收到 个编码分组时效果最好,可以得到最佳接收数据至少为。而且,对于一定的原始数据信息,并不是收到的编码分组越多,译码概率就越高,是取决于其中度数1的编码分组S的个数。

2.3 译码失败概率具体值的研究

喷泉码的译码概率和以下几个因素有关:(1)收到编码分组的个数。(2)度数为1的编码分组个数。因为喷泉码是一种无码率的码,可以生成无穷多个编码分组,能够保证接收端有足够的编码分组成功译码。Luby指出,选择一个合适的参数c后(本文得出最优参数c=0.2),当接收端收到个编码分组时便能以高概率成功译码,该译码成功的概率在Luby的理论上的理想值为1-,但实际过程中做不到。经过本文的研究仿真,得出在Luby理论下的译码失败概率平均值为10-2数量级左右,而使用喷泉码最初的理论值以及使用(该值是仅仅保证接收端可以开始进行译码到完成所需的编码分组个数,并不能保证高概率)时,译码失败概率平均值则比Luby理论下的值大,如图4所示。

由图4可得,接收数据量为 和时其译码失败概率在~数量级之间,波动相对较大,而且当收到时较效果好。在具体数值上,平均值基本为10-2数量级左右,如表1所示。而接收数据量为时,其译码失败概率比较大,但较平稳,为10-1左右。

3 数字喷泉码的进一步研究

数字喷泉码的应用环境只能是删除信道,而理想的删除信道是不存在的。在实际应用过程当中,纠错能力较强的噪声信道近似于删除信道,那么可以设想,在实际应用时,可以将数字喷泉码与纠错能力较强的纠错码进行级联,从而体现出数字喷泉码的性能。如图5所示

该图是数字喷泉码在实际当中应用的一种可能模型。其中由纠错码编码到纠错码译码部分相对数字喷泉码来说相当于删除信道,因为纠错码对信道进行了“改造”。只要纠错码的纠错性能达到一定要求,就能体现出数字喷泉码在通信当中的优越性能。其中纠错码可以采取Turbo码,LDPC码等纠错性能较好的码。

4 结论

数字喷泉码是在前向纠错码的基础上发展而来的,它应用于删除信道,且不需要顾及信道中删除事件的统计特性。它在发送端发送无穷多个编码分组,只要接收端收到一定数量的编码分组数据,就能够以高概率成功译码。数字喷泉码在提出的时候只是一个概念,并没有可行的算法,而LT是第一种实现的数字喷泉码,它充分继承了数字喷泉码的优点,但是LT码的编译码复杂度比较大,实时性较差。同时,删除信道也是数字喷泉码理论的一个重要组成部分,本文首先对LT码的各个方面性能及参数做了较深入的研究,给出了LT码的一些结论,并且提出了一种可能的删除信道应用模型,当应用纠错能力较强的码时,可以实现数字喷泉码的实际应用。在后续的研究当中,需要对数字喷泉码的算法进行改进,使其编译码复杂度下降,提高在应用时的可靠性和有效性。

参考文献

[1]卢守信.喷泉码技术研究[J].信息科技,2007,6:101-102.

[2]张宗橙.纠错编码原理和应用[M].北京:电子工业出版社,2003,4:25-27.

[3]熊鹰,金心宇.前向纠错编码传输机制的优化[J].江南大学学报,2006,4:127-131.

[4]MacKay D J C.Fountain codes[J].IEE mun,2005,152(6):1062-1068.

[5]AminShokrollahi.FountainCodes[J].EPFL.2003.

[6]Michael Luby.LT Codes[C].Proceedings of the 43r Annual IEEE Symposium on Foundations of Computer Science,2002:1-10.

[7]王仕奎,张爱清.基于喷泉码的分布式鲁棒存储[J].武汉大学学报:工学版,2007,6.

篇8

本文论述了信息技术与数学教学整合的教学模式研究的现状及其重要性,分析了构建信息技术与数学教学整合的教学模式的原则,并探讨了在主导——主体教学理论的指导下构建的5种概念、规律和几何整合教学模式的目标、操作程序、适用条件以及评价方法。 关键词:信息技术数学教学整合教学模式 1引言 现代教育技术广泛应用于教育领域,不仅从手段上,而且从观念上、教学模式上都引起教学的深层次变革,信息技术与课程整合成了教学改革的一个突破口。然而,目前信息技术在中小学理科教学的应用水平仍然非常低,大多是作为教学内容的展示工具。中小学理科教师对于如何将信息技术与理科教学整合感到非常困惑,他们心中也产生了许多问题,如“什么时候用信息技术比较合适?怎么用?”、“怎么做才能体现‘主导——主体’教学思想?”、“怎么做才算是信息技术与课程整合?”,要回答这些问题,除了让中小学教师掌握先进的教育教学理论、信息技术以外,更为重要的是进行基于信息技术与课程整合思想的教学模式的研究,为中小学教师的教学实践提供一个可参考的范式。教学模式是在一定的教育思想、教学理论和学习理论指导下的,为完成特定的教学目标和内容而形成的比较稳定且简明的教学结构理论框架及其具体可操作的教学活动方式。教学模式是教学理论与教学实践的桥梁,既是教学理论的应用,对教学实践起直接指导作用,又是教学实践的理论化、简约化概括,可以丰富和发展教学理论。研究“主导——主体”教学思想指导下信息技术与理科教学整合的教学模式,为中小学教师提供一些可用于指导教学实践并借以改造的教学模式,对于推进信息技术与课程整合就显得非常重要而迫切。 2信息技术与数学教学整合的教学模式研究现状 有关信息技术与学科教学整合的教学模式方面的研究,语文学科走在其他学科的前面。由北京师范大学现代教育技术研究所主持的全国学科“四结合”(原为全国语文“四结合”)课题组和试验学校的教师们结合长达7年之久试验研究的实践,提出了几十种信息技术与语文教学整合的教学模式。与信息技术与数学教学整合相关的研究,基本上形成三足鼎立的局面:一是数学教学模式的研究,二是信息技术与课程整合模式的研究,三是计算机应用于数学教学的作用和方式的研究。关于信息技术与数学教学整合模式的研究却很少,有的也只是零星的、个别的。 自从20世纪70年代美国的乔伊斯和韦尔等开创性地提出将教学模式作为教学研究领域的一个独立研究方向以来,教学模式的研究一直是教学研究领域一个重要的课题。数学教学模式的研究近些年来呈现欣欣向荣的景象。贝尔在其著作《中学数学的教与学》中提出先行组织者、发现法、证明定理、解决问题、利用计算机等许多数学教学模式。由冯克诚、田晓娜主编的《最新教学模式全书》中也提出了数十种数学教学模式,还有《数学教育学报》、《中学数学教学参考》《教法与学法》、《数学通报》等期刊上名目繁多的数学教学模式,真可谓是百家争鸣、百花齐放。研究数学教学模式的学者和教师从数学学科教学的视角研究教学模式,对数学教学实践具有较好的指导作用,然而以计算机为核心的信息技术在这些教学模式中最多只是起一种教学手段或教学媒体的作用,贝尔提到的利用计算机教学也仅仅是众多教学模式中的一种,对于当前如何有效地将信息技术与数学教学全面整合起来的问题缺乏直接的指导作用。 近年来,信息技术与课程整合模式的研究引起了教育技术界的重视,提出了不少信息技术与课程整合的模式,如何克抗教授提出的讲授、个别辅导、探索、协作等5类网络教学模式,祝智庭教授总结归纳的个别授导、教学模拟、智能导师、问题解决等23种信息化教学模式,李克东教授提出的情境——探究式、小组合作——远程协商式等4种数字化学习模式。这些信息化教学模式对于信息技术与数学教学整合有很好的借鉴作用,但由于其学科的普适性而缺乏数学教学的针对性。 计算机应用于数学教学前期研究的重点在于如何充分发挥计算机辅助教学的工具,近些年来则更加关注计算机认知工具的作用,尤其是校园网、因特网在中小学的广泛普及以及“几何画板”、“mathcad”、“mathematica”、“Excel”等软件的引入与使用,许多数学教学研究人员和数学教师对于将信息技术与数学教学整合进行了有益的探索,并取得了一定的效果,其中运用“几何画板”革新数理化教学(特别是数学教学)的试验研究项目取得了尤为显著的影响和效果,如运用“几何画板”讲授抽象的数学概念、做数学实验都取得了较好的效果。但是这些计算机应用于数学教学的研究大多停留在计算机作用的描述、教学经验描述的层面上,没有对这些经验进行理论化、抽象化、模式化的概括,不利于其他教师的借鉴和运用。 3构建信息技术与数学教学整合的教学模式的原则 教学模式是教学过程的简约化描述,但教学程序却不等于教学模式。教学模式的构建虽然具有一定的主观性,受到构建者对教学规律和原理的理解和具体的教学实践的影响,但是必须在教育教学理论的指导下,符合教学规律,为实现教学目标服务,也就是说我们构建信息技术与数学教学整合的双主教学模式也要遵循一定的原则。 3.1基于主导——主体教学理论的原则 教学模式与教学思想、教育教学理论有天然的联系,没有一定理论的指导,教学模式就没有了灵魂。一个完整的教学模式应该包含主题、目标、条件(或称手段)、程序和评价五个要素(张武升,1988)。主题即教学模式所依据的教学思想或理论,对教学活动作出理论的解释,规定了教学模式的本质,还渗透、影响其他四个要素。影响教学模式的理论基础有现代的教育思想、学习理论、教学理论等。现代教育思想的指导从根本上把握了教学模式培养人的最终目标;学习理论解释学习的内在机制,要求教学符合学生的认知规律,学习是有意义的学习;教学理论是用于指导教学操作程序和方法的系统理论,直接指导教学模式的形成。 “主导——主体”教学理论是构建信息技术与数学教学整合教学模式最主要的理论依据,“主导——主体”教学理论取建构主义学与教理论和奥苏贝尔等以“教为中心”的学与教理论之长,避两者之短,认为在教学的展开进程中,要充分尊重学生的学习主体地位,让学生对教学内容进行自主学习、自主思考,教师则在教学过程中起学习内容的选择、学习过程的组织、帮助和指导等主导性作用,使学与教有机的统一起来,体现了以人的全面发展为最终目标的教育思想。 3.2体现数学教学特点的原则 为数学教学服务所构建的信息技术与数学教学整合的教学模式不可避免地受到数学的特征、数学教学的特点、原则以及数学教学改革的趋势和方向的影响。数学既是基础性学科又是工具性学科,因此数学教学既要重视基本知识、基本概念、数学思维方法的教学,又要重视数学知识的实际应用教学,重视学生实际问题解决能力的培养。针对现在数学只能为越来越少的人所掌握以及学了数学没有用处的情况,国际数学教育界提出“大众数学”、“人人都要学会的数学”的口号,美国数学教师协会(NCTM)在1989年3月制定的《学校数学课程与评价标准》中提出了全美学校数学教学目标:“为估价数学而学习,为数学推理而学习,为数学交流而学习,对于自己从事数学活动的能力有信心,成为数学问题的解决者”。我国新的数学课程标准也提出“通过义务教育阶段的数学学习,学生能够:获得适应未来社会生活和进一步发展所必需的重要数学知识(包括数学事实、数学活动经验)以及基本的数学思想方法和必要的应用技能;初步学会运用数学的思维方式去观察、分析现实社会,去解决日常生活中和其他学科学习中的问题,增强应用数学的意识;体会数学与自然及人类社会的密切联系,了解数学的价值,增进对数学的理解和学好数学的信心;具有初步的创新精神和实践能力,在情感态度和一般能力方面都能得到充分发展”。这些数学教学目标为现代数学教学提供了如下启示: 基于“做”(hand-on)的教学——学习抽象的数学概念之前,让学生做数学实验、动手操作实物或模型,培养数学的意识,强调培养学生动手的能力; 基于思维(mind-on)的教学——关注核心概念、有判断力的思维方法和能力的教学,以使学生重构并形成自己的数学概念和关系,强调思维的培养。 基于事实(reality-on)的教学——使学生学会探索、发现、讨论和有意义建构用于解决现实问题的数学概念和关系,培养学生用数学的方法来解决问题的能力。 3.3基于信息技术与课程整合思想的原则 信息技术与课程整合是指在课程教学过程中把信息技术、信息资源、信息方法、人力资源和课程内容有机结合,共同完成课程教学任务的一种新型的教学方式(李克东,2001)。信息技术与课程整合不是一朝一夕的事,而是经过许多中间过程的,最终将信息技术作为辅助学习的高级认知工具,并带动教育的全面改革。根据信息技术与课程整合的不同程度和深度,将整合的进程大略分为三个阶段(马宁、余胜泉,2001):封闭式、以知识为中心的整合阶段,信息技术作为演示、交流和个别辅导的工具;开放式的、以资源为中心的整合阶段,信息技术作为资源环境、信息加工工具、协作工具和研发工具;全方位的课程整合阶段,信息技术与课程整合引起了课程内容、教学目标和教学组织架构的全面变革。构建基于课程整合的数学教学模式要充分利用教育技术的优秀成果,并根据教学内容的特点选择适当的整合方式,强调将信息技术认知工具的作用,加强整合的深度,而不是仅仅将信息技术作为演示的工具。 3.4最优化教学效果的原则 教学模式是教学理论在教学实践中的运用和具体化,来自于教学实践。教学实践是教学模式的基石,教学模式必须用于教学实践才有其存在的必要,也只有通过教学实践的检验才能不断完善。因此,在研究教学模式的同时,还要将之用于实实在在的教学活动中,研究教学模式是否有利于提高数学教学的效率和效果,这是我们研究和构建模式的根本所在,也是验证模式是否有效、是否值得推广的基本途径。 4几种信息技术与数学教学整合的双主教学模式 教学模式的研究是理论与实践的“中介”研究,其“中介”性质决定了教学模式的研究有演绎法和归纳法两种方法。演绎法采用实证研究的方法,“从一种思想和理论假设出发,设计一种教学模式,用实验检验证明其有效后,确立这一教学模式”(张武升,1988)。归纳法是在大量教学实践基础上总结、概括形成教学模式。随着教学理论和教育科学研究方法的发展和变革,尤其是现在对教师教育科研能力的重视以及运动研究方法再度受到关注,教学模式的研究更强调运用演绎法和归纳法相结合的方法。 我们运用演绎法和归纳法结合的方法就数学的概念、规律、几何教学构建了5种信息技术环境下的双主教学模式,下面就对这5种模式的操作程序、适用条件、评价等进行阐述。 4.1概念的归纳——获得教学模式 “概念的归纳——获得教学模式”是在参考乔伊斯(B.Joyce)和韦尔(M.Well)的“概念获得模式”和塔巴(HildaTaba)的“概念发展教学模式”的基础上提出的,其目标是让学生形成正确的概念、了解概念的含义以及通过参与和反思概念化的过程,提高分析和概括的思维能力。概念的归纳——获得教学模式包括七个步骤。 (1)情景导入,明确教学目的 情景导入的目的是激发学生的学习兴趣,建立学习的心理倾向。所创设的情景一定要与要讲授的概念有关,可以是与概念相关的生活实例、资料,可以是一些例子,也可以是用以明示该概念与其他概念关系(上位、下位、并列组合)的先行组织者等。在概念学习之前,教师要向学生阐明本课的目的是通过寻找其本质属性界定某一概念。 (2)呈现例子,分类归纳 教师选择一些肯定性例子(具备概念所有属性的例子)和否定性例子(不具备或不完全具备概念属性的例子),然后呈现给学生,让他们把相似的归为一类,并找出其共同属性(即归类理由)。如果低年级学生的分析能力不够强,则可以先呈现肯定性例子,让学生提取其中的共同属性,再呈现否定性例子,剔除非本质属性,引起学生对本质属性的注意,加强对本质属性的认识。 (3)提出概念假设 当学生把所有的属性都罗列出来后,要求学生给这组例子取一个名称,思考如何用这些属性来表述这个名称,此时教师不要对任何学生的观点进行评价,要鼓励他们多思考、多说。 (4)呈现例子,检验假设 同样呈现一些肯定性和否定性的例子,让学生用自己提出的假设判断是否所有的肯定性例子都能归到概念组中、概念是否已包含了所有的本质属性,必要时可以将一些属性添加到概念中。 (5)概括总结,形成概念 教师展示全体学生提出的概念属性和概念假设,要求学生共同提取该概念所包含的所有本质属性,用简练的语言概括出概念,然后再现概念的规范表述。 (6)应用概念,巩固理解 可以呈现一些比较复杂的例子,让学生应用概念进行分类,也可以让学生自己举出一些符合该概念的例子,加深他们对概念的理解。 (7)反思概念化过程 教师可以用问题来激励学生回忆、反思、讨论自己概念化的过程,如“请回忆一下你们得出这一定义的过程,你们是怎么确定其主要特征的”,从而提高其思维能力。 在上述过程中信息技术的作用以及教师和学生在过程中的活动可用表1来概括。 表1概念的归纳——获得教学模式中信息技术的作用和师生活动 模式程序信息技术的作用(理想状态)教师活动学生活动 情景导入,明确教学目的情景创设工具创设情景,说明教学目的明确目的,建立心理倾向 呈现例子,分类归纳例子展示、操练、表征观点(提取的概念属性)工具选择例子,确定呈现方式,收集概念属性例子分类,归纳概念属性 提出概念假设表征观点、交流讨论工具鼓励学生思考、发言,收集学生提出的假设提出属性和名称,讨论 呈现例子,检验假设展示例子、操练、表征观点、交流讨论工具选择例子,阐明阶段目的,参与讨论,收集概念属性假设例子判断,归纳属性,讨论 概括总结,形成概念呈现假设、表征观点、交流讨论工具展示概念属性和假设,参与讨论,评价学生概括的概念概括概念,讨论互评 应用概念,巩固理解呈现例子、操练工具选择例子,评价效果判断,举例 反思概念化过程交流讨论工具提问引发讨论反思,讨论 这种教学模式适合于讲授那些具有明确属性的概念,如有(无)理数、方程、等式等,也可以用于教授代数运算法则,如合并多项式、合并同类项等,对信息技术的要求不高,有大屏幕投影设备和一台计算机的教室基本满足教学条件(讨论口头进行,分类、提出假设可用纸代替),但是在教学前,教师必须选择准备好肯定性和否定性例子以及一些复杂的、似是而非的例子。教学的效果可以用判断、举例的方法来评价学生是否已理解、获得了该概念。 4.2规律的应用——探究教学模式 学习规律的目的是为了应用规律,此模式的目标是使学生通过应用概念和规律加深对概念和规律的理解,培养数学方法的应用能力和实际问题的解决能力,包括六个阶段。 (1)情景导入,明确问题 利用多媒体计算机创设现实问题情景,激发学生解决问题的兴趣,明确要解决的问题。 (2)分析问题,明确应用的概念或规律 让学生思考分析问题,提取问题中的已知条件、未知条件和要求的结果,引导学生讨论解决该问题需要用到的数学概念和规律,确定解决问题的概念和规律。 (3)分组讨论,提出假设 先将学生分成若干个小组,以小组为单位猜想、讨论解决问题的可能方案。这个阶段要鼓励学生多思考、多猜想,而不要求计算、证明,但是要给学生一定的时间限制,时间的长短则根据问题的难易程度而设定。 (4)共享方案,评价筛选 当学生已提出足够多的方案时,让小组成员汇报小组提出的方案。教师收集、汇总学生的方案,并把全部方案展示给全体学生,选出其中不同的方案后,让学生用逻辑推理的方法淘汰不可能的方案,进一步筛选出可能方案。 (5)计算证明,验证假设 让学生对剩下来的可能方案用严密的计算和证明的方法来验证其有效性。如果学生的信息能力较强,也可以要求学生用信息技术来表征最后的方案。 (6)汇报总结,反思 学生汇报验证的结果,总结问题的解决方案。如果方案比较复杂,教师可以用多媒体计算机来演示该方案解决问题的过程。最后要求反思解决问题的过程,讨论问题解决过程中所用的数学方法。 模式中信息技术的作用以及教师与学生的可能见表2。 表2规律的应用——探究教学模式中信息技术的作用和师生活动 模式程序信息技术的作用(理想状态)教师活动学生活动 情景导入,明确问题情景创设、问题呈现工具创设情景建立心理倾向,明确问题 分析问题,明确应用的概念或规律交流讨论工具引导,总结讨论,分析,确定应用的概念或规律 分组讨论,提出假设交流讨论、表征假设工具分组,设定讨论时间,鼓励学生,关注小组内所有成员的发言情况讨论,提出假设

共享方案,评价筛选展示方案、交流讨论工具收集、呈现方案,参与学生讨论汇报,讨论评价 计算证明,验证假设计算工具,实验环境,交流讨论工具提供工具,工具使用方法指导,提供帮助计算、证明,交流讨论 汇报总结,反思表征方案、交流讨论工具评价,总结,引发反思汇报,讨论总结,反思 此模式适用于与生活有关的计算公式、规则的复杂应用教学,如相遇问题、解方程问题等,对信息技术的理想要求是具有多媒体投影设备、网络环境、计算器、几何画板等数学探索工具等,要求教师和学生熟练使用Word、计算机、几何画板、网络交流讨论工具等。如果不具备网络教学环境,则学生的交流讨论可以口头进行。教学效果可以用解决类似问题来进行评价。 4.3几何概念、规律的“数学实验”教学模式 运用几何画板的“几何概念、定理的数学实验教学模式”的目标是通过“做”的教学,让学生正确理解几何中的概念、规律,了解概念、规律的形成原理,培养发现问题、转换问题的能力,培养用数学模型来解决问题的能力。该模式的步骤为: (1)情景导入,明确目的 情景导入的目的是激发学生探究的兴趣,明确数学实验的重点(要学习的概念/规律),如用与教学内容相关的例子引入课题,如用飞机或飞机模型引入角平分线教学、用飞翔的蝴蝶引入轴对称概念的教学、演示离心率变化引起曲线变化的动画引入离心率概念的教学等。 (2)做“数学实验”,自主探索 学生明确了本课的目的后,让学生用几何画板做数学实验,利用教师编好的课件独立探索,发现数学概念包含的本质特征、规律形成的原理。如果学生能熟练使用几何画板,也可以让学生自己制作简单的课件。 (3)讨论总结,形成概念/提出规律 学生将探索获得的概念属性或规律与学习伙伴进行讨论,在教师的帮助、引导下提出正确的概念或规律。 (4)概念/规律应用 将所获得的概念或规律应用于解决一些问题,可以是进行一些练习,也可以是解决一些实际问题,如用轴对称概念解决“在河边建一个水电站,使之到两个供水站的距离之和最短”等。此时还可能用几何画板进行数学实验。 (5)反思 用提问的方法引起学生回忆、反思自己的学习过程,讨论如何获得概念、发现规律的,在应用规律的时候是如何应用规律的,用“数学实验”进行学习对自己解决问题有什么启示等。 表3说明了信息技术在此模式中的作用以及模式程序中教师和学生的活动。 表3几何概念、规律的数学实验教学模式中信息技术的作用与师生活动 模式程序信息技术的作用(理想状态)教师活动学生活动 情景导入,明确目的情景创设工具创设情景建立心理倾向,明确学习目的 做“数学实验”,自主探索实验环境,表征概念或规律工具提供工具,监控、帮助、引导做数学实验,探索,记录探索的心得 讨论总结,形成概念/提出规律交流讨论、表征概念或规律工具总结,评价讨论,提出概念,互评 概念/规律应用呈现问题工具,练习工具,实验环境提出问题,提供工具,监控、引导、帮助练习,做“实验” 反思交流讨论工具引发思考,参与讨论讨论,总结 这种模式适用于抽象的几何概念、几何定理、复杂概念的研究和利用几何知识解决问题教学,如轴对称概念、多边形的内角之和、离心率概念、复杂曲线的形成、空间几何等,也可以用于物理、化学的教学中。要求师生都熟练使用几何画板和Word、记事本等记录工具,可用需要转换的复杂问题来评价教学效果。 4.4基于Internet的数学计算应用——合作探索教学模式 现代数学教学强调数学与现实生活的联系,要求数学教学要从身边的生活问题出发、用于解决生活中的实际问题,Internet提供的丰富资源又为此提供了更广阔的空间。“基于Internet的数学计算应用——合作探索教学模式”就是为实现使学生将学到的数学计算知识用于解决生活问题、从而培养其联系实际、解决问题能力的目标而设计的,其步聚包括七个环节: (1)情景导入,提出问题 情景创设的目的是激发学生探索、解决问题的兴趣,创设的情景要与学生的日常生活密切相关,而且要利用视频、音频、图片等多媒体信息来呈现问题,如深圳南山实验学校的易伟湘老师用悉尼奥运会的资料、用图片展示活动城市的情况[17]来调动学生的积极性取得了比较好的效果。 (2)分析问题,明确方向 要求学生分析解决问题需要确定哪些条件,这些条件与哪些数学知识有关系,最后确定解决问题涉及的数学概念,复习概念间的数量关系。 (3)小组学习,查找信息 教师按照学生的兴趣或位置关系将学生分成若干小组,确定每个小组成员都有相应的任务后,提供给学生信息记录表、相关的资源、网址或搜索引擎,传授学生使用这些资源的方法,让学生开始查信息。要求每个学生都独立自主地查找信息,他们所查找的信息都是为了解决共同的任务,是小组任务的一部分,培养他们协作的意识。这一阶段要给学生足够的时间和资源,使他们能进行充分的探索,学生还要及时记录所找到的信息。 (4)交流协作,解难释疑 当小组成员找到所需的信息后,让他们回到小组中,交流他们所查的信息以及为什么选择这些的理由,讨论其中分歧的意见以达成共识。对于一些学生容易忽视的因素,教师要及时引导。 (5)计算数据,问题解决 学生计算经过讨论的数据,比较、分析计算结果,讨论、选择恰当的解决方案。这里学生提出的解决方案可能不是惟一的,教师要鼓励学生多角度考虑解决方案,以培养他们的发散思维。 (6)成果汇报,讨论评价 学生在小组交流达成共识后,由小组成员向全班同学汇报学习的结果以及提出方案的理由,教师和其他组的学生可以就他们的方案提出适当的建议。 (7)反思 要求学生回忆探索、协作的过程,反思如何从问题中提取数学知识、怎样才能找到需要的信息、如何选择有用信息、解决该问题用了哪些数量关系、与小组成员协作是否愉快、学习伙伴有哪些值得自己学习的地方、打算以后怎么用这些数学知识和学习方法等等。 模式中信息技术的作用及教师与学生的活动如表4所示。 表4基于Internet的数学计算应用——合作探索教学模式中信息技术的作用及师生活动 模式程序信息技术的作用(理想状态)教师活动学生活动 情景导入,提出问题情景创设工具创设情景,阐明目的明确目的,建立心理倾向 分析问题,明确方向讨论工具,展示数量关系工具帮助学生提取、复习数学概念、数量关系分析、讨论,提出、复习数量关系 小组学习,查找信息信息探索、记录工具提供记录表、资源和工具,监控、帮助查找、记录数据 交流协作,解难释疑交流工具监控、引导,启发讨论,选择有用信息 计算数据,问题解决计算工具、表征方案工具提供工具,监控、引导计算、讨论,提出方案 成果汇报,讨论评价展示成果工具,讨论工具参与讨论,提出建议汇报,讨论、互评 反思讨论工具引发思考,参与讨论反思,讨论 这种模式适用于一些与日常生活有关的计算知识的教学,如行程问题、利息问题等。运用此模式进行教学的前提是具备并师生熟练使用Internet教学环境、Excel等电子表格工具、Word等文字处理工具软件。教学效果的评价可延续到课后进行,可让学生写学习体会、学生互评协作意识与协作能力。 4.5基于Internet的综合性应用问题的合作研究学习模式 这是一种多学科、多纬度的综合性教学模式,将知识、计算、规律的学习与解决实际问题等目标综合在一起。应用这种模式的教学一般不能在一节课中完成,根据项目的难易程度确定所需的时间。此模式的实施分为八个阶段: (1)设置问题情境,提出问题 问题可以由教师口头提出或用展示某一事件引出,也可以由学生自己提出。问题的情景应该是真实的,能够引起学生探索的热情。 (2)分析问题,明确评价方法 要求学生分析问题情景中所隐含的数学知识,列出已掌握和未掌握数学概念的清单。教师向学生说明研究的成果形式以及评价的方法。 (3)组织小组,确定研究计划 教师按照一定的分组策略将学生分成若干个小组,或者由学生自行分组,小组人数以4-5人为佳。小组成员一起讨论研究的方法、进度以及小组成员的分工,制定研究计划表和数据记录表。 (4)自主探索,学习概念,查找信息 每个小组成员根据自己的任务分工,学习自己未掌握的数学知识,并开始收集与解决问题相关的信息。学生通过学习新的数学知识、查找所需的信息,逐步建构起关于该领域知识结构原形,并形成自主思维的能力与习惯。教师帮助学生判断所查信息的有效性。 (5)交流协作,完成数据表 学生搜索到所需的信息后,回到小组,与其他小组成员一起交流所找到的信息以及该领域的相关知识以及自己关于解决问题的见解,并用查到的信息完成数据表。如果交流发现有不恰当的数据或数据不充分,则需要重新查找数据。 (6)计算数据,提出假设 将所查的数据进行必要的单位转换、中间计算,计算出最终数据,形成各种可能的解决方案。 (7)讨论假设,问题解决 对提出的可能解决方案进行组内讨论,决定最佳解决方案。 (8)汇报,评价,反思 由小组成员向全体同学作出口头汇报,如果可能还需提交书面报告。教师和其他小组根据评价的方法对他们的研究进行评价。要求学生对研究的过程进行反思,思考自己又学到哪些新的知识、是怎么解决这个问题的、自己在小组中的贡献有多大等等。 在这个模式中,信息技术的作用以及教师和学生的可能活动见表5。 表5基于Internet的综合性应用问题的合作研究学习模式中信息技术的作用及师生活动 模式程序信息技术的作用(理想状态)教师活动学生活动 设置问题情境,提出问题情景创设工具创设情景,提出问题明确问题 分析问题,明确评价方法讨论工具,展示成果形式和评价方法的工具帮助引导,说明成果形式和评价方法分析问题,提取数学知识,了解成果形式和评价方法 组织小组,确定研究计划制定研究计划和数据电子表工具确定分组,提供工具和工具使用帮助分工,制定计划表和数据表 自主探索,学习概念,查找信息资源、查找工具,探索工具提供资源,监控、引导学习概念,查找信息 交流协作,完成数据表讨论工具,数据记录工具监控、帮助、引导讨论,输入数据 计算数据,提出假设计算工具,方案表征工具监控、帮助、引导计算数据,记录结果 讨论假设,问题解决讨论工具监控、帮助、引导讨论,提出方案,准备口头汇报,撰写研究报告 汇报,评价,反思汇报撰写工具、讨论工具总结、评价,引发思考口头汇报、互评,反思 此模式适用于研究一些用数学知识解决社会性问题,如分期付款问题、投资回报问题、彩票问题等等,模式的运用要求在Internet教学环境中,师生熟练使用浏览器、搜索引擎、Excel等表格工具、Word等文字处理工具、PowerPoint等演示工具,学生具备一定的协作技巧和进行口头、书面汇报的能力。教学效果的评价可以从问题解决、汇报、协作等方面进行。 以上是我们在这个领域所作的一点探索,所提的模式并不能包含所有内容的教学,还有许多内容的模式尚待研究,相信随着信息技术与数学教学整合研究的深入,这些模式会得到不断的修正、完善,更多的模式也会出现。 参考文献 [1]北京师范大学现代教育技术研究所.深圳市南山实验学校.信息技术与课程整优秀案例论文集.高等教育出版社,2001.11. [2]冯克诚,田晓娜.最新教学模式全书(上卷).国际文化出版公司,1997.8. [3]高文主编.现代教学的模式化研究.山东教育出版社,2000. [4]何克抗,李克东主编.信息技术与语文教学改革全国经验交流会论文集.全国学科“四结合”总课题(内部资料).1997-2001./www.etc.edu.cn/articledigest10/net-instruction.htm. [6]李克东.数字化学习——信息技术与课程整合的核心.电化教育研究.2001.(8).(9)./www.etc.edu.cn/academist/ysq/infor-tech-sub.htm. [8][美]贝尔.中学数学的教与学.许振声等译.北京:教育科学出版社,1990.8./www.cbe21.com/subject/maths/jxck.php. [10]向玉琴,刘英健.美国小学数学教学的基本特征.山东教育.1998.(3). [11]张武升.关于教学模式的探讨.教育研究.1988.(5). [12]祝智庭主编.现代教育技术——走进信息化教育.高等教育出版社,2000.9. [13]BruceJoyce,MarshaWeil&EmilyCalhoun,ModelsofTeaching,Allyn&Bacon,1999./www.techknowlogia.org.

推荐期刊