线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

研究生计算机论文8篇

时间:2023-03-29 09:19:57

研究生计算机论文

研究生计算机论文篇1

关键词:计算;计算学科;计算机科学思维;计算思维;计算机思维

随着计算机科学技术的发展,计算领域已成为一个极其活跃的领域,计算学科也成为一门范围极为宽广的学科[1]。在此发展过程中产生的种种现象,在很大程度上改变了人们对世界的认识,有力地刺激了人文科学的发展,人们对认知科学的研究就是“以电子计算机的产生发展为物质、技术基础,以计算机与人脑相类比为前提的[2]”。我国著名科学家钱学森院士从近三十年电子计算机发展引起的新技术革命,两千多年逻辑学发展的经验教训,作为符号处理系统的计算机在智能方面存在的严重缺陷,尤其是人们在高级抽象思维领域,如辩证思维、形象思维、创造性思维尚缺乏研究等方面,对认知科学的发展进行了科学的分析。同时结合我国科学技术发展的现状和特点,提出了“思维学”的理念,给出了“思维科学”的研究框架、研究方向与基本道路,并在随后的一系列工作中进一步充实和完善了思维科学的理论与思想体系[3]。他指出:“现代科学技术的实践,正预示着更重大的变革――思维科学的出现。”“引出这项变革的是电子计算机”。而“推动思维科学研究的是计算机技术革命的需要[4]”。在钱学森的倡导下,自上世纪80年代起,面向新技术革命的思维科学研究愈来愈受到国内有关专家学者的关注与重视。

在计算机科学与技术领域,随着美国计算机学会(简称ACM)和美国电气和电子工程师学会计算机分会(简称IEEE-CS)组成的联合攻关组于1988年底提交了“作为学科的计算科学”的报告[5],计算学科的“存在性”得以证明。随后,CC1991报告和CC2001报告等相继出台,从学科的角度诠释了计算科学的内涵与外延,为计算学科建立了现代课程体系。在计算学科课程体系的本土化进程中,我国相关领域的专家学者们付出了艰辛努力,并取得实质性成果,于2002年提出了“中国计算机科学与技术学科教程2002”(China Computing Curricula 2002,简称CCC2002)[6]。在CC2002教程的引导下,针对计算机科学与技术学科教育方面的诸多问题,国内从事计算机科学与技术学科教育的广大工作者进行了广泛而有益的探讨[7-10],大大丰富了计算学科课程体系建设的内容。在计算学科课程教育改革的进程中,如何培养既能熟练掌握计算机科学的知识与技能,又具有计算机科学学科意识和素养的人才问题,逐步成为人们关注的主要方面。

基金项目:本文受江苏省教育厅指导性计划项目“计算机思想史研究”(03KJD520028)及江苏科技大学高教项目“计算思维与创新教育”(GJKTY2009025)资助。

作者简介:张晓如(1963-),女,教授,学士,研究方向为计算机应用教育、数据库;张再跃(1961-),男,教授,博士,研究方向为可计算性理论与知识工程。

一个人的实践与创新能力与思维方式密切相关,与其他学科领域的科学家和工程技术人员等相比,计算机学科的专家学者们在思考问题、分析问题和解决问题方面也应有其独特的地方。正如计算大师Dijkstra所言:“我们所使用的工具影响着我们的思维方式和思维习惯,从而也将深刻地影响我们的思维能力[11]。”因此,当计算机与人们的生活联系越来越趋密切的形势下,研究与之相关的人类思维活动与思维方式便成为现代思维学科领域中一个十分重要的课题。我们不妨称此种思维为面向计算学科的思维。显然,面向计算学科的思维除了具有一般思维的特点外,还具有其自身的特性,而后者则是从事计算机科学研究的人员和计算机教育工作者们更为关心的。究竟什么是面向计算科学的思维?它的特点是什么?对面向计算学科的思维研究对计算学科的发展会产生哪些积极作用?这种思维能力是可以培养的吗?又如何培养呢?我们现行的计算机课程教学内容结构会因此而有所改变吗?

1面向计算学科的思维

国内最早面向计算学科思维的研究文章是收集在2000年全国高等师范院校计算机教育研究会年会论文集上笔者的《谈谈计算机思维》[12]一文。当时的“计算机思维”意为“计算机科学思维”(Computer Science Thinking),在随后关于面向计算科学的思维研究中,相继出现了“计算思维”(Computational Thinking)[13-14]与广义“计算机思维”(Computing Thinking)[21]等概念。这些概念虽然与“计算机”有关,但它们有一个共同特点,即它们都是关于人的思维。

1.1计算思维与计算机思维

“计算思维”的思考和研究在国内受到更多专家学者的关注与重视,要归功于全国高等学校计算机教育研究会于2008年10月31日至11月2日在桂林召开的一次专题学术研讨会,会议的主题是“探讨在教学过程中,如何以课程为载体讲授面向学科的思维方法,共同促进国家科学与教育事业的进步”。会议从8各方面征集论文,无不涉及“计算思维”。在会议提供的资料中,美国卡内基・梅隆大学计算机科学系主任周以真(Jeannette M.Wing)教授2006年3月发表在美国计算机权威杂志ACM会刊上的文章《计算思维》(Computational Thinking)[13-14]和王飞跃2007年3月发表在中国计算机学会通讯的文章《从计算思维到计算文化》[11]位居榜首。其中,王飞跃教授从计算机文化发展的高度对“计算思维”概念的提出和“计算思维”的研究与发展对计算科学的进步产生的深远影响给出了充分肯定。王飞跃教授在提及国内对“计算思维”研究和计算文化与计算思维联系方面的状况时指出,“在中文里,计算思维不是一个新名词,常被朦朦胧胧地使用,却一直没有被提到周教授所描述的高度广度,那样的新颖、明确、系统”。这一陈述虽然有一定的道理,但不完全正确。“计算思维”从命名的角度可以如是说,但就其作为面向计算机科学思维的概念与特征而言,无论从高度讲,还是从广度说,周以真教授的描述确有“新颖”之处,但在“明确”和“系统”方面,同本文作者在上世纪90年代末就提出的“计算机思维”的概念在主要方面是基本一致的,并可形成互补。特别指出的是,《谈谈计算机思维》在谈到计算机文化与计算机思维相互之间的联系时指出,“随着计算机科学的发展,‘计算机’已不再是一个单纯的计算工具的代名词,而是信息时代高新技术的象征。可以这样说,‘计算机’作为一种文化,已渗透到社会发展的各个领域,而使得生活在这一时期的人们的思维活动中或多或少地与‘计算机’这一概念相联系,研究与之相关的思维活动与思维方式,便成为现代思维科学领域中一个十分重要的课题[12]”。在此,我们可以把有关“计算思维”特征的陈述同有关“计算机思维”的陈述作一比较。

周以真教授在对计算思维的描述中首先指出,“计算思维是每个人的基本技能,不仅仅属于计算机科学家”,这一观点与《谈谈计算机思维》一文中提出的“计算机思维具有广泛性。计算机思维已不仅仅是计算机科学家所应具有的思维,而应是全民族所必须的”的观点是完全一致的。并且文中还强调,“只有这样,计算机科学的发展才能具有广泛的社会基础,才能使计算机科学真正服务于社会”。在总结计算思维的特征时,周以真教授从6个方面,以“是”与“不是”的对立统一作了阐述。

为了更好地挖掘计算机思维的内涵,更加清楚地了解与把握计算机思维与其他学科思维方式的联系与区别,我们对计算科学发展的过程进行了初步考察,提出了“计算科学思想史”研究的基本思想,并对计算科学思想史研究的特点、研究内容、研究方法进行了分析探讨[16]。同时结合现代计算机课程教育,提出了基于知识背景的计算机课程教学改革的基本构想[19]。我们深信,无论是对计算机思维的研究,还是对计算科学思想史的研究,都会对计算机教育的实践与发展产生重要影响。

2 “计算思维”研究现状

无论叫计算思维,还是称计算机思维,关键是要解决问题,即“如何让人们学会像计算机科学家一样去思考”。从总体看,计算思维的研究应包含计算思维研究的内涵和计算思维推广与应用的外延两个方面。周以真在给出“计算思维”概念后,进一步探讨了计算思维的本质,并指出计算思维将在各种行为方面影响每个人,这一点对我们的社会教育提出挑战,特别是少儿教育。在关于计算的思考中,我们需要理解不同类型的3个方面:科学、技术与社会。飞速发展的技术进步和巨大的社会需求迫使我们重新思考计算科学最基本的问题[20]。从周以真教授多次关于计算思维的论述中可以看出,其“计算思维”的概念是面向社会、面向教育和面向大众的。这也许是一种策略,为了能让更多的人关注并思考“计算思维”的问题,并将思考的结果应用于计算科学实践,以此促进计算科学的普及和发展。在对“计算思维”的深入研究过程中,郭喜凤教授等从工程化的角度对“计算思维”的内涵进行剖析[20],以周以真面向大众的计算思维为基础,根据计算机科学与技术中的理论、技术、工程、工具、服务和应用等几个不同层面的思维特点,阐述了计算思维的工程化思想,将计算思维的概念加以推广并提出了计算机思维(Computing Thinking)工程化的层次结构,丰富了计算思维的研究内涵。董荣胜和古天龙教授从计算机科学与技术方法论的角度对计算思维研究的外延进行分析。“计算机科学与技术方法论是对计算领域认识和实践过程中一般方法及其性质、特点、内在联系和变化发展进行系统研究的学问。计算机科学与技术方法论是认知计算学科的方法和工具,也是计算学科认知领域的理论体系[21]”。在关于计算思维和计算机科学与技术方法论之间关系的论述中,董荣胜和古天龙教授在周以真教授工作的基础上,对计算思维的特征进一步加以阐述,从抽象与自动化两个方面,以具体的实例刻画了计算思维的本质,并介绍了国外关于计算思维研究的进展情况。在谈到计算思维与计算机方法论关系时,他们指出,“尽管计算思维与计算机方法论有着各自的研究内容与特色,但是,显而易见,它们的互补性很强,可以相互促进”。“计算机方法论可以对计算思维研究方面取得的成果进行再研究和吸收,最终丰富计算机方法论的内容;反过来,计算思维能力的培养也可以通过计算机方法论的学习得到更大的提高[22]”。这不是一个一般概念的问题,我们认为是计算思维研究的一个技术路线问题,只有把计算思维的研究同计算机科学与技术方法论有机地结合起来,计算思维才具有实际的意义和价值,计算机科学与技术的方法才能够获得进步。

3 “计算思维”研究内容

不管是周教授的计算思维(Computational Thinking),或是郭教授的计算机思维(Computing Thinking),还是计算机科学思维(Computer Science Thinking),它们都有一个共同面向,即都是面向计算学科的思维;都有一个共同的出发点,即研究和探索面向计算学科的思维规律;都有一个共同的目标,即引导人们在解决有关计算学科及其应用领域问题时,能够运用正确的思维方法。计算学科是关于“计算”的学问,因此,计算思维的研究势必围绕解决所谓“计算问题”而展开。

3.1计算思维研究的基本问题

何谓计算思维?《谈谈计算机思维》一文对计算机思维的内容进行了概括,即人们有意识地将计算机用于生产、生活等各个领域的认识活动以及人们解决计算机问题的认识过程。一方面,它是指一种形式,这种形式表现为人们认识具体的计算机科学,或是应用计算机科学于其他科学、技术的过程中的辩证思维;另一方面,它是由计算机科学本身的特点及计算机作为认识世界的工具所决定的,它同样受到一般思维方式的限制[12]。周教授则将计算思维归纳为运用计算机科学的基础概念进行问题求解、系统设计、以及人类行为理解等涵盖计算机科学之广度的一系列思维活动[13]。董教授等则从方法论的角度将计算思维定义为运用计算机科学的思想与方法进行问题求解、系统设计,以及人类行为理解等涵盖计算机科学之广度的一系列思维活动[22]。

研究生计算机论文篇2

关键词:计算机网络;教学改革;实践训练;创新

文章编号:1672-5913(2013)14-0050-04 中图分类号:G642

计算机网络是一个发展迅速的学科,主流的网络技术在不断更新换代,因此计算机网络课程的教学设计也必须随之不断进行改革创新,以便与技术的发展相适应。理工大学计算机网络相关课程是谢希仁教授于1983年首次为硕士研究生开设的,1995年以后,通过对该课程进行改革,将计算机网络的基础原理部分放到本科生教学中,称为计算机网络原理课程,而硕士研究生的教学则定位于该课程的高端部分,称为高级计算机网络课程。

在教学内容的设置上,本科教学主要关注如何帮助学生建立计算机网络知识体系结构的概念,更加强调知识的完整性和系统性,所以我们采取了国际上通用的分层教学模式。经过本科阶段对网络知识的初步学习,大多数研究生已经掌握了计算机网络的基本概念,教学过程中应当重点讲述相关的技术原理,侧重培养研究生的科研创新能力。基于这一指导思想,我们构建了网络高级技术专题、网络基本设计原则、网络实践教学和论文阅读研讨写作的研究生高级计算机网络教学设计,将研究能力培养前置到课程学习阶段,构建科学研究基础上的研究生高级计算机网络课程教学新模式,使学生真正理解和掌握理论知识,提高动手能力,进而适应计算机网络技术的飞速发展和创新型人才培养的需求。

1 教学内容组织

当前国内外知名高校的研究生计算机网络课程一般分两类:一类是作为核心课程,按照传统的分层体系结构组织,但讲授过程中在内容的深度和广度上比本科的计算机网络课程有很大提高;另一类是作为选修课程,主要设置一系列的前沿技术专题讲座,由从事相关研究的工作人员组织论文讨论。

上述两种授课模式各有优缺点,按照分层体系结构组织的讲授模式能够帮助研究生更加系统地把握计算机网络的体系结构及核心问题,但由于大多数研究生本科阶段已经按照该模式学习过计算机网络课程,因此难以吸引学生的学习兴趣,并且按照分层模式系统地讲授一遍课程内容在课时安排上也难以保障。按照前沿技术组织专题讲座能够帮助研究生迅速把握本专业的热门研究方向和研究问题,但该方法存在的最大问题在于课程内容的组织缺乏系统性,难以帮助学生把握课程的核心知识点。并且,计算机网络相关的新技术大多为英文文章,对于刚入学的硕士生而言,多数人并不具备短时间内阅读大量英文文章的能力,因此盲目按照前沿技术方式开展课程教学会导致教学效果大打折扣。

目前,国内也出现了多个围绕研究生计算机网络教学开展的改革创新,它们大多与所在学校的教学特点密切相关。我们在借鉴国外著名大学研究生计算机网络课程设置的基础上,结合理工大学研究生的具体特点和培养要求,设计了以提高研究生创新能力为中心的课程教学内容,将教学过程划分为理论教学和实践教学两大部分。其中理论教学包括计算机网络基础概述、网络高级专题和网络设计原则等内容;实践教学则包括课程实验和自主设计性实验两部分,并在教学过程中穿插着进行课堂及论文研讨,从而注重培养研究生对计算机网络核心知识、核心原则和前沿研究的了解与掌握,锻炼其利用所学知识动手解决问题的能力。

1.1 理论教学

高级计算机网络理论教学的主要目标是帮助研究生完善计算机网络体系结构的概念、掌握计算机网络的关键问题、了解计算机网络的最新研究方向和技术。通过调研发现大部分学生希望授课教师能够尽量避免相关教学活动与本科先修课程的重复,以便开拓新领域、学习新方法。结合理工大学研究生的培养要求,我们设置了理论教学内容,见表1。

在课程设置中,首先较系统地综述计算机网络的重要概念、基本原理和研究方法,以便帮助研究生陕速回顾建立计算机网络体系结构的概念。由于当前跨专业、跨学科报考研究生的现象十分普遍,导致学生的专业基础差异性明显,这部分内容的教学也能帮助这些学生尽可能弥补专业知识上的差异,使后续高级专题的教学更加易于开展。

随后,围绕应用层网络技术、多媒体网络、网络管理与测量等计算机网络的高级专题开展教学,重点讲授这些专题中涉及的关键问题、核心思想以及核心技术等,帮助研究生提升对计算机网络知识的理解掌握水平。这些专题的选择主要考虑到将计算机网络的基础知识与前沿研究进行有机结合,一方面突出当前的一些前沿研究领域,另一方面也强调其中涉及的网络基础知识和原则。

再次,为了进一步提升研究生对计算机网络当前研究热点的了解和把握,专门设计了一章网络新技术专题,重点介绍数据中心网络、软件定义网络、未来网络体系结构等当前的研究热点。为了体现教学思想,避免陷入研究怪圈,我们在讲授过程中主要向学生阐述这些技术产生的背景及解决的问题,并在教学过程中启发学生思考这些网络新技术带来的优势是什么?同时又引出了哪些问题?有没有办法对其进行进一步的优化等。这样将学习过程变成一个思考创造的过程,从而帮助研究生提升科研创新能力。

最后,在网络设计原则部分,总结回顾计算机网络中采用的一些典型设计理念和原则,包括软状态机制、随机化技术、间接技术、虚拟化技术等,通过介绍这些技术的基本概念及应用场景,让学生深入理解并体会技术本身的价值,为以后的研究应用奠定基础。

1.2 实践教学

长期以来,研究生课程的教学存在“重理论、轻实践”的问题,对于如何将教学内容应用到实际的研究工作中关注的不够,这一现状与国家重点倡导的应用型研究生培养目标越来越不符合。对于具有强烈工程应用背景的计算机网络课程而言,如何建立实践教学模式,提高实践教学效果在整个课程教学过程中具有至关重要的影响。

为此,在教学过程中设计了两类实践教学内容,一部分与课堂理论教学相配套,帮助学生更好地理解掌握理论教学内容,如应用层网络技术专题中设置针对P2P数据传输协议进行仿真分析的实验内容,在多媒体网络专题中设置多媒体视频传输实验内容,在网络管理与测量专题中设置大规模网络测量数据综合分析的实验内容等。这些实验内容与理论教学内容密切结合,可以作为理论教学的有益补充。

此外,我们还设置了针对整个课程的自主性综合实验,又称课程设计,其选题相对具有开放性,内容涉及计算机网络的各个层次和技术。一方面列出部分课题供学生选择,如基于OPNET/NS2的网络路由算法性能仿真分析、简单包过滤防火墙的设计与实现、基于NetFlow的网络流量采集与分析系统、基于SNMP的简单网络管理系统等;另一方面也鼓励研究生与导师进行交流,将导师正在进行的重大课题研究内容抽取一部分作为自主性综合实验的内容,达到课程教学与科研活动有机的结合。

为充分发挥学生的创造性和主观能动性,自主性综合实验包括基本要求和扩展功能两个部分,课程只给出基本要求作为必须要达到的目标,学生可以在此基础上发挥自己的创造力进行扩展,实现更多的功能。在自主性综合实验的验收和考核工作中,以课题实现的创新程度和反映出的研究生进行研究探索的工作量,作为自主性综合实验的考核重点。

1.3 课堂研讨

为了避免授课内容过于偏重基础,对国内外学术界新兴领域和新兴技术关注不够等问题,综合锻炼研究生通过阅读文献跟踪前沿研究的能力,以及通过文献阅读报告开展学术交流的能力,我们在教学过程中还相应设置了课堂研讨环节,主要包括论文研讨和课程设计研讨两部分内容。其中论文研讨环节首先选取计算机网络研究领域的经典文献和前沿性研究文献开展文献阅读,然后让研究生上台就所阅读的文献开展报告,其他学生则针对该报告进行相应的质疑,通过讨论促使研究生从多个角度审视问题,促使创新思维火花的进发、碰撞。进一步要求研究生在课堂研讨的基础上,分组选择一个感兴趣的网络问题,阅读5篇以上著名会议或者期刊的相关文献,并完成读书报告,从而综合锻炼他们语言表达交流和论文撰写的能力,激发其创新精神,提高“学以致用”的实践能力。

课程设计的研讨与论文交流研讨的过程类似,在完成课题的详细设计方案后开展一次研讨交流,每名研究生根据所做课题进行发言交流,其他学生则针对该课题的内涵、设计方案的可行性、存在的不足等问题进行交流,达到综合受益的目标。

2 考核机制设计

以往的研究生计算机网络课程考核评价机制一般采用平时成绩加考试成绩的方式,且期末考试成绩在评价中所占比重过大。然而,评价研究生学习成绩的优劣,应该从理论学习水平、实践动手能力、个体综合素质及创新能力等多个方面展开,从平时作业、课堂研讨发言、平时实验与自主设计性实验、课程论文报告及理论考核等方面对学习情况进行综合评测。用考核机制引导研究生改变传统学习方式,加强对教学全过程的管理,对学习的每个重要过程都进行量化计分,以衡量研究生的综合能力素质,激励他们全面发展。根据这一目标,我们设计了课程评价指标体系,见表2。

在这种评价指标体系中,既包括平时的课堂作业、研讨发言、课程实验,又包括设计性实验、课程读书报告以及期末考试等,实现了对整个授课阶段的全过程管理,综合考查了研究生的理论知识掌握、文献阅读报告、论文撰写、实践动手等多方面的综合能力,因此具有更好的合理性。

3 教学效果

利用设计的高级计算机网络课程教学改革模式,我们在近几年的教学实践中取得了很好的教学效果。高级计算机网络课程先后被学校评为校级教改示范课程和研究生精品课程,并得到了选课研究生的一致好评。调研过程中专家和研究生普遍反映,这一课程的教学体系结构比以往的方式更加注重对知识本质和科学方法的揭示,注重对研究生学术质疑和独立思考能力的培养,使研究生通过课程学习,达到学习新知识、提升分析解决问题的能力和增强实践能力的综合效果。大部分研究生对于课程教学改革在启发式教学、实践教学、课堂研讨等方面印象深刻,最后达到了预期的教学效果。然而在教学实施过程中也反映出一些问题,如部分学生基础知识相对薄弱,在实践教学及课堂研讨过程中与其他学生存在较大差距;自主性综合实验的设置需要准确把握问题的难易程度,内容太简单学生不会有太大的兴趣,内容太难学生又会觉得无从下手等。这些问题需要在教学过程中不断进行优化调整。

4 结语

高级计算机网络作为国际上计算机网络与通信领域通行的研究生核心课程,对该领域的科学研究与工程技术工作者至关重要。为了提高课程教学效果,我们对课程进行了一系列的改革,包括理论教学内容的优化设置、实践教学的组织、课堂探讨机制的构建以及考核机制的设计等。通过这些改革,建立了一套完善的研究生高级计算机网络课程的理论和实践教学体系,构建了网络高级技术专题、网络基本设计原则、网络实践教学和论文阅读研讨写作的研究生高级计算机网络教学模式,实现了基础理论和前沿研究并重、理论教学和实践训练并行,使学生真正掌握和理解理论知识,提高动手能力,这一教学实施模式在实践中取得了较好的效果。然而,计算机网络是一个迅猛发展的学科领域,新的技术和应用层出不穷,在后续的教学实践过程中,我们将关注这些新变化,并不断对课程进行相应的改革创新,达到传授知识、提升能力的教学目标。

参考文献:

[1]邢长友,陈鸣,许博,等,面向创新人才培养的计算机网络教学改革[J],计算机教育,2013(1):49-52

[2]陈鸣,谢钧,刘鹏,等,计算机网络课程中的科学思维训练[J]。中国大学教学,2013(3):62-64

[3]李巍,李云春,夏春和,研究生计算机网络课程体系研究与实践[J],计算机教育,2009(19):131-133

研究生计算机论文篇3

关键词:文献计量学;机助外语教学;外语教育技术学

中图分类号:H319.3 文献标识码:A 文章编号:1001-6795(2013)02-0024-0005

20世纪科技的迅速发展极大地推动了人类社会全面进入信息化时代,以计算机和网络为核心的现代信息技术正在改变着人类的生活方式、工作方式,同时也改变了我们的学习方式。在此背景下,计算机辅助外语教学获得快速发展。从狭义角度来看,计算机辅助外语教学是一种运用计算机对要学习的材料进行辅的讲解、巩固和评估的一种语言教育和学习方法,它通常具有极强的互动性。Levy将计算机辅助外语教学定义为“对计算机在语言教育和学习中应用的探索和研究”(Levy,1997)。其对计算机辅助外语教学的定义更简洁,涵盖范围更广,与现代大多数該领域的研究者和实践者观点一致。计算机辅助外语教学可追溯到20世纪60年代。美国伊利诺伊大学1960年启动的“柏拉图项目”(PLATO project)是其早期发展的重要里程碑(Marry,1981)。一般来说,它的发展大致经历了行为主义阶段、交际教学阶段和整合教学阶段等三个阶段。也有研究者将计算机辅助外语教学按照学习资料的呈现方式将其分为传统阶段(traditional CALL)、探索阶段(explorative CALL)、多媒体阶段(multimedia CALL)以及万维网阶段(web-based CALL)等四个阶段(Davies,2012)。

计算机辅助外语教学也引起了我国外语界的关注。1994年我国成立了全国性的计算机辅助语言教学专业委员会(CALLAC)。此后,计算机辅助外语教学无论是理论研究,还是实际应用都取得了很大进步。有关计算机辅助外语教学的研究专著和成果文献大量涌现。2002年教育部启动了大学英语教学改革。2004年出台《大学英语课程教学要求(试行)》取代了原来的《大学英语课程教学大纲》。2004年教育部正式推出了《大学英语课程教学要求》(试行)。新的大学英语课程教学要求指出,学校应充分利用现代信息技术,采用基于计算机和课堂的英语教学模式。同年,首届全国计算机辅助语言教学国际学术研讨会在北京举行。计算机辅助外语教学得到了越来越多的关注。基于此,本文尝试结合文献计量学方法,对2000—2011年间CSSCI源内所有期刊刊载的计算机辅助外语教学相关论文从年代分布、文献增长规律、期刊分布、关键词以及研究热点等进行了统计和分析,多角度揭示国内计算机辅助外语教学研究状况,探究其演化规律,系统梳理计算机辅助外语教学领域的发展脉络,为今后該领域的研究提供参考,促进计算机辅助外语教学研究的进一步发展,推动外语教育技术学科的发展。

1 数据来源和处理方法

本文依托维普期刊资源整合服务平台进行检索。以“题名或关键词”为检索项,“计算机”、“网络”、“多媒体”、“英语”和“外语”等为检索词,并将匹配设定为“精确”以提高检索准确率,时间跨度选取2000—2011共12年的数据,期刊范围选取“CSSCI”,检索条件最终合并为:题名或关键词=计算机*题名或关键词=英语*题名或关键词=外语*时间=2000-2011*范围=CSSCI来源期刊或者题名或关键词=多媒体*题名或关键词=英语*题名或关键词=外语*时间=2000-2011*范围=CSSCI来源期刊或者题名或关键词=网络*题名或关键词=英语*题名或关键词=外语*时间=2000-2011*范围=CSSCI来源期刊。检索出符合条件的相关论文共1598篇。有必要指出,将CSSCI(中文社会科学引文索引)选定为期刊选取范围是因为CSSCI是我国社会人文科学主要文献信息查询与学术评价的重要工具。因此,可以认为本文所选取的计算机辅助外语教学研究论文代表了国内該类研究的高质量研究成果。剔除会议、通知、简讯等非学术性论文以及与該领域研究不相关论文,最终获得有效研究论文1524篇。

2 文献数量分析

学术论文的发表数量是衡量某一研究领域或学科研究态势的重要指标。另外,论文的年代分布可反映若干年来研究的基本趋势、研究水平和发展速度(莫再树、贺华锋,2006)。统计结果显示,2000—2011年我国计算机辅助外语教学领域研究者在CSSCI来源期刊上共发表1524篇,年发文量从2000年的55篇上升到2011年的157篇。

为了更加直观地观察,我们另外分别绘出了2000—2011年计算机辅助外语教学研究文献数量的变化趋势图,如图1所示;以及2000—2011年计算机辅助外语教学论文增长趋势图,如图2所示。

综合图1以及图2的统计结果,可以看出:(1)2000年是国内计算机辅助外语教学研究发展的节点。2000年的发文量仅有55篇,而从2001年开始快速增长到100篇。结合有关学者统计数据,1997、1998和1999年刊登在国内八种外语类刊物上与计算机辅助英语教学相关的研究论文分别为8、10、6篇(谈言玲、严华,2007)。据此可将2000年之前的阶段认为是国内计算机辅助外语教学的起步阶段,称之为探索期。(2)2000—2011年间我国涉及计算机辅助外语教学的文献数量除2006年比2005年少刊发两篇,2011年比2010年少刊发6篇外,总体上仍处于持续增长态势。尤其是从2007开始出现显著增长。以此为基础,可将2001—2006年这一阶段称为国内计算机辅助外语教学研究的快速成长期,而2007至今的阶段称为稳定成长期。这种阶段的划分也基本符合文献计量学奠基人之一的普赖斯针对科学文献提出的科技文献增长的阶段性理论(庞景安,1999)。2007年开始发文数量之所以会出现显著增长,考虑到刊物的发文时滞因素,这可能与2004年教育部在全国180所院校推行计算机辅助英语教学改革试点工作有关,表明該项改革试点工作在一定意义上推动了我国计算机辅助外语教学的研究与实验。

3 期刊分析

论文的期刊分布可以反映期刊的时间跨度、类型分布和载文集中度,也可侧面展示期刊级别及载文质量。对CSSCI收录的计算机辅助外语教学研究来源期刊进行统计分析,其目的是为了能够向研究者揭示該领域研究成果的空间分布特点,确定刊载該方面研究论文的主要期刊,从而为該领域研究者继续深化其該方面研究提供有用的信息参考。表1和图3分别反映了国内计算机辅助外语教学领域发文的主要期刊分布情况以及这些期刊十多年来刊载該方面论文数量的变化趋势。

根据整体统计数据,刊载计算机辅助外语教学研究论文的期刊涵盖语言学、教育学、情报学、人文社科学报以及综合性社会科学等多类期刊,該领域研究论文刊载期刊主要以语言类和教育类期刊为主,分别包括《外语电化教学》、《外语界》、《外语与外语教学》、《中国电化教育》、《电化教育研究》、《现代教育技术》、《现代远距离教育》、《中国大学教学》以及《远程教育杂志》。其中《外语电化教学》以绝对优势遥遥领先,充分体现了其将现代教育技术与外语教学相整合的办刊宗旨。另外,从图3可以看出,虽然有时期刊刊载计算机辅助外语教学研究论文数量偶有回落现象,但总体折线仍呈现出上升趋势,这表明现代信息技术在外语教学中的应用日渐巩固,为外语教育技术学科的发展提供了成熟的条件。

4 关键词分布

关键词是论文不可或缺的组成部分,是表达文献主题概念的术语,它是从文章中抽取的能够最简洁、最直接反映论文主题内容的词和词组(邱均平,1988)。而关键词词频分析是一种重要的文本内容分析方法,是一种快速了解某一学科或者某一文本主要研究领域和学术热点的定性和定量相结合的方法,在科学学、图书情报学和科学计量学领域有着极为广泛的应用(姜春林、胡志刚,2010)。所以通过对关键词出现频次的统计有助于了解国内计算机辅助外语教学的热点研究板块以及预测該领域将来的发展趋势。由于直接导入的关键词比较分散,数量比较多,为了能够使关键词有针对性地反映计算机辅助外语教学领域的研究主题,本文对载入的关键词进行了适当处理:去掉“计算机辅助”、“计算机辅助外语教学”、“英语”及“外语”等词汇;合并了意义相同但表述不一样的关键词,比如,将在线、因特网、web、互联网、局域网以及校园网等关键词统一合并为“网络”。表1、表2和表3分别给出了依据本文对国内计算机辅助外语教学发展历程所划分的三个阶段中高频关键词及其频次的统计。各项统计所选取的关键词数量控制在30个以内,因此如下表格中会出现关键词数量不等的情况,以便能更简明地反映該领域研究现状及发展趋势。

表1、表2和表3显示:2000—2011年计算机辅助外语教学研究论文的高频关键词主要包括“网络”、“多媒体”、“大学英语”、“自主学习”、“视听说教学”、“写作”以及“教师”等。“网络”和“多媒体”等。在这12年间这些词一直是高频关键词,这与计算机辅助外语教学的载体密切相关。随着新世纪现代教育技术的发展,对基于网络的外语教学的研究远远领先于基于多媒体的外语教学的研究,并且原始统计数据显示,2007—2011年间还出现了基于网络的多媒体外语教学的研究。“大学英语”也一直是高频关键词,这说明计算机辅助外语教学在学科中的应用研究主要集中于大学英语学科。另外,由于大学英语课程设置的不断改革,基于现代教育技术的专门用途英语教学研究已开始出现,并且十几年来基本保持稳定的态势。不难看出“网络”、“多媒体”、“大学英语”、“自主学习”、“视听说教学”、“写作”以及“教师”等方面的研究一直是计算机辅助外语教学领域的热点研究板块,并有可能持续下去。

5 外语教育技术学的发展态势展望

5.1 外语教育技术学科构建的可能性

正如在本文前言中提到的,不管从何角度将机助外语教学分为行为主义阶段、交际教学阶段和整合教学阶段等三个阶段,还是将其分为传统阶段、探索阶段、多媒体阶段以及万维网阶段等四个阶段,其发展过程中最为明显的就是信息技术在外语教学中所起的作用越来越重要,地位也日益突出,涵盖网络及多媒体教学、语言教学(大学英语及专门用途英语等)研究、语言技能(视听说、写作、阅读与翻译等)研究、测试与评估研究以及教材研究等几大模块共计至少26项内容。在计算机辅助外语教学的研究方法方面,语料库方法在該领域研究中的运用比较突出,得到越来越多的关注。需要指出的是,语料库方法并非计算机辅助外语教学研究中的唯一方法,胡加圣等(2010)将外语教育技术的方法论概括为定性研究、定量研究和综合方法等三种,而语料库方法只是定量研究中的方法之一。另外,计算机辅助外语教学的理论基础由最初语言学领域中的多模态理论发展到涵盖认知心理学领域的建构主义理论以及生物学领域的生态学理论等。由此可见,国内的计算机辅助外语教学目前已有广阔的教育实践、丰富的实物产品和熟练应用经验,成熟的研究力量和研究成果,新颖、独到的创新理论体系以及研究方法等(胡加圣等,2010;2011)。这说明,以计算机辅助外语教学为主要研究内容的外语教育范式已经形成,外语教育技术学科成立的前提和基础也已具备,预示着作为三级学科的外语教育技术学科的雏形已经显现(李艳、胡加圣,2011)。

5.2 外语教育技术学科的研究热点

另外,根据本文对国内机助外语教学的计量学考察,特别是依据对关键词进行统计所获得的信息,还可展望、预测外语教育技术学科领域今后的研究趋势。具体来讲,以下几个方面研究趋势比较明朗,有望成为今后該领域研究的主导。(1)教师研究。对教师的研究也是12年间該领域研究的关注点之一,由于篇幅所限,教师的研究角度未明确列出,但结合原始统计数据,可以看出对教师研究角度的变化。2007年之前的教师研究主要关注教师角色和教师培训两个方面,而2007年之后除了对教师角色和教师培训这两个方面继续研究外,还出现了对教师的行动研究、教师专业发展以及教师认知等方面的研究。这一点与目前国内外二语习得研究趋势也基本吻合。(2)课程整合研究。信息技术与课程整合是计算机辅助外语教学的最新阶段。计算机关键技术的发展为计算机主导外语教学提供了可能和条件。未来的发展趋势是传统的计算机辅助教学模式将逐步演变成计算机主导教学的模式(陈坚林,2005)。整合即意味着以计算机网络为代表的信息技术手段从处于辅助地位的幕后走到了台前,从而成为课程的一个有机组成部分。数据显示,对课程整合研究的关注度越来越高,但紧密结合国家教学改革的方针,該方面研究尚面临诸多难题与困惑,具有巨大的深入探讨的潜力。(3)生态化研究。生态化既可用于研究教育宏观问题也可用于研究教育微观问题。计算机辅助外语教学的生态化研究属于后者,当然也可看作课程整合研究的一个衍生问题。信息技术向外语教育渗透后,传统的教学要素被新的教学要素取而代之,为了使教学系统保持动态和谐,就应以生态学视角来重新审视外语教学(陈坚林,2006)。

研究生计算机论文篇4

关键词:计算机控制系统;课程改革;研究生

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2014)25-0040-02

在控制理论与控制工程学科中,计算机控制系统课程属于重要的专业基础课程,同时在培养硕士研究生的工作中起到重要的作用。从1998年开始,我校开设了计算机控制系统课程,经过十五六年的课程建设,各方面都获得了显著的成效,主要体现在课程内容、知识体系、教学方法、教学改革等。

一、丰富教学内容,满足社会发展需求

计算机控制系统课程就知识结构主要分为三类:计算机控制系统的硬件系统分析与设计、计算机控制软件设计、离散系统理论与系统分析。该课程主要内容包括:计算机控制理论基础、计算机控制系统分析与设计、线性离散系统状态空间分析、计算机控制系统离散化设计、复杂规律计算机控制系统的设计、集散控制系统、计算机控制系统的设计与实现等。该课程从理论到实践,深入阐述了计算机控制系统的设计方法、设计理念、设计实践,叙述了不同类型计算机控制系统的设计原理及特点。关于计算机复杂控制系统的分析设计方法,通过学习计算机控制系统课程,学生就能够掌握并且为将来的研究生课程中的理论和技术支持做铺垫。

计算机控制技术不断发展,但是计算机控制系统课程的教材多年来从理论和设计内容上都非常相似,往往是内容陈旧、枯燥并且理论和实际脱节,学生学习起来不容易理解。基于上述问题,我们在课程讲授中,将收集到的计算机控制理论相关的论文和最新成果资料作为讲授及课堂讨论内容;将计算机控制、楼宇自动控制方面的课题研究成果引入教学;通过现场教学、专家教学等方式,理论联系实际,收到良好效果。

定期召开专业研讨会和学科前沿知识研讨会。注意学科发展动态,并结合学科专业特点,出版了计算机控制系统教材及辅助教材,对于扩大学生的知识视野以及使计算机控制系统课程的教学内容更加充实起到很大作用。

二、探索研究生教学规律 提高授课质量

1.开展研究型教学,提高学生创新能力。积极探索研究生教学规律,将培养研究生创新能力作为课程建设的重点。在计算机控制系统课程建设中,积极探索学生创新能力的培养途径,开展研究性教学、前沿研究、理论知识,进行艰难的专题研究。这样的教学课程和课外活动的结合,将能力培养和素质教育相结合,通过研究型教学尝试,收到了显著效果。学生自主学习能力大大增强,同时拓展了知识面,提高了学生分析问题、解决问题的能力,提高了创新能力。

2.重视产学研相结合,强化研究生实践能力培养。建立校外实习基地,与东北建筑设计院、辽宁省建筑设计院、中科院自动化研究所、沈阳电梯厂等单位建立长期稳定的合作关系,并签订协议联合培养本科生和研究生。同时与这些单位的专家联合指导研究生,聘请专家讲座,结合实际工程,深入浅出,讲述计算机在实际工程中的应用。通过实际工程案例分析,使学生理论联系实际,通过实习环节让学生亲自参与实践工程设计,在学期间得到实际工程技术知识的训练,收到良好效果。

三、多种教学方法的融合 提高教学效果

(一)建立以学生为主体的教学模式,激发创造性思维

改变单一的教学知识,建立一种合理的教学模式。以学生为中心,教师起到主导作用。在课堂教学中,将启发式的教学方式持续用下去,利用学习国内外一些典型的计算机控制项目,教师引导学生的方式变得更加多角度和全方位,让学生主动发现问题,将学生的积极性充分调动起来,使学生更多的潜能被激发。在实际的课堂教学过程中,增加教师和学生的交流,鼓励学生提出问题,使他们逐渐形成独立思考的习惯,有助于创造性思维的开发。

(二)模块化 案例教学收到良好效果

实际课程教学中,进行模块化分类,三大模块分别是基本理论、设计方法和实例分析。采用模块化教学分析方法,深入浅出地从理论知识学习到实践工程应用,学生掌握起来更加得心应手。结合计算机控制系统案例,实现学生对学习兴趣增加的方法是利用多媒体这样的现代化教学方式。

(三)采用多样多样化教学方式,提高了学生的学习兴趣

1.深入实际,现场教学。到一些相关单位采取现场教学,效果更佳。在进行现场教学之前预先安排一些问题,让学生带着问题去学习,能更好的把课堂上的理论知识和实践知识有机地结合起来。请专家解释在机器人控制理论,计算机应用技术的智能建筑,并基于演示和实际操作,从理论到实践,通过实际的对象,说明计算机控制理论的应用更加真实、直观,使学生真正理解计算机控制理论的重要性,提高学生的学习兴趣。提供大量的实际工程材料课程进行教学指导,让学生在学习理论知识的实际工程问题的过程中做到理论与工程实践紧密结合。这样既能把学生对学习的主动性和积极性充分调动起来,又能对学生自身解决实际问题能力的培养起到很大作用,达到学以致用,是提高教学效果的有效手段。

2.创新教学方法,提高授课质量。通过计算机控制系统课程多年不断总结和探索,形成了具有特点的教学风格,并通过多年的教学实践,验证了教学方法的有效性。①采用模块分析方法,深入浅出。按课程的知识体系,将课程内容进行模块划分,明确课程的知识体系结构,并总结各知识模块的相互关系,使学生对课程的知识结构有一个总体的把握,便于学生形成完整的知识体系结构。②将抽象的理论描述转化为形象化的描述。利用图形、图像信息资源使学生能够尽可能的接近实际系统理论部分,紧密结合系统工程实例进行讲述,理论联系实际,提高了学生认知度和学习兴趣。③流程图分析法。在分析复杂系统时,采用流程图方法,直观明了易于理解。系统环节多而复杂,采用流程图方法分析易于掌握。④知识融合分析法。通过系统的实例将系统定性分析、定量分析、校正设计融合一体,使学生明确系统分析设计总体思路,更好地把理论与实践结合,培养学生分析问题和解决问题的能力,以及综合分析设计能力。⑤案例分析法。在课程讲授过程中引用了大量工程案例,通过案例分析,产生计算机控制理论及设计方法,充分发挥了它的启发性、实践性,开发了学生思维能力,提高了学生的实践能力、分析问题和解决问题的能力。

四、结论

在计算机控制系统的课程建设中,完善课程体系,强调了理论与系统的结合。理论联系实际,实现教学、科研、实践相结合的教学理念。采用了模块化、开放型、互动式教学模式,强调创造力与综合解决问题能力相结合、设计实践与综合设计能力相结合。将科研成果引入课堂,理论联系实际,收到良好效果。将智能建筑特色融入计算机控制理论教学中去。实现根据“产、学、研一体化”教学模式,取得了显著效果。

参考文献:

[1]孙延鹏.优化和构筑创新型人才培养平台提高大学生创新能力[J].辽宁教育研究,2006,(5).

研究生计算机论文篇5

美国麻省大学(University of Massachusetts Amherst)阿默斯特校区(以下简称麻省大学)是马萨诸塞州立大学系统五个校园中的主校园,是美国知名的研究型大学。该校创办于1863年,坐落在美国东部美丽的新英格兰地区。

麻省大学计算机系成立于1964年,其研究生教育也有超过40年的发展历史。由最初的3名教授发展到现在拥有43名教授,其中包括9名ACM计算机学会(Association for Computing Machinery)院士(Fellow)、4名电子和电气工程师协会(IEEE)院士、5名人工智能学会(AAAI)院士和2名美国科学促进协会(AAAS)院士。麻省大学计算机系在人工智能、网络与分布式系统、计算理论等多个领域的研究处于世界领先水平。作为美国知名的计算机系,麻省大学计算机系的教育理念是“培养下一代能以创新的方法解决真实世界问题的计算机科学家”(cs.umass.edu/grads/msphd-requirements)。在这个核心思想的指导下,该系非常注重对博士研究生的培养,为了达到培养学生具备进行原创性科学研究(Original Research)的能力的教育宗旨,该系制定了一套非常严格的课程计划,以培养学生坚实而广博的基础知识、良好的科学研究方法和思维习惯。麻省大学计算机系每年大约会收到1000份左右来自世界各国的优秀学生的申请,攻读其博士学位,而录取的人数一般保持在30名左右。完善和严格的博士研究生培养体系、开放而先进的教育理念,使麻省大学计算机系成为全美最具有竞争力的计算机院系之一。

麻省大学计算机系招收两种形式的博士研究生:硕士/博士连读研究生和直博研究生。只有在美国其他大学获得相应计算机硕士学位,并修完麻省大学计算机系认可的相关课程的学生,才有资格申请直接攻读博士学位;否则,学生在录取后必须经过硕士/博士的连续培养才能获得博士学位。

无论哪种形式,麻省大学计算机系博士生培养大体分为两个阶段:博士生资格学习阶段和博士生研究阶段。博士生资格学习阶段主要是对学生进行基础知识培养和基本研究能力训练。学生只有在通过博士资格考试论证,成为正式博士候选(PhD Candidate)人后,才能进入下一步的博士论文研究阶段学习。以下是麻省大学计算机系对硕士/博士研究生的培养要求:

(1)Actively participate in research under the guidance of an advisor(在导师的指导下,积极参与研究)

(2)Satisfy 6 Core Requirements (完成6门核心课程的要求)

(3)Complete 42 course credits (core courses taken to satisfy core requirements are included)(完成42个课程学分,其中包括核心课程的学分)

(4)Complete a 6-credit MS Project (完成6个学分的硕士研究项目)

(5)Graduate with an M.S. Degree(申请获得硕士学位)

(6)Pass the Department Qualifying Exam- Portfolio(通过博士资格考试)

(7)Form a Committee(成立答辩委员会)

(8)Propose a Thesis(提交博士开题报告)

(9)Complete 18 Dissertation Credits (完成18个学分博士论文)

(10)Pass the Teaching Assistant Requirement(完成助教的工作要求)

(11)Pass the Residency Requirement (at least 9 credits in back-to-back semesters) (完成连续两个学期修9个学分的要求)

(12)Defend and Submit a Thesis (博士答辩和提交博士论文)

本文将以麻省大学计算机系为例,探讨美国计算机专业博士研究生培养的一个重要环节――博士研究生课程教育体系的特点,以期为提高我国的计算机专业博士生教育提供借鉴。

2掌握牢固的理论知识是培养优秀博士生的基础

美国的计算机博士教育非常注重对学生基础理论知识的培养,为了使学生掌握牢固而广博的基础知识,麻省大学计算机系要求每个硕士/博士研究生必须修完6门博士核心课程,而且成绩必须达到B+以上。这些核心课程分别属于计算机科学的三大领域:理论(Theory)、系统(Systems)和人工智能(Artificial Intelligence),课程设置具体如下:

(1) 理论核心课:计算理论(Computation Theory)、高级算法(Advanced Algorithms)

(2) 系统核心课:有三组课程,分别是:

编译技术(Compiler Techniques)、现代计算机体系结构(Modern Computer Architecture)

数据库设计和实现(Database Design and Implementation)、高级计算机网络(Advanced Computer Networking)、操作系统(Operating Systems)

高级软件工程I(Advanced Software Engineering: Synthesis and Development)、高级软件工程II(Advanced Software Engineering: Analysis and Evaluation)、程序设计语言(Programming Languages)

(3) 人工智能核心课程:高级人工智能(Artificial Intelligence)、机器人学(Robotics)、信息检索(Information Retrieval)、不确定环境下的推理(Reasoning and Acting under Uncertainty)、增强型学习(Reinforcement Learning)、机器学习(Machine Learning: Pattern Classification)

根据不同的研究方向,学生可以在六门核心课程的选择上有所不同,但为了加强理论基础和掌握知识的广度,无论哪个研究方向的学生,都必须修完两门理论核心课程和一门高级人工智能课程,同时,再根据自己的研究方向选修其他三门核心课程。例如,一个系统方向的博士研究生除了修完以上两门理论和一门人工智能课程以外,还必须修完来自于系统方向不同组的三门系统方向的课程;而一个人工智能方向的博士生则必须修完另外两门人工智能方向的核心课程和一门系统方向的核心课程。

每门核心课程由教师讲授一学期,其中每星期2次课,每次2小时,3个学分。根据内容不同,每门课程一般要安排5~8次书面作业、1次期中考试和1次期末考试。其中,对系统方向的课程来说,每个章节完成后一般还有一次课程项目设计(Course Project),主要要求学生实现相应的算法和进行性能评价。由于核心课程要求高,课程学习内容多,导师和系里会建议学生每学期选学不超过一门的核心课程,所有6门核心课程则在三年内完成。如果成绩没有达到B+,麻省大学计算机系允许学生重修该核心课;但是,如果学生在规定的博士资格考试申请时间前没有通过全部的6门核心课,则不再具备继续攻读博士的资格。

严格的核心课程作业、考试制度和淘汰制度,不但使学生牢固掌握了计算机科学各领域的基础知识,培养了学生勤奋刻苦的专研精神,而且极大地丰富了学生的视野,为学生进入实际科学研究打下了坚实的基础。

3灵活而完善的博士生选修课程体系是培养创新型人才的重要途径

美国一流研究型大学博士生教育的目标是培养世界一流的科学家和拔尖创新型人才,为了实现这个目标,美国的博士生教育除了注重培养学生扎实和精深的基础知识外,还非常注重培养学生的创新思维和发现新问题的探索精神及能力。

如果核心课程体系的设置是培养优秀博士生的基础,是向学生传授学科领域的重要基本知识和原理与技术,是学生全面掌握计算机基本理论与方法的重要途径,那么,选修课的设置则是对学科基本知识的补充,是培养学生学习新的知识和了解并探索前沿研究方向,从而成为创新型人才的重要手段。

麻省大学计算机系的做法是,在博士研究阶段,除了要求学生完成18个学分(6门)的核心课程学习以外,还要求完成24个学分(8门)的非核心课程(或称为选修课)学习。这些选修课大多是关于本学科及相关专业前沿领域近3~5年的新研究方向、研究方法或新技术的相关内容的介绍,一般由教师在每学期开学前提出新的课程计划,学生则根据自己的研究兴趣和职业目标自由选课。通过课程的学习,学生能在最短的时间内了解本学科相关领域的最新研究现状,更重要的是,在课程的学习过程中,教授会将许多新出现的问题在课堂上和学生讨论,同时,通过2~3个课程项目培养学生独立(或合作)解决新问题的能力,以及教会学生各种探索问题的研究方法。

在教学模式上,可以采用由教授主讲的传统方式,也可以采用以讨论为主的方式。以教授为主讲的教学模式在此就不再赘述,以下着重描述以讨论为主的选修课教学模式。

以讨论为主的Seminar是美国计算机院系的教授最常用的选修课教学模式。Seminar的课程设置没有固定模式,但通常有以下几方面的特点。

第一,课程的选题一般是近年新出现的有代表性的前沿研究课题。

第二,课程内容的选择一般来自近年来该领域顶级国际会议的专题论文。

第三,课程内容的组织由教师完成。教师在确定题目后,一般会根据论文的情况将讨论的内容分为多个子专题,每个子问题由3~4篇论文组成。课程的开始一般是综述性的论文或在该领域出现的最早的学术论文,其目的是探讨该研究方向出现的新的应用背景需求和所带来的新的挑战。其后的每个子专题则将对具体问题和方法进行深入探讨。

第四,选课的学生人数一般在20~30人左右,而且通常是由学完了核心课程以后的高年级博士生组成。学生人数太少,论文的覆盖面可能太小;学生太多,可能导致讨论的深度不够。同时,只有学完了基本理论后,学生才有可能具备较深入分析问题的能力。在Seminar的学习讨论中,找到新的研究问题也是该课程设置的重要目的之一。

第五,课堂教学的模式基本上是教师和学生互动的教学方式。教师在第一节课引导学生对该领域的基本问题有了初步认识后,学生将对每篇论文进行评估(Review)、宣讲(Presentation)和进行课堂讨论。每篇论文的宣讲时间是25~30分钟,课堂讨论时间是10~15分钟。其中教师将引导学生对论文中所研究的问题和关键技术进行深入讨论,学生参与讨论的情况将作为课程考核的重要依据。

选择合适的题目并对教学讨论的内容(论文)进行筛选和组织对开课教师的要求非常高。为了准备一门新的Seminar课,教师一般需要预先通读该研究方向所有重要国际会议的相关论文,然后根据不同的研究问题对论文分类,并将其中有代表性的论文提炼出来,作为课程学习的论文。在课程项目的设置上,教师会事先准备一些题目,如对某些算法的实现、评估和改进,实现原形系统等,同时也非常鼓励学生在论文讨论的过程中有针对性地提出自己的见解和新的解决问题的方法。

4合理的课程学习安排是培养高质量博士生的有效保证

美国的博士教育是以博士生的最终质量为评判标准,而不是以年限来规定学生的毕业时间。在美国计算机专业,培养一个硕士/博士生一般需要至少5年时间。由于强调博士生专业知识学习的深度和广度,在整个博士学习阶段,博士生都会积极参与课程的学习,并尽可能地将研究项目中的问题和课程学习联系起来,用所学到的方法或思路来解决新问题。

以麻省大学计算机系为例,虽然学生的背景不同,但为了在保证质量的前提下帮助学生用最短的时间顺利完成博士课程要求和博士论文要求,系里建议学生按如表1所示的时间表安排整个博士阶段的学习计划。

麻省大学计算机系不但在本系有完善的研究生课程体系,学生可以根据自己的研究兴趣和职业规划来自由选课,而且也鼓励学生在其他相关院系选修本系没有开设但对研究有用的课,如数学系或电子工程系的高级课程。总之,美国博士教育的一个重要特点是强调基础知识的学习,鼓励学生以积极的态度参与到课程的学习中,同时训练学生在课程学习的过程中逐步学会发现问题和研究问题的方法。

5启示和建议

美国的博士教育强调坚实的基础理论知识、完善的知识体系和用于探索与创新的研究能力,而这些恰恰是决定博士毕业生日后发展潜力的关键。长期以来,我国计算机博士教育主要是通过参与科研项目的形式来对学生进行培养,这种“研究项目驱动型教育”在我国恢复研究生教育的初期起到了很好的推动作用,培养了大批科研人才。但随着教育本质的回归和创新型人才培养的需要,从总体来看,我国的这种单纯强调研究项目的教育模式培养的博士生,质量与国际先进水平相比还有一定的差距。由于没有严格的博士课程要求和淘汰制度,学生在学习阶段往往会忽略对基础知识的学习和对知识结构的完善。长此以往,必然会影响博士生的研究水平和发展潜力,最终将会影响国家的整体创新能力。

笔者建议,为了使学生掌握牢固的专业基础知识,同时培养学生在某一学科领域的研究兴趣和基本的研究能力,应该首先强调核心课程体系的建设,不论哪个方向的学生都必须通过一定数量的核心课程的学习,如算法、分布式操作系统、人工智能等,这些核心课程应由教师来讲授;同时,应严格课程的考核制度和课程评价体系。对于选修课,由于其主要目的是扩展学生的视野,培养学生分析问题和研究问题的能力,所以应借鉴国内外Seminar课程的成功经验,积极有效地激励教师和学生共同上好Seminar课。

博士生教育是一项复杂而艰巨的系统工程,而其中的课程学习是研究生培养中非常重要的一个环节,如何通过严格的培养机制和灵活的培养方法,在给学生传授基础知识的同时培养学生分析问题和解决问题的能力;如何将合理的研究生课程体系和研究项目结合起来,严格博士生培养机制,完善博士生资格评估体系,从制度上保障博士研究生的质量;以及如何真正教会学生探索科学基本问题的方法,培养学生良好的科研习惯和勇于开拓创新的精神等,是我们在计算机学科建设中应该进一步思考的问题。

研究生计算机论文篇6

教学与科研相结合是培养高素质研究生的有效途径。高水平的人才培养是通过研究生高水平的学术成果来反映的,高水平的学术成果主要源于大量的高水平的科学研究,而严格的教学环节在培养研究生扎实的学术功底、严肃的科学态度、创新性的思维,以及在产生高质量学术成果方面起到了一个关键的基奠作用。本文从研究生网络课程教材体系建设中需要注意解决好的四个问题出发,讨论计算机及相关专业硕士研究生网络课程教学与教材体系建设思路、教材体系建设与教学方法改革问题。

1研究生“计算机网络”课程教学与教材体系建设的指导思想

在研究生网络课程教材体系建设中需要注意解决好四个问题。一是课程内容的先进性与前瞻性问题;二是研究生与本科课程内容的衔接问题;三是理论教学与能力培养的并重问题;四是自主学习和因材施教问题。

1.1课程内容的先进性与前瞻性问题

研究生的教育必须突出“研究”,教材要能够反映学科前沿的研究成果与发展趋势。一本好的研究生网络教材或教学参考书应该是:在保持网络理论体系的基础上,跟踪当前技术的发展,综述最新研究的领域、课题、方法、成果与趋势,让读者能够直接了解当前研究的前沿问题、方法、进展与趋势。

与传统的数学、物理、化学学科相比,计算机学科应用性人才培养的要求更高,技术发展速度更快。而在计算机学科中网络技术的发展与知识更新的速度尤为突出。因此,保持计算机网络课程内容的先进性与前瞻性更为重要,也更加困难。因此要很好地解决这个问题,必须将教学与科研工作紧密地结合在一起,发挥科研教学团队的作用,以高水平的科学研究支持高质量的课程与教学体系的建设。南开大学网络实验室在多年来一直注意开展以下几个方面的工作:

(1)通过科研预研工作实践,了解当前热点问题的研究现状与进展。

(2)跟踪美国ACM和IEEE/CS最新制定的计算机学科课程体系,重视学术交流。

(3)跟踪和浏览国外知名大学教学网站,研究和了解网络课程教学内容、教材与主要参考书,以及作业与实验、教学方法与教学过程控制方法改革的动向。

(4)选择国际流行教材,分析如何处理新的技术发展与教学内容的关系,梳理技术的内在关系与发展主线。

(5)跟踪国际知名网络设备制造商与网络软件公司的研究工作,以及技术认证与考试内容的变化,了解产业界对技术与人才需求的变化。

(6)参与信息化规划与建设工作,通过与产业界、政府各级管理人员的合作,了解我国信息化发展的现状与社会对网络人才的需求。

以上工作在我们把握研究生教材内容的先进性与前瞻性方面起到了重要的指导作用。

1.2本科与研究生课程内容衔接问题

计算机及相关专业的硕士研究生一般在本科阶段都修过计算机网络课程。同时,由于学生不是来自一个学校或同一个本科专业,所以学生在网络技术方面的基础差异很大。这个问题在研究生招生规模扩大后更为突出。教师很难在某个起点上安排教学内容。任课教师比较为难,照顾到基础比较差的学生,基础好的学生认为“吃不饱”;考虑到基础比较好的学生,基础差的学生反映“跟不上”。无论老师想什么办法,都无法解决好这对矛盾。这是在很多大学都很普遍的问题。经过多年的实践我们逐渐认识到:要保证教学质量,必须根据研究生培养目标,改变教学方法,强调“自主学习”和“因材施教”。要为实现学生的“研究”、“自主”学习和教师的“因材施教”创造条件,就必须从课程教学目标定位入手,研究本科与研究生教学一体化、理论教学与能力培养一体化的网络教材体系。

1.3理论教学与能力培养并重问题

团队成员通过总结多年指导研究生学位论文的体会认识到,学生的实际工作能力需要他们在参加科研项目和完成开发任务的过程中提高。在多年指导和审阅相关学科硕士与博士学位论文的过程中,导师们深刻地感觉到:有相当比例的研究生在本学科领域眼界不宽,网络应用系统设计与编程能力亟待提高。如果能够在他们准备学位论文之前认真地训练这一方面的能力,那么他们的论文的研究深度与论文水平还能够有较大幅度的提高。研究生能力培养可以通过网络环境中的课题、大编程量的训练来实现。提高网络软件编程的实际工作能力对于研究生今后的研究工作与就业将会有很大的帮助。而这些编程课题应该是由教学科研团队从研究工作与开发的课题成果中提炼出来,将科研成果有选择的转化为“近似实战”的研究生训练课题。这种训练对学生深入理解网络原理与实现方法会有很大的帮助,对于日后的科研工作和提高学位论文质量也是很有益的。

1.4自主学习和因材施教问题

从研究生自身学习的角度应该强调“研究性”与“自主性”,学生应该变被动的“听课、做笔记”转向主动的、研究地学习和提高。从任课教师与导师角度应该强调“因材施教”。

从我们多年的教学经验看,同一届的研究生实际能力差异都很大。研究生教学更多的应该是根据不同的学生、不同的研究重点、不同的起点,有不同的训练方案,不能没有区别。导师的因材施教应该体现在:指导学生根据自己的基础、研究方向,选择不同类型、不同编程量,或不同的难度级的课题自主的完成训练,循序渐进地提高实际能力。教师要做到这一点,需要做很多艰苦细致的工作和积累很多教学资料。经过10多年的积累与团队成员的集体努力,我们初步完成了一些基础性的工作。

研究生教材不应该仅是一本一学期使用的教科书,更应该是一本技术参考书,甚至是一本手册。导师可以根据需要选择教材中部分内容,作为基本的学习要求。学生学习的过程应该在导师的指导下有选择地自学和阅读,完成编程训练。有些内容可能第一次仅仅是读过和了解,如果今后科研、开发工作需要,可以再回过头来继续阅读和参考。

为了适应研究生“研究性”与“自主性”学习的要求,我们设计的《计算机网络高级教程》内容的覆盖范围宽,涉及当前网络研究的多个领域;《计算机网络高级编程技术》总的编程训练量大,问题近似实战,难度差异也比较明显。为了有利于学生自主学习,我们对每个课题都提供了入门所需要的资料、工具与实现方法的范例,学生可以通过自学的方式完成训练要求。

2 《计算机网络高级教程》教材的编写

研究生教材体系由《计算机网络高级教程》与《计算机网络高级软件编程技术》两部相互配套的教材组成。主教材《计算机网络高级教程》重点讨论了网络研究的最新发展与研究的热点问题,力求达到“反映计算机网络前沿研究成果与发展趋势”的要求。

《计算机网络高级教程》分12章按网络技术发展的三条主线讨论了技术的演变与发展。其中:

第1章对网络技术研究与发展的阶段、重点问题和基本概念,以及各个阶段的标志性技术作了一个概要的总结。

第2章讨论了广域网(WAN)技术的演变与发展趋势。

第3章讨论了局域网技术,尤其是对高速局域网(Gigabit Ethernet与10 Gigabit Ethernet)和无线局域网(WLAN)技术作了较为系统地讨论。

第4章讨论了城域网(MAN)概念的演变,以及宽带城域网组建技术与接入网技术。

第5章对IPv4协议近年来的发展与演变过程作了较为全面地总结和讨论。

第6章对IPv6的基本内容与应用方法进行了较为系统地介绍。

第7章对移动IP的基本概念与关键技术作了系统地介绍。

第8章对传输层分布式进程通信的概念,以及TCP、UDP协议进行了系统地讨论。

第9章对应用层协议与Internet应用系统设计技术进行了系统地讨论。

第10章对无线自组网络(Ad hoc Network)与无线传感器网络(WSN)、无线网格网(WMN)的概念、特点、体系结构,以及关键技术的研究与进展作了比较全面地总结和介绍。

第11章讨论了网络安全与网络管理技术。

第12章对国外大学与产业界在评价研究成果时常用的网络性能分析开源工具、网络模拟开源工具及其应用进行了系统地介绍。

在准备这本书的资料和写作的过程中,作者有两点体会最为深刻。一是尽管Internet技术与Ad hoc网、WSN、WMN在设计目的、应用的领域与技术特点上差异很大,但是在研究方法上基本上是相通的,并且在高层又都汇集到Internet之中。二是尽管作者认真地在这个领域已经工作了20多年,但是网络技术发展得实在是太快了,个人的研究工作与阅历不可能涉及到各个领域。个人与团队的研究工作也只能是限制在网络技术中的几个比较窄的方面,深度也十分有限。因此在系统地总结网络技术领域的研究与进展时感到难度很大。尽管也经常与同行交流和请教,仍然是力不从心。但是本着对学生学习负责的态度,还是坚持完成了写作任务。这部教材应该说是汇聚了很多人的研究心血,作者只能是将个人能够理解的部分按照自己的思路整理出来,以便读者学习和研究。作者试图在相关章节的后面注明某些研究工作总结与论文的出处,以及相关的参考文献、文档与标准,请有兴趣的读者自己去阅读相关的文献与标准。

3 《计算机网络高级软件编程技术》教材的编写

高素质创新性计算机人才应具有较强的实践能力。社会对网络人才的需求十分强烈。但是真正懂网络技术,能够具备深入到网络协议内部的高层次网络应用系统设计和网络软件编程能力的软件人才是非常缺乏的,也是社会急需的高级人才。研究生要能够做出有自主知识产权、创新性的成果,就必须踏踏实实地苦练内功。编著《计算机网络高级软件编程技术》一书,是希望对高级网络软件人才的培养贡献一点力量。

《计算机网络高级软件编程技术》的特点可以总结为以下几点。

(1) 在总结了20多年科研工作经验与研究生教学工作实践经验的基础上,构思了教材的写作思路与全书的内容结构。

(2) 参考了国内外知名大学网络课程训练与著名信息技术企业在员工网络软件编程训练中的相关资料与文献。

(3) 结合了网络技术在Internet、无线网络与信息安全等3条发展主线,总结提炼出22个网络软件编程题目。

研究生计算机论文篇7

[关键词]计算机视觉 视觉框架 三维表示

中图分类号:TP338.6 文献标识码:A 文章编号:1009-914X(2015)47-0133-01

1 计算机数字视觉技术研究的地位

长期以来,人类持续不断地试图从多个角度去了解生物视觉和神经系统的奥秘,这些努力的阶段性理论研究成果已经在人们的生产生活中发挥了不可估量的作用。计算机视觉(CV)研究的主要内容是通过计算机分析景物的二维图像,从中获得三维世界的结构和属性等信息,进而完成诸如在复杂的环境中识别和导航等任务。计算机视觉研究的重要性是不言而喻的,会产生深远的经济和科学的影响。

20世纪下半叶以来,很多研究者都曾试图通过视觉传感器和计算机软硬件模拟出人类对三维世界图像的采集、处理、分析和学习能力,以便使计算机和机器人系统具有智能化的视觉功能。今天,数字图像相关的软硬件技术在人们生活中的广泛使用,数字图像已经成为当代社会信息来源的重要构成因素,各种图像处理与分析的需求和应用也不断促使数字视觉技术的革新。数字视觉技术的应用十分广泛,如数字图像检索管理、医学影像分析、智能安检、人机交互等。

数字视觉技术是人工智能技术的重要组成部分,也是当今计算机科学研究的前沿领域,经过近年的不断发展。已逐步形成一套以数字信号处理技术、计算机图形图像、信息论和语义学相互结合的综合性技术,并具有较强的边缘性和学科交叉性。

2 计算机数字视觉技术研究的核心问题

视觉问题复杂性的本质在于相对声音等物理信号的描述,视觉信号充满了非常丰富的信息,描述起来也更加困难。如何攻克图像信息提取过程中的各种难题一直是当今计算机图像学研究的热点问题,而且在科学家们还未完全破译生物视觉系统的奥秘的前提下,大多数问题只能采用逆向推导机制,依据已知或假设的关联将视觉系统的输入数字图像和输出语义描述对应起来。基于概率论和数理统计的数学模型是最适合解决这类逆推问题的工具,这也是目前领域普遍采用各种统计模型和机器学习算法的本质原因。

物体的三维表示是计算机视觉研究的一个关键问题。八元树(octree)表示法是一种紧凑、简洁的物体三维表示法,近年来这种表示法被广泛地应用到计算机视觉的研究领域。广义八元树表示法的优点是不受视图个数的限制,通过增加观察方向可以计算出更加精确的物体三维表示。主要缺点是需要进行多次坐标变换,在计算机上实现时需要研究相应的离散技术。线性八元树(linearoctree)是较八元树更加简洁的表示形式。

3 计算机视觉技术结构及其研究基本框架

计算机视觉技术内在的逆推机制决定了其在系统开发时必须将原始图像数据与其蕴含的知识之间的语义鸿沟加以弥补,在满足特定应用需求的前提下进行合理的图像内容简化和假设,形成目前普遍使用的计算机视觉系统结构:即图像数据层、图像特征描述层及图像知识获取层。由于各种图像特征都有其优点及不足之处目前趋势是结合不同种类的特征对图像内容进行综合表述,以建立较为可靠的图像信息模型,比如利用时空体数据结构 对人体行为等视频内容进行描述。

计算机视觉技术的研究主要围绕着四个基本理论框架:以Marr视觉计算理论为核心的深度重建框架;以感知特征群集为主线的基于知识的视觉框架;以“感知一动作”为基础的主动视觉理论框架;以综合集成理论为指导的视觉集成框架。其中,视觉集成理论框架是计算机视觉研究中一个较新的理论框架,并越来越多地受到cv研究者的关注。视觉集成理论的研究内容大致可以分为三个方面,第一方面的研究内容是关于视觉信息与其它类型信息的集成。第二方面的研究内容是关于视觉表示和视觉模型的集成。视觉表示方法主要分为三类:图像表示、表面表示、物体表示。视觉模型王要分为图像模型、结构和形状模型、运动和动态模型、不确定性模型。集成的视觉系统应该能够充分利用这些方法的优点。第二方面的研究内容是系统的集成。

4 计算机视觉的发展历程及其趋势

一般认为,计算机视觉技术研究始于20世纪50年代中期,当时的努力主要集中在二维景物图像的分析。区别在于,图像处理的目的是通过处理原始图像得到在某一方面更有利的新图像。模式识别关心的则是将一些模式归入预先定义的有限类别中,主要研究的是二维模式。而计算机视觉主要考虑的是对三维世界的描述和理解。

一般来说,比较一致的观点认为,计算机视觉的研究起始于1965年Rboesrt开创性的工作。Rboert对“积木世界”研究取得的成功激起了人们很高的期望。

60年代末70年代初期,计算机视觉研究领域的很多工作是关于低层视觉处理,从图像中提取重要的强度变化信息――边缘检测。然而,人们很快就认识到很多重要的物体属性无法只通过分析图像的灰度变化得出。到了70年代初期,问题更加明朗化,低层视觉处理无法从单幅图像中普遍地获取对景物的有用描述,计算机视觉的研究领域普遍地发生危机。为了摆脱困境,计算机视觉迫切地需要有一个统一的理论框架作指导。70年代中期到80年代初期,计算机视觉的研究领域首次出现了一个理论框架:视觉计算理论框架,将视觉系统从概念上分成几个独立的模块。80年代后期,计算机视觉的研究领域出现了主动视觉(`vtievsiino)的理论框架。

近年的研究结果表明,单一的图像特征描述机制,无论是对底层像素级特征的描述还是顶层语义特征的描述。都仅能在有限范围内对图像的内容进行建模。巧妙融合多种图像特征因此成为近年图像信息描述方面的主要趋势,近年来,计算机视觉的另一个理论框架――视觉的集成方法越来越多地受到重视。一个重要的趋势是用于识别真实世界中较为复杂的图像内容的技术,适合描述真实场景的各种特征不断得到发展。随着目前互联网络技术的不断发展,另一个值得重视的趋势是计算机图像技术与互联网技术、社交媒体技术等其它计算机技术的融合。

6 结语

计算机视觉识别技术虽然是一门新兴学科。但应用前景十分广阔,对其技术的有效性、易用性、实时性及稳定性能等方面有着较高的要求。因此。其技术面临着前所未有的机遇和挑战,该领域的发展亦有过激烈的争论和反思。但是,不可否认的是,计算机视觉技术研究在许多应用领域的应用前景都是广阔的、不可估量的。

参考文献

[1] 马玉真,陶立英,王新华.计算机视觉技术的应用[J].试验技术与试验机.2006(01)

[2] 潘春洪,张彩霞.计算机视觉简述[J].自动化博览.2005(05)

[3] 孙瑾,顾宏斌.计算机视觉系统框架结构研究[J].计算机工程与应用. 2004(12)

[4] 王天珍.计算机视觉研究进展[J].武汉汽车工业大学学报.1998(01)

研究生计算机论文篇8

虽然计算机设计的初衷是缘于数值计算,但是英国数学家图灵(a.m.turing)在《机器能思维吗?》(1950)一文中已经预见到计算机和自然语言将结下不解之缘,并且提出检验计算机智能的最好方法就是对语言信息的处理能力。1977年,费根鲍姆(feigenbaum)提出知识工程,计算机信息处理出现了从“数据世界”向“知识世界”的转移趋势。知识世界的载体是语言符号系统,语言信息处理的需求促使语言研究过程和语言研究成果的技术化趋势日益明显,当代语言学已凸显出“语言科学”与“语言技术”的二分互补格局,由此我在《南京师范大学语言科技系建设发展规划》(2001年2月)中提出“语言科技”的新思维。“语言科学”主要指基础性的描写语言学和理论语言学。“语言技术”主要指面向信息处理的应用语言学或计算语言学,其研究任务可划分为“文本处理技术”和“语言模拟技术”。简而言之,语言文本处理技术是通过编辑和编程,将印刷文本转化为可供计算机使用的电子文本的技术。语言系统模拟(simulation)或者语言能力仿真(emulation)技术是通过算法和编程,将自然语言的理解和生成能力输入计算机的技术。获得语言能力的计算机可以实现“人—机对话”而成为名实相符的“电脑”。为研制智能机服务的“语言系统模拟”,可比喻为“语言基因图谱分析工程”和“语言能力移植工程”。强调语言研究的技术化,并非忽视传统语言学研究存在技术性的一面,例如实验语音学和方言语音调查等。之所以以往未能突出语言研究的技术化,其原因在于——除语音研究可借助声学技术设备以外——语言研究的绝大多数领域还一直没有相应的实验性技术设备。

虽然当代语言学家不可能也不必要都转向计算语言学研究,但具有一定的语言信息处理意识却非常必要。早在1964年11月,美国科学院语言自动处理咨询委员会就在《语言与机器》的报告中明确指出:机器翻译遇到了难以克服的semanticbarrier(义障)。然而这一警告,除了致使机器翻译研究热的暂时消退以外,并没有引起语言学界的足够重视。1982年,日本制订了一个为期10年面向ai(人工智能)的“第五代计算机”即智能机的研制计划,其中包括自然语言处理装置。1992年结束时,只部分达到了预定目标。随后又公布了另一个为期10年的“真实世界计算机(rwc)计划”即“新信息处理技术计划”。(许万增1996,p.61-62)据说,90年代后期日本不得不宣布暂停研制,其根本原因就在于未能穿过语言研究的“瓶颈”。自然语言处理装置的任务无法实现,计算机谈何“真实世界”或“人工智能”。时至今日,这一“义障”仍然没有跨越。在《新世纪将对人类产生重大影响的十大科技趋势》(新华社北京2000年12月30日电)的报道中,列出21世纪的“认知神经科学领域”和“信息技术领域”,并分别提出来“探索意识、思维活动的本质”和“计算机向智能化方向发展”的任务,然而没有语言科技领域的合作——关键是认知语义结构网络研究的根本性突破——则不可能实现。

无论从手段还是就目标,对准自然语言处理的当代语言学研究,其性质都应界定为“语言科技”。“语言科技”的内涵是以理论研究为指导,以描写研究为基础,以应用研究为枢纽,促使语言研究向计算机应用、数学、认知科学和现代教育技术领域延伸,沟通文理工相关学科以实现语言研究过程及其成果的技术化;“语言科技”的外延表现为语言工程科技、语言教育科技和语言研究科技。语言学和计算机科学等学科相结合的“语言工程科技”,研究领域是“人—机对话”,其目标主要是自然语言能力的模拟。语言学与现代教育技术相结合的“语言教育科技”,研究领域是“人—人对话”,其主要目标是实现语言教育的多媒体和网络化。“语言研究科技”是将语言研究活动与计算机工具相结合,其主要目标是实现语言学自身的计算机化,包括语料库、词库和句库的研制,语言研究的分析性、统计性、比较性和实验性软件的开发等。这一新思维既突出了当代科技发展所要求的“语言学的技术化”,又体现了以语言学为本而沟通文理工相关学科的研究旨趣。

二、计算语言学的界定要突出技术性

20世纪50年代以后,在理论方法交叉渗透而形成诸多边缘语言学的同时,语言学与计算机结合的趋势开始出现。1954年,在美国乔治敦大学所进行的世界上首次机器翻译试验,标志着计算机科学与语言学的结合已经起步。在这一研究领域,立足于不同的学科视角或知识结构,先后出现了一系列名称术语,如“语言工程”、“语言工程学”、“自然语言的计算机处理”(工科视角)、“语言信息处理”(信息学视角)、“数理语言学”(数学视角)等等。20世纪60年代以后,计算机和语言学的结合逐步深入到语言学的各个领域,形成了包括计算语音学、计算词汇学、计算语法学、计算语义学等分支学科在内的计算语言学(computationallinguistics)。其中“计算语音学”等名词,虽然计算语言学界没人提过,因为已经存在着“言语识别”、“言语合成”等计算机应用专业术语,但是从“语言工程学”到“计算语言学”的术语演变中,透露出“语言学立场”在这门交叉学科中的日益强化。虽然目前的计算机运算速度已经可以满足语言信息处理的技术要求,但是之所以“人—机对话”尚未实现,其“瓶颈”就在于现有的语言研究成果无法满足计算机处理的要求。归根结底,语言信息处理的最终目标就是“计算机模拟语言能力工程”或“语言能力移植计算机工程”。探索语言能力的性质和描写语言系统的结构,这些艰巨性工作还得由语言学家先来完成。语言信息处理或计算语言学务必以语言学为本而以计算机为用。语言学家必须具备“数字化”意识,了解计算机需要怎样的语言描写成果,然后才可能将研究目标对准语言工程。

迄今为止,正如许多发展中学科一样,“计算语言学”的定义尚无一致认定,归纳起来盖有四种观点(侯敏1999,p.2—p.6):

第一种,计算语言学是以计算机为工具研究语言学。侯敏认为,任何一个学科在使用工具方面都是自由的,使用不同工具研究一个学科会带来不同特点,但不因为使用了新工具就产生了新学科。虽然并不排除新工具的使用没有导致新学科的产生,但同样不能否认工具的变革有可能带来学科体系的革命,以致于产生新的分支或交叉学科。现代自然科学之所以能够建立,无疑得益于望远镜和显微镜的应用,前者打开了人类认知的宏观世界之门,后者打开了人类认知的微观世界之门。望远镜和显微镜带来的不仅仅是“这一个工具”,而是人类认知方式的巨大变革,从而引起了天文学、生物学等自然科学的一系列革命,产生了一系列新学科。因此,问题在于如何使用新的工具或新认知方式。如果仅仅利用计算机做语言研究的统计工具,也许不会产生新的分支学科,但是利用计算机作为语音分析和合成的工具,则形成了计算语音学。

第二种,计算语言学是把语言学成果应用于计算机。侯敏认为,计算机的应用领域几乎没有限度,什么学科的成果都可以在计算机上应用,因此在计算机上应用语言学的研究成果不足以建立新学科。问题不在于在什么学科的成果能在计算机上应用,而在于在计算机上所应用的成果的性质。与其他学科研究对象的性质迥然不同,语言学科的研究对象——语言——是人类最重要的认知符号系统和知识载体,因此面向信息处理的语言成果应用于计算机足以建立新的学科。以往的语言学研究是面向人际交流,而计算语言学研究是面向人机交流,两者具有截然不同的性质。版权所有

第三种,计算语言学是研究语言中的可计算问题。侯敏认为,虽然利用可计算理论研究语言符号是建立了一个新学科,但是这种说法偏于保守,没有把计算语言学推进语言学发展的作用充分体现出来。问题在于面向信息处理的计算语言学研究,其显著特点就是语言的可计算性。“推进语言学发展的作用”这不是计算语言学的定义,强调“研究语言中的可计算问题”未必保守,反而突出了计算语言学的显著特点。

第四种,计算语言学是建立基于计算机科学理论的语言学理论。侯敏认为,把计算机科学的基本思想和方法引进语言学领域,不但可以产生许多应用性课题,而且能够促使研究者从新的角度观察语言学,建立与传统语言学不同的理论。因此计算语言学是一种基于计算机科学理论所建立的语言学理论。问题在于:一方面计算语言学需要理论但本质上不是一门理论科学,同时并非所有的计算语言学家都乐意或适合从事理论研究,另一方面计算语言学的应用性质决定了研究成果的技术性特征,而绝大多数人可能更适合于——实际上也更需要——语言信息处理的技术性研究。

第一种和第二种是欧洲流行的广义定义,主张计算语言学是计算机和语言学的交叉,第三种和第四种是盛行于美国的狭义定义,主张计算语言学是计算机科学和语言学的交叉。也就是说,前者仅仅把计算机当成语言学研究中的一种新工具应用,而后者强调计算机学科的要求和理论对语言学的影响。陈小荷(2001)认为,计算语言学就是以计算机为手段来研究自然语言,较严格的定义是“通过建立形式化的计算模型来处理自然语言的一门科学”。要建立形式化的计算模型来处理自然语言,首先要完成适合于计算机使用的自然语言系统的描写。这一面向“人—机对话”的机用语言系统,与以往面向“人—人对话”的日常语法系统不同。因此机用语言系统的描写应当纳入计算语言学的研究范围,即完成了“机用语言系统”以后,才能“建立形式化的计算模型”使计算机获得自然语言能力。综上所论,计算语言学可以定义为——利用计算机作为工具研究语言、研究机用自然语言系统、研究语言系统或语言能力的计算性,同时建构基于计算机应用、数学模型、认知科学等相关学科基础之上的语言理论的新学科。姑且图示如下:

工具性:利用计算机研究语言

计算语言学描写性:研究机用自然语言系统

技术性:研究语言系统的计算性

理论性:建构新的语言学理论

虽然计算语言学的关键任务是研究人机之间的语言交际问题,即“如何教计算机学会说话”。但是从本质上来说,研究语言系统或语言能力的可计算性和利用计算机工具来研究语言是相通的,只是前者探索的是适合于人-机对话的语言能力,而后者讨论的是适合于人-人对话的语言规则。

依据目前的语言研究成果和信息处理技术路线,计算语言学包括应用基础研究、应用研究和理论研究三个方面。(陈小荷2001)应用基础研究指语言处理的基本技术研究。现阶段的主要进展是:1.自动分词技术:这是计算机理解自然语言的第一步。目前汉语书面语自动分词的正确率达到95%以上。2.词语特征标注技术:现阶段的词语特征包括词性和义项,这是句法结构理解的基础。两种标注可采用相似的计算模型但后者要复杂得多,目前尚无大规模的实验结果报道。3.语句分析技术:句法结构和语义结构是自然语言理解的关键技术,目前分析真实文本句子的正确率仅在40%左右。4.语料库建设技术:语料库是为特定目的而收集的言语作品集,包括语料处理和检索。研究语句分析需要存放句法分析树的“树库”,但目前的汉语语料库加工程度较低,所建立的树库很少且规模不大。5.语言知识库建设技术:语言知识包括词汇知识、语法知识和语义知识等,事实性和规则性知识分别放在机读词典和规则库中。语句分析技术之所以不能取得突破,主要原因就是目前尚无适合于中文信息处理的大规模语言知识库。

应用研究指自然语言处理的应用工具的研制。现阶段的热点主要有:1.机器翻译工具:半个多世纪过去了,机器翻译的质量仍然令人失望。现在通行的是有限范围翻译和机器辅助翻译。2.自动文摘工具:微软公司的词处理器word有用于英语的文摘功能,哈工大研制的hit-863i型中文自动文摘系统可按用户设定的比例压缩原文。3.自动校对工具:现在存在的主要问题是误报率过高,并且深层错误难以发现。4.信息检索工具:有主题词检索、全文检索两种。前者需要预先有一个主题词表;后者任意字符串都可成为检索对象。另外从语料库中自动获取各种知识的“信息抽取”在线工具的研究刚刚兴起。5.言语识别和言语合成工具:言语识别(或语音识别)可分为词语识别(计算机口语命令)、有限词汇识别(电话订票)和无限词汇识别(将成段说话转为文字)。言语合成(或语音合成)指用计算机将书面语转换为口语即“文语转换”,存在的问题主要是断词不当且语调刻板,仿真度亟待提高。

然而,如果以为应用性特征明显的计算语言学仅仅是技术,则未免失之于偏颇。计算语言学有着相应的理论研究,大致包括人工智能理论(含计算模型理论。目前的人工智能研究,主要还是集中在人工体能、人工技能。在语言能力移植电脑过程未取得实质性进展以前,还谈不上真正的人工智能)和语言学理论两个方面。例如计算机如何或是否可以模拟人脑和语言能力,如何寻找合适的语言计算模型等,就是计算语言学家特别关心的理论问题。除此之外,还有对自然语言本质属性的重新认定、面向信息处理的机用语法学理论、语言系统与数学模型的关系、语言结构和数理逻辑的关系、语言符号的数字化可能性及其局限性、语言的异质性和受限性或语域理论、元语言理论和研究方法等一系列问题。总体而言,一方面,由于牵涉的学科太多,计算语言学的理论研究还相当薄弱,另一方面,与科技发展息息相关的计算语言学不容过多地沉醉于理论探索。计算语言学的强大发展动力植根于鲜明的应用性,必须通过实践推动理论探索。

三、语言系统的计算机模式化要求

从语言学家的立场出发,语言系统的计算机模式化要求,就是要了解计算机需要怎样的语言描写成果,传统语言学(此处指非面向语言信息处理的语言学)的研究是经验描写解释型,而计算语言学的研究是实验操作技术型,自然语言系统要能进行操作技术化处理,首先必须实现语言的计算机模式化。冯志伟(1999,p.215)认为自然语言处理一般应经过三个过程:1.形式化,将所研究的自然语言问题以一定的数学形式表示出来;2.算法化,把自然语言的数学形式转换为算法形式;3.程序化,根据自然语言的算法形式编写计算机程序。侯敏(1999,p.30)认为语言系统的形式化或计算机模式化必须满足三个要求:1.高度抽象化,即从语言现象中抽象出一般规则;2.元语言的形式化,即采取形式逻辑、数学公式、程序语言等形式语言作为元语言;3.运用过程的严密化,即运用过程必须具有数学与逻辑的严密性。

袁毓林(1993)认为形式语言至少具有三个特点:基本单元的明确性、基本运算和基本关系的明确性、运算优先级别的明确性,但是自然语言在这三方面皆不明确。具体而言,1.语法范畴的边界不明,例如语素、词和词组之间、词类之间的界限不明;2.结构关系难以定义,通常所说的结构关系,如主谓、动宾等往往很难明确界定;3.层次关系不外显,人们通常根据语感和语境等来识别结构层次。侯敏(1999,p.36—40)不赞同这种分析,针锋相对地提出:1.可以根据实际需要或应用目的来确立词项或划分词类;2.结构关系分析需要深入到语义平面;3.形式语法已经给出了体现层次的结构树,在分析歧义结构中可加入语义限制,至于有些连人都解决不了的层次歧义结构也不必要求计算机解决。侯敏的观点是“理论追求的是完美,工程追求的是适用”,避开理论困难而采取工程方法,可以建立一个语言分析的近似模型。

所谓“语法范畴的边界不明”,主要是因为这些“范畴”的设置从某种程度上肢解了语言事实;所谓“结构关系难以定义”,主要是因为这些“结构”难以反映语言的本质结构;而所谓“层次关系不外显”,恰恰是语言结构的特点之一。这些探索和争论,实际上反映了三个根本性的问题:1.汉语结构语法学中长期存在的一些困扰,不仅是套用西方语法学框架框范汉语事实所产生的龃龉,而且也是语形语法学自身无法克服的固有问题。几千年来的西方语形语法学研究之所以能够存在,就是因为人脑在发育过程中逐步自建构了与认知能力协同发展的语义结构网络,为语形语法规则提供了语义选择清单与路径。虽然这些语形语法规则在人际交流中可以使用,但是在语言能力的计算机移植中却顿时陷入困境,因为计算机不存在语义网络结构的自建构功能,缺少语义激活路径。根据语形语法规则,计算机造出来的符合自然语句标准的概率极低,多为与对象世界不存在一致性的随机词语串。2.计算语言学所要求的自然语言的形式化,是基于计算机运算模式的语言研究成果。移植进计算机的“定域受限语言系统”和自然语言系统并不完全相等,严格说来,只是一种接近自然语言的计算机模式化符号系统。3.计算语言学的理论和方法,必须建立在语言的本质共性语义性和和计算机数字化运算模式的基础之上。如果对人类语言的认知语义性没有足够的认识,依然安居于语形语法窠臼而迟迟未能建构语义结构网络,语言信息处理的目标则不可能实现。

中国信息科学界有一种看法,计算机对于形态结构的印欧语言处理具有良好的支撑能力,而对中文信息处理则不然(陈力为2000)。之所以计算机对印欧语文信息处理具有良好的支撑能力,是因为印欧语文结构类型便于建立计算机处理模型。从历史上来看,谷登堡印刷术和打字机键盘都是基于字母的简约性而发明的。一方面,字母系统的符号简约性便于进行数据化处理,汉字符号的繁复性难以进行数据化处理;另一方面,印欧语的形态变化为形式化提供了识别标志,而汉语的孤立结构却没有明显的标志。依据现在的计算机处理模型,汉字的繁复性和汉语的非形态性必然导致中文信息处理中存在一些特殊问题:1.中文信息处理的第一个“瓶颈”。汉语的常用汉字数量繁多,汉字需要解决键盘输入、内部代码、汉字识别和显示、程序语言的数据类型、数据库的排序和检索等一系列问题。2.中文信息处理的第二个“瓶颈”。印欧书面语采取词分写形式,而汉语书面语采取单字连写形式。由于采用西方词法学框架,因此必须研制自动分词技术。假定考虑以“字”和“字义块”等作为汉语的结构单位,自动分词技术将相应改为“字义块”切分技术。3.印欧语的同音词较少,而汉语的同音字较多,同义词和量词也十分丰富,这些都给中文信息处理带来必须解决的难题。4.印欧语可以借助实词的形态变化即在词法层面上进行处理,汉语只有在句法和语义层面上进行处理,需要把语序和虚字的语法信息归纳出来再让计算机掌握。5.印欧语的句子结构是以动词性词语为核心的“主—谓”结构,而汉语的句子结构是以体词性词语为核心的“话题—说明”结构。印欧语的句子结构划一而句界分明,汉语的句子结构多样、成分缺省并且前后句义缠绵。

如果说语言系统是一座“冰山”,那么以上这些语言信息处理中遇到的难题还都是语言系统浮在海水上面的那一小部分,真正的障碍是隐没在海水下面的那一大部分。无论哪一种结构类型的自然语言系统的计算机模拟,包括形态语言,迟早会无可避免地碰撞上坚硬实在而又难以捉摸的“语义结构”。语言研究需要敢于在冰海下持续探索“语义结构”的潜水员。从自然语言系统来说,要让计算机理解语言通常认为必须使电脑能够解决三个问题:1.消除自然语言的一词多义;2.揭示自然语言的潜在意义;3.掌握自然语言的联想推理。这些问题都离不开语义分析,而语义分析技术尚处于探索阶段。(侯敏1999,p.247)对于第一个问题,一词多义可给出不同义项的清单。对于第二个问题,给出每一义项的显性和潜性语义特征清单。对于第三个问题,给出义项或义场之间的语义关联模式。由此可见,必须在以往的经验语感法和先验演绎法基础上,引进实验归纳法和结构优化法,消除语义“泥潭”情结,潜心于冰海中的语义“冰山”,才能逐步建构造语义结构网络。

就世界各种语言来说,语言的计算机理解的深层次难点可能还在于:1.至今尚未揭示出人类理解语言的机制,计算机只能局部模拟自然语言理解的某些简单过程;2.至今尚未完成人类理解语言所凭借的知识系统,建立人类进行语言表达的完整理论,计算机尚无从掌握人类语言的知识系统以及语言表达机制;3.至今尚未对人类语言所兼具的规则性和离散性、精确性和模糊性做出定量和定性的系统分析,计算机尚无从掌握语言系统的复杂性和语言使用的随机性。(傅永和1999,p.238—239)既然语言的理解和表达是一个以知识系统为基础的综合,因此语言系统的计算机模拟必须进行跨学科的研究,特别需要语言学、计算机科学、数学和认知科学以及百科知识学者的合作。与侧重于面对自然人语言学习的语形语法学不同,如果面向语言信息处理,那么就需要以计算机智能模式来重新确定语言学的理论基础、研究重点和研究方法。

面向自然语言处理的计算语言学理论基础,目前主要有基于语言规则性的理性主义理论(即先验主义)和基于语言随机性的经验主义理论。依据理性主义的语言学理论主要有:短语结构语法(psg)、扩充转移网络(atn)、配价语法(vg)、格语法(cg)、范畴语法(cg)、概念从属理论(cd)、多叉多标记树形图分析法(mmt)、词汇功能语法(lfg)和蒙塔古语法(mg)等。这些理论和方法,因为从“理性”出发,因此不可能反映以感受性为基础的自然语言的真实面貌,其缺失已经日益明显。为了克服理性主义理论的不足,采取经验主义理论处理大规模真实文本的语料库语言学应运而生。在收集语言资源或建立语料库的基础上,运用统计方法进行语言信息处理,语言交际过程的随机性由此得到关注。面对传统语形语法学对自然语言过程的不相适应和语义研究的复杂性,甚至有人尝试撇开语言学家的语言研究,以借助语料库逐步实现自然语言系统模拟。虽然借助语料库可以解决语言信息处理的一些问题,但是仅仅依赖语料库实现自然语言系统模拟注定此路不通。因为自然语言不是一个语料仓库,而是一个语义和语形复合性结构系统。无论是理性主义还是经验主义,都必须意识到:语言信息处理中所处理的是定域受限语言。这一研究的理论基础既不应是纯粹基于语言规则性的理性主义,也不应是完全依赖语言随机性的经验主义,而应是突出语言受限性的实验主义。世界语言学的发展经历了从经验科学到先验科学的漫长过程,计算机的发明必将促使当代语言学成为一门实验科学。强调计算语言学的实验主义,并非一概否定理性主义和经验主义,而是要在实验主义的基础上运用理性和经验的理论方法。

自然语言处理的语言理论,目前主要有基于语形的语言理解系统和基于语义的语言理解系统。前者是以语形语法研究的成果为出发点,从句法形式入手;后者是以语义研究的成果为出发点,从语义关系入手。两种理解系统在文本输入、预处理和自动分词等早期环节上基本相同,不同的是基于语形的理解系统先进行词法和句法分析,后进行语义和语用分析,基于语义的理解系统先进行语义分析和语义结构生成,后进行目标语的形式组合。生成语义学认为句子的句法特点取决于语义,语义部分才具有生成能力。认知语义学把意义看作一个植根于知识网络和信仰系统中的认知结构,理解一个语言形式的意义必须激发相关认知领域中的其他认知结构。既然语形结构只是语义结构的表层投影,既然基于语义的理解系统才符合语言的生成机制,既然语义处理才是语言信息处理的关键,那么只有基于语义的理解系统才能满足计算机对自然语言的理解和生成。

李葆嘉:论语言科学与语言技术(下)

四、人脑语言和电脑语言的性质异同

根据与“人脑语言学”的对应关系,计算语言学也可以称之为“电脑语言学”。从人脑角度出发,电脑语言学的研究是将人脑语言系统移植电脑工具的电子工程;从电脑角度出发,电脑语言学是电脑程序模拟人脑语言能力的仿生工程。

不管是系统移植还是能力仿生,首先必须认识到人脑和电脑的异同。1.构造机制的不同:人脑是生物神经系统,具有生物认知机制,而电脑是电子计算系统,具有电子运算程序。2.伴随情感的有无:人脑具有驱动感觉、思维和表达进行的情感性,而电脑只具有执行程序运算的机械性。3.经验基础的有无:人脑具有以感受性为特征的经验基础以及知识系统,而电脑即使配备了一定的知识背景,也不可能具有人脑一样的认知经验基础。4.认知理性的异同:人脑的感受和认知可以区别为非语言层次和语言符号层次,非语言层次包括直觉和感觉,语言符号层次包括知觉(游移性印象)、象觉(清晰性意象)和统觉(逻辑性抽象)。电脑的认知理性只能够定位于语言符号的象觉和统觉层次,难以具备丰富的认知层级系统。5.交流对象的异同:人脑的交流对象分别为对象世界和人际关系之间,具有交流的二重性;而电脑的交流对象只有执行程序的人或“人—机对话”的一重性,所谓“机—机对话”的实质仍然是“人—机对话”的连网,互联网交流仍然是执行者之间的交流。由于计算机永远不可能直接认知人所面对的对象世界,必须以人类的认知为中介,因此计算机永远不可能超越人类的智慧,计算机统治人类世界永远是一种不必要的担忧。

其次,必须认识人脑语言系统和电脑语言系统的差别。人脑语法或自然语言法则是在历史上逐步形成的,具有随机性、规约性、类推性和耗散性特点;而电脑语法或机用语言法则只是自然语法的再抽象化和再规范化,具有受限性、是否性、程序性和封闭性的特点。即使将来研究出适合于语言信息处理的机用语法,也不等同于自然语法。电脑所能获得的语言能力,只是自然语言的一部分或有限语言能力。因此,移植进电脑的语言系统必须进行界定:1.定域化语言:因为人脑语言是一个可以分为不同语域的复合性层级系统,所以必须首先确定电脑语言与人脑语言的对应层级,最佳选择就是规范性的日常语域。2.受限化语言:只能采取有限网络模式,才能将自然语言裁剪成适合计算机运算模式的机用语言。3.形式化语言:必须将定域受限语言的语义结构和语形规则分别形式化。4.算法化语言:借助一定的数学模型,将形式化语义和语形系统数字化。5.编程化语言:依据一定的程序语言,将数字化语义和语形系统编程化。

语言信息处理的目标,就是在受限性语言层面上逐步实现人—机对话。归根结底,自然语法≠电脑语法,电脑语言系统是通过建立形式化的计算模型进行处理的定域自然语言系统。电脑的运算速度可以远远超过人脑的思维速度,但是电脑不可能具备人的能动性认知行为。语形语法学面对是人—人对话,人们在语言习得过程中不知不觉地形成了建立在认知能力之上的语义结构网络,为语形语法规则提供了一份语义可选性清单。语言信息处理面对的是人—机对话,而语言“白板”的计算机并不具备这份语义可选性清单。语形语法规则,在教计算机如何说话的过程中顿时陷入困境。几千年来的西方语法学之所以能够延续下来,全赖人们具有基于认知能力的语义结构网络的自建构功能。反之,正是这一语义结构网络的存在,致使以往的语言学家误以为语形语法就是语法的全部或主要,而将语义结构法则长期放逐出语法学领域。

自然语言系统的计算机处理对西方具有两千多年传统的语形语法学提出了根本性的挑战,也为东西方语言学的合流带来了新的契机。回顾20世纪东西方语言学合流的历程,之所以出现西方语法学框架和汉语事实的错位,是因为合流基点的选择陷入误区。西语具有丰富的语形结构(这里指形态变化)而汉语基本没有(汉语主要依靠语序、虚词、韵律和语气,另外对语境或语用具有极大依赖性)。选择建立在形态变化基础上的西方语法学框架作为合流的基点,必然导致这一过程的曲折。反思的结果显示,东西方语言学合流的基点应当是建立在人类语言所共有的语义结构基础上的语义语法学理论。随着对语言能力研究的进一步深入和语言信息处理对传统语言学的挑战,传统语义研究在新的形势下得以复活。随着世界语言学从20世纪60年代以来出现了从语形研究向语义研究的转移,东西方语言学研究的合流将在新的基点上逐步实现。

五、面向语言系统模拟的语义语法学

尽管乔姆斯基理论认识到语言形式化的重要性,但生成语义学才是语言研究本体的转向。虽然配价语法和格语法的引进和对汉语语法意合性的认定,促使语义句法研究成为当代中国语法学界的热点,但迄今为止,中文信息处理应用系统自觉而全面地运用语义研究成果的鲜见。这一现状的表象似乎是语义研究成果不多,其根源却在于没有彻底认识到——必须从人类(不限于印欧族群)普通(不限于欧洲唯理主义)语法(不限于形态语言)的高度,来解决语言理论和研究方法的创新。无论是语言信息处理,还是语言机制揭示,汉语研究都需要既能反映汉语个性又植根于人类语言共性的原创理论。

人类的认知表现为对象世界的符号化(认知对象的符号化形成语义单元)、范畴化(语义单元的范畴化形成语义类别)和关联化(语义类别的关联化形成语义结构)。西方语言中的词法范畴原型是先民通过语音形式所表现出来的认知范畴或语义类别。语言的形态标记性、单位分布性和结构层次性都是语义类别关联化在表达层面的投影或者制约。一方面,随着人们认知的发展,反映原始认知足迹的形态范畴(如原始生物观的“性”、原始计算法的“数”)的价值日益消解;另一方面,随着语言系统的演化,表现原始认知足迹的语法手段又不可避免地合并、弱化和丧失。语序、功能词等手段的补偿,导致语言结构类型从综合型向分析型方向嬗变。这一过程证明,原始词法范畴在句法结构中并不具有充分必要性。一种语言可以没有词法形态变化,但不可能没有语义结构规则。不同的自然语言之间之所以可能互译,其基础就是存在可互通性语义,尽管结构类型迥然不同。(李葆嘉2001)

由此可见,人类语言的本质属性是语义性,其他属性都是语义性的派生。人类语言的共性可以概括为:在人类感知对象世界的过程中,神经机制依据象似性模式促使对象世界语符化,音义一体化的语符具有实体性和范畴性,由此组成的语义结构具有语境性和关联性,语义结构的语境性表现为语用、语义结构的关联性投影为语形,而语义结构模式具有生成性。图示如下:

神经机制语义实体语境-语用性

象似性认知过程语符语义结构生成性

对象世界语音范畴关联-语形性

在自然语言能力移植工程中,计算机需要的是具有语言本质共性的语义结构网络,由此有必要首先建构语义语法学。所谓“语义语法学”不是“语义+语法的学”,而是以语义为研究对象的语法学。把语义结构的表层投影——语形作为语法研究的纯正对象,有悖于语言结构的真实本体。乔姆斯基试图在语形结构进行数理化描写的基础上,建构反映语言能力的生成语法体系势必捉襟见肘。这一初始思路必然导致“抛开语义——深层语义——语义解释——逻辑表达——逻辑式”这样的“不断革命”。虽然乔姆斯基强调语言研究的目的在于揭示语言天赋,但依据其理论思路:普遍语法(研究对象)——语言能力(哲学基础)——自然主义(学科性质)——数学方法(方法借鉴)——符号描写(形式载体)——形式语法(研究成果),显然缺少人类天赋中最关键的认知性语义能力这一环节。完全排斥语义的经典理论阶段,其句法结构规则必然导致生成出一批语言事实中并不存在的语符串。即使在不得不引进语义解释的标准理论阶段,也没有放弃把形式结构作为句法生成的基础规则。然而,任何脱离语义的语法形式化注定流产,不可能达到揭示语言生成机制或普遍语法的目标。

如果说语义语法学的语言观强调人类语言的本质共性是语义性,那么语义语法学的语法观则突出语义结构是语法的主要研究对象。在欧洲传统语文学中,“语法”主要指基于形态变化的词法和句法规则。在历史比较语言学时代,“语法”包括语音法则,因此才有“青年语法学派”之称。20世纪的结构主义和描写主义促使“语法”研究的对象日益窄化。依据语言是音义符号系统这一论断,所谓“语法”即语言结构之法,当包括语音结构法和语义结构法。在语言系统的第一次划分中没有通常所说的“语法”即语形结构法的位置。语形结构是语义结构的表层投射或制约,语形结构法依附于语义结构法。语言系统的音义二分以及相关研究学科,图示如下:

语音分析(生理语音学、物理语音学)

自然语音解析

语言(语音学)语音结构(音位系统学、语流节律学)

符号语形结构(语形语法学)

系统语义投影聚合性义场(词类)

(语义学)语义结构(语义语法学)

组合性义场(句模)

以往的“语音、词汇、语法”三分法,迷糊了研究者的视线。虽然语形语法研究在语言交际和语言教学中具有一定或者相当用途,但是从研究角度而言,却避开了关键的语义结构法则。

人类认知的本质是对世界图式的语义符号化,人所认识的世界就是存在于语言符号系统中的世界。语义结构网络表现为“实体范畴化”(聚合性义场)和“关系模式化”(组合性义场)的相互交错。广义语义不仅包括实体范畴化的词汇语义和关系模式化的结构语义,而且包括语境范畴化的语用语义。语法的真实本体或语法研究的切实对象应当是语义范畴及其关联模式。结构语法和生成语言的不同之处,在于前者强调“语言系统”,而后者强调“语言能力”,但其共通之处却在于皆以语义结构的虚象——语形作为研究实相,始终游离于语法真实本体之外。依据语形语法学的有限范畴和简略框架(词类划分、语形成分、短语结构、句子成分等),既难以深入分析句法结构,更不可能有效驾驭语言结构的生成机制。从表达来说,语义编码是一切语言编码的基础,要揭示语言的奥秘必须从语义入手。语形型语言(并非只有语形,而是语形隐含或遮蔽了语义语法)和语义型语言(并非没有语法,而是没有形态变化语法)的研究基础,都应是语符的语义性。语义语法学的语法观突出语义结构,表面上突出汉语的个性特征,实质上受制于人类语言的本质共性。关于语形型语言和语义型语言的大致异同,图示如下:

语形型语言:形态手段

语义范畴——语义网络(知识世界)——元语言(日常认知)

语义型语言:非形态手段版权所有

人类的语言符号系统,本质上是一个意义隐喻系统。作为人类认知基本能力的隐喻,其更深层次是源于动物性感受的模仿(基于事物的相似性)与借代(基于事物的相关性)这两种认知能力。关于语言符号系统的形成大致流程,图示如下:

神经机制情绪模式

认知机制具体感受元语言(日常认知)——语义网络(知识世界)

对象世界经验框架

西方语法学源于古希腊的“语言·哲学·逻辑”混沌母体,西方哲人的逻辑研究基于思辩性语言活动。因为逻辑的基本单位是概念和命题,因此人们往往把注重语义的语法研究混同于逻辑的研究。汉语实词的义类划分不是根据逻辑意义,而是借助日常语义;汉语句读之间的语法关系不是根据逻辑关系,而是遵循事理关系。虽然逻辑规则是语法规则的部分再抽象化,但泛逻辑主义却致使人们误以为语法规则都可以逻辑化。自然语言首先具有本能传情性和日常认知性,语言结构法则主要依据广泛存在于日常生活中的事理关系。这一事理关系包括:时序先后性、空间位置性、主观因果性、主观目的性和评估好恶性等等。不是日常语法以思辩逻辑为基础,而是思辩逻辑以日常语法为基础。同样,虽然可以借用数理符号转写具有算法性的语言结构法则,但不可把语言法则混同于数理逻辑规则。

语义语法学的技术路线,是从建构现代汉语元语言系统到建构现代汉语语义网络。虽然自然语言信息处理依赖于语义结构的形式化,但是一些语言学家往往视语义研究成果为“非语法”,并且对其形式化的可能性持怀疑态度。一方面语义单元不具备语形变化的显著标记,而包含较多的意会性;另一方面语义单元并非没有范畴标准,也具有感受或认知的一致性。所谓语义的客观性和主观性就是语义的集体认同性和个人联想性,其本质是个体使用的“素单位”和集体认同的“位单位”之间的矛盾。语义语法学的研究对象首先是具有集体认同性的“义位”(标准体),然后才有可能是仅具个人使用性的“义素”(义位变体)。尽管语义单元或语元数量众多,语义结构关系复杂,但它们以潜在的元语言系统为基础。语义结构网络由语元实体和语义关系组成。同类语元之间具有聚合性语义关系,异类语元之间具有组合性语义关系。换而言之,每一语元都具有两种互相制约着的语义关系,一是同一义场内的各个“义位”之间的“义征”(语义特征)异同,一是不同义场的“义位”之间的“义联”(语义关联)异同。由此,可以依据义征和义联的异同而建立聚合性义位系统和组合性义联系统,在两者基础上在编织语义结构网络。句法结构的形式化应当是语义结构的形式化,而语义结构的形式化就是义场关联模式。

现代汉语语义语法的基础研究是建立“现代汉语元语言系统”,这一研究可比喻为“语言基因图谱分析工程”。其研究思路是:首先归纳出现代汉语词典中用于释义的最低限量词汇,以建构释义元语言系统;其次依据日常语言交际和语言教学中的用词,参照释义元语言以建立词汇元语言系统;再次抽象出义征范畴以建立析义元语言系统,完成语义标记集。在以上成果基础上,一方面可以结合认知心理学和神经语言学的成果进一步研究认知元语言系统,另一方面可以依据语言信息处理的要求,建立机用元语言系统。(李葆嘉等2002)

在现代汉语元语言系统这一基础性工作完成以后,才可以逐步建构现代汉语语义结构网络。研究程序和主要方法大致如下:1.义征对比法。依据有限网络模型,借助析义元语言系统对义元进行形式化描写即标注义征。给出义元在义场内的语义特征,其目标是建构聚合性义场。2.义联配比法。依据有限网络模式,对语义符号的配比关系进行形式化描写即标注义联,在分析和描写过程中归纳出关联性元语言系统和语义结构关联框架。语义句法的本质是相关义场之间的配比,因此义联标记体现着义场配比。给出义场之间的语义选择或语义制约规则,其目标是建立组合性义场。3.语形标记法。汉语具有词序、虚词和韵律等形式手段。韵律手段属于语音句法,可姑且不论。汉语的语形大致可以概括为两种:附着在词或词组上的词语级语形是完构成分;附着在句干上的句子级语形是完句成分。在进行汉语语形范畴化研究的同时,寻找语义关联和语形成分之间的对应性,然后对语形系统进行层级性形式化描写。4.合成建构法。在义征、义联和语形研究成果的基础上,通过相关标记的合成以建构语义结构句模系统。

“语言能力移植工程”的语言学部分主要是语义结构网络研究。通过建立形式化的计算模型,可以将语义结构网络进一步形式化、算法化和程序化。语义语法系统研究的每一结果,都可以也应当用计算机操作作为验证。以往的语法学研究,除了执著于语形研究以外,还有一个根本性的缺憾,就是不具备自然科学研究中的实验手段,因此难免经验性、臆断性和游移性等。采取计算机作为研究和验证手段,从而使语法研究具有鲜明的技术性和可证伪性。人们常说,只有学会一门外语,人们才真正了解自己的母语。与此同理,只有计算机掌握了自然语言,人类才深入揭示出自然语言的奥秘。换而言之,根据语言学习对象的不同,可能存在三种教学语法:一种是母语教学语法(着重于语形语法,因为人类对语义结构网络和语言知识库具有自建构能力),一种是对外语言教学语法(需要在语形语法的基础上增加与语言理解相关的社会文化知识,因为不同语言的语义结构网络具有不同的文化性),一种是计算机模拟语言能力的语法(需要语义语法和语言知识库,因为计算机不具备语义结构网络自建构能力以及与语言理解相关的知识系统的自学习能力)。也只有揭示出语义结构网络,语法学研究才能够在语形语法研究的基础上取得全面突破,语法形式、语形语法意义和语义语法意义,才能够全面贯通。

尽管语义研究及其形式化相当困难,但是在语义语法学理论的指导下,根据定域(语言定域)、定量(词语定量)、定性(义元定性)、定式(义联定式)的“四定”原则逐层实施,自然语言的理解与生成有可能在单句模式系统中首先实现。只要对语言本质的探索和人脑语言移植电脑的目标不变,就必须穿越语义研究的沼泽地。如果说20世纪是语形语法学的世纪,那么可以预言21世纪将是语义语法学的世纪。

六、语言科技复合型人才的培养

自然语言的计算机理解和生成已经成为国际语言学研究的聚焦,语言信息处理的技术水平已经成为当前衡量一个国家现代化水平的重要标志之一,尽快培养兼通语言学、计算机科学、数学和认知科学的复合型人才迫在眉睫。据《美国计算语言学杂志》1986年统计,全球设置计算语言学博士学位的大学已有105所,其中美国63所。在英国曼彻斯特大学已有计算语言学的学士和硕士专业。(侯敏1999,p.27)

中国的机器翻译在20世纪50年代启动,但由于反复不断的政治动乱停滞了近20年。1981年,成立了中文信息学会。1987年,隶属于中文信息学会的计算语言学专业委员会成立。通过计算机专家和语言学家的努力,已经取得语言信息处理的一系列成果。但迄今为止,中国大陆计算语言学方向的研究生的培养,或附属在汉语言文字学、语言学及应用语言学学位点,或附属在计算机应用等学位点,专门性的本科专业迄今尚无设置。根据目前中国高等教育学科体系,一方面,语言学和计算机科学分属不同专业,兼通语言学和计算机科学人才的培养如隔重山;另一方面,“中国语言文学”学科中,作为学术或准科学的“语言学”在前而作为艺术或教化工具的“文学”为重,两者始终捏而不合。

推荐期刊