优秀的毕业设计论文网
计算机 JAVA 电子信息 单片机 机械机电 模具 土木工程 建筑结构 论文
热门搜索词:网络 ASP.NET 汽车 电气 数控 PLC

数据库智能查询接口的实现—录取分数查询

以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用.
  
资料介绍:
摘???? 要 本文深入研究了自然语言处理的基本知识和原理,把自然语言理解与数据库技术结合起来,利用visualc++6.0开发工具设计并实现一个数据库智能检索接口系统—录取分数查询。据据库采用Access,利用Ado实现了数据的存取。 关键词: 智能检索接口系统,自然语言处理,Ado,VC++6.0 数据库自然语言界面的关键技术研究 1.3.1领域知识提取处理 ----让系统自动或半自动地实现领域知识的提取,从而建立起专用词典,这是实现系统可移植性的重要步骤。在很多NLIDB系统中都采用了提取技术。 ----领域知识提取处理的好坏不仅影响到系统的可移植性,由于它的生成结果是词典,因此也将影响到系统的可用性。好的提取方法必须能充分减少用户负担,增强自动生成能力。 1.3.2自然语言查询处理 ----大部分数据库的自然语言界面,其处理过程大致可分为五个阶段:自然语言分析阶段、查询生成阶段、查询执行阶段、结果加工阶段和语言转述阶段。 ----自然语言分析阶段是自然语言界面系统的核心,其主要任务是进行语法语义分析。对此,自然语言处理有不同的策略,有面向特定应用领域的分析方法、面向通用领域的分析方法、面向数据库应用领域的分析方法。前两种方法一般比较常见,第三种方法我们认为是一种更适合数据库自然语言查询处理的方法。首先它以数据库查询为具体的语言对象提出相应的处理方法,采用语法语义合一的思想,简化通用方法的累赘。 ----上述处理框架也被称为是一种基于中间语言的处理逻辑。它的最大好处在于具有比较好的可移植性。由于有了中间语言,当系统架构于不同的DBMS之上时,只需对其中的查询生成和查询处理模块做必要的调整即可。其实查询生成和查询处理模块若是基于数据库标准SQL和ODBC,则基本可以做到无代价移植。 1.3.3自然语言查询中的知识处理 ----自然语言查询的最大特点在于它是基于现实世界的概念模型即领域知识而提问的。因此,自然语言查询的问题不单单是从数据库中找出现成的数据,而且要查出非现成的数据,即知识。前者若称为直接性查询,后者则可称为间接性查询。要想正确理解间接性查询,必须借助领域知识才能完成。对直接性查询,当出现歧义时,也必须用到知识加以处理。知识在自然语言查询处理中的作用远不限于此,概括起来有以下三方面内容:领域知识在解释查询中的重要性、领域知识在回答查询中的重要性、用户模型的重要性。 1.3.4自然语言更新处理 ----自然语言更新处理在某种意义上讲要比自然语言的查询更难处理。其困难在于,更新操作要改变数据库的内容,而如何改变是与数据库的具体结构有关的。就关系模式来讲,是与表的结构和表的参照关系有关的,而自然语言用户的最大特点是不用了解数据库的结构。这一矛盾会导致更新操作出现一种歧义性现象,这种歧义不是来自用户的表述,而是来自数据库底层对一个请求有几种不同的更新方式。因此,对一个自然语言更新所潜在的问题是实现上可能存在多个数据库更新操作,称为候选更新(CandidateUpdate)。 1.3.5受限自然语言的处理 ----目前,NLIDB都只能处理自然语言的一个很小的子集,因此,用户在使用自然语言查询时要受到很多限制(即受限自然语言),而这些限制对用户来讲是不明确的。解决受限自然语言的途径有两个方面,一是改进处理方法,增大可处理的语言面,我们称之为主动性方法;另一方面是在不降低表达能力的情况下,能以一种清晰的方法告诉用户语言的受限范围,从而减少用户出错的情况,我们称之为被动性方法。显然后一种方法简单易行,而且系统实现也可因此大大简化,但它不是解决问题的积极方法。 1.3.6对现存问题的解决 ----为解决数据库自然语言界面中存在的问题,目前技术研究主要朝以下三方面努力: 增强系统的可移植性;扩展系统的语言范畴;扩展系统的概念范畴。 ----其实这三方面内容的解决是紧密缠绕在一起的。如领域知识提取技术既增加了系统的可移植性,也是解决另两类问题所必需的。就目前技术来看,对可移植性问题的解决比较充分,如体系结构、词典组织、领域知识提取都在一定程度上解决了领域的独立性;基于中间语言的分析框架解决了DBMS的独立性。 ----受限语言的处理方法(受限语法和界面生成)可以在一定程度上解决范围失配问题,但这不是从根本上解决问题的方法。我们认为在系统中增加知识的运用是解决后两类问题的关键。 1.4数据库自然语言界面研究展望 ----我们认为,目前首先要解决的是研究方法问题。传统的研究方法在走两个极端,从事自然语言处理的人认定NLIDB的核心技术是“自然语言理解”,而搞数据库的人则总是不能跳出原有数据库查询的圈子,只能给出其实不需语言处理的菜单构造界面。我们认为,在研究方法上应定位于以数据库语义为中心的思想。NLIDB处理的是数据库这一特定领域的语言问题,它的直接处理目标是将自然语言表述的查询转换为数据库查询。如何将自然语言查询与现存的数据库语义信息结合,是解决这一处理目标的关键。基于此,我们提出了基于数据库语义的一整套语言处理逻辑来解决NLIDB的一些关键问题,如基于数据库语义的自动分词、句法分析及数据库查询转换,设计实现了一个自然语言查询系统NChiql,对可移植性体系结构、领域知识的自动提取、中文自然语言查询分析处理、受限中文查询语言的设计实现与评估、智能界面管理等方面进行了多方位全面、系统的深入探索。NChiql原型系统具有良好的可移植性、可用性、可适应性、鲁棒性和智能性,它采用三层结构,可以直接嫁接在不同厂家的DBMS引擎上。 ----计算机处理自然语言的能力远未达到人们的想像和期望,自然语言界面的可用性也远不及图形界面等其他类型的界面。人们不得不问,为什么还要研究自然语言界面?目前,图形界面虽然在直观友好方面比原先的字符界面大大改进了,但使用者仍需要将脑中所想的(What)转化成如何操作(How)来完成任务的执行步骤。而新一代界面应该是MTM(MindToMachine)型,即将脑中所想的直接提交给机器来完成,人们只需关心What,而无需关心How。具体的有语音、手势、虚拟空间等操作计算机的方式,而语音、手写等交互方式都是以自然语言理解为基础的。人们不断追寻着这一梦想,但这需要计算机科学、语言学、思维科学等各学科的共同努力,相互促进,不断地将各学科的成果融合起来。 1.5中文分词技术 1.5.1中文切词 - 基本介绍  众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子I am a student,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白「学」、「生」两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。我是一个学生,分词的结果是:我 是 一个 学生。