最新更新
 
您现在的位置:主页 > 新闻中心 > 校园新闻 >  
增强相关词匹配
发布时间:2018-08-14 04:41  来源:未知  点击量:
  2.2增强相关词匹配
 
  相关词的界定很难由程序自动判别,由于相关词有客观构成,也有片面构成。如:电脑与核算机、computer为客观相关词,而电脑与微软、冯•诺依曼则为片面相关词。客观相关词为实践存在,为大多人所共知,而片面相关词需求在特定的条件下树立,人们经过“电脑”能够联络到软件巨头“微软公司”或核算机科学家“冯•诺依曼”,需求必定的常识延展性,乃至“电脑”能够延伸到“核算器”,不同的用户有不同的知道。因而,片面相关词具有必定的不断定今期瞎子摸单双性与笼统的特征。增强相关词匹配可经过添加相关词字段或树立相关词库的办法来完结。相关词的匹配触及匹配的深度和广度,越全面、精准则其投入本钱越高。添加相关词字段。指经过在数据表中添加“相关词”字段,当用户在添加信息时,输今期瞎子摸单双入与此信息的相关词。相关词的界定及输入由信息修正者进行操作,选用添加相关词字段的办法来前进相关词匹配,其完结办法简略,操作进程也简略,但相关词的界定由修正者断定,相关词的个人片面性较强。树立相关词库。指经过树立相关词库表,当用户输入查找要害词时,体系自动在相关词库表今期瞎子摸单双中查找其相关词,一同归入要害词中进行处理,对查找的有用性有很大的前进。当用户输入查找要害词时,体系将自动遍历搜要害词的相关词,到达相关词匹配的意图。树立相关词库的办法,其相关词并非由修正者个人界定,而且相关词能够灵敏调整,不断补偿。因而,树立相关词库的办法愈加全面、客观,但构建一个完善的相关词库需求较大的投入。添加相关词字段与树立相关词库两者各有优缺陷,但两者并非敌对。在一单个系中,能够一同选用这2种办法或许其间之一以增强查找相关词匹配,前进查找有用性。详细施行计划还需求考虑到实践需求和投入本钱预算。
 
  2.3增强查找容错性
 
  在查找的进程中,用户对查找要害词的输入具有不断定和冗长等特征。不断定首要指要害词的选词不断定和要害词的是否正确不断定,而冗今期瞎子摸单双长指用户输入的查找要害词包括剩余的信息。假设体系的查找进程未对用户输入的查找要害词进行剖析和处理,那么,今期瞎子摸单双其查找效果将有可能得不到用户所需求的数据。从查找易用性与有用性的视点动身,查找功用有必要具有必定的容错性。要增强查找的容错性,就需求处理查找要害词的不断定与冗长的特征。将查找要害词按必定的规矩进行拆分今期瞎子摸单双,简称分词。将长词转化为短词,并舍去重复的部分,能够前进查找相关词的匹配,下降长词中错词、别词的构成,然后前进查找的容错性。分词查找能够在必定程度上处理查找的容错要求,前进查找的功用与精确度。分词技能首要分为3种:(1)字符串匹配的分词办法。字符串匹配的分词又分为4种,别离是:正向最大匹配法、反向最大匹配法、最短途径匹配法、双向最大匹配法。(2)词义分词法。词义分词法依据机器语音进行分词判别,经过对句法、语义的剖析,运用句法信息、语义信息进行分词。但词义分词法现在还不老练,尚处于查验阶段。(3)核算分词法。核算分词法依据词组的核算,针对相邻的字呈现的次数多少,断定词的重要程度,作为要害词的分词分隔符。盘古分词作为一种分词组件,大大下降了体系进行分词查找的投入本钱,防止重复造车的现象,十分便当运用在依据.NET技能进行开发的体系中。
上一篇:数据库办理体系本身具有了
下一篇:跟着网络科技和核算机技能
 
 
Copyright (c) 2015 WWW.whptu.ah.cn  All Right Reserved.   版权所有:芜湖高等专科学校
   您是第287597位访客123456789101112131415161718192021222324252627282930