课程设计论坛

注册

 

QQ登录

只需一步,快速开始

发新话题 回复该主题

[硕士论文] 硕士学位论文-应用于中文人名搜索引擎的Web信息提取技术研究 [复制链接]

楼主
文件格式:NH
文件大小:2.15MB
适用专业:计算机软件与理论
适用年级:研究生
下载次数:6 次
我要下载:点击联系下载
论文编号:7954

资料简介:
硕士学位论文 应用于中文人名搜索引擎的Web信息提取技术研究,共51页
摘要:Web信息提取是指从Web文档中自动提取出所需信息的过程。本文研究Web信息提取并应用于面向主题的搜索引擎中,这里的主题是针对于中文人名的查找。 本文主要的工作是针对有关Web上中文人名的信息,研究Web信息提取技术,设计搜索引擎中的信息提取模块,并进行实验测试。本文从网页内容中提取关于人名的四个属性(出生年份、职业、相关地点、相关机构)。 论文中详细说明了信息提取模块的系统流程设计和流程中各个子模块的实现方法以及使用到的具体技术。针对不同的人名网页内容类型,本文使用了相应的提取模式的方法。对于“个人介绍类”网页,本文使用了知识工程方法(Knowledge Engineering Approach),人工构建了模式库;对于“个人活动类”网页,本文使用了自动训练方法(Automatic Training Approach),提出了一种新的模式提取算法,用来自动地从训练集中提取模式。最后针对Web上的某一中文人名网页集进行信息提取实验,实验证明信息提取模块的处理效果较好,能够从网页文本中提取出比较准确的信息。
关键词:信息提取; 搜索引擎; 模式匹配;


资料文件预览:
共1文件夹,1个文件,文件总大小:2.15MB,压缩后大小:2.12MB

  • 硕士学位论文-应用于中文人名搜索引擎的Web信息提取技术研究
  • NH应用于中文人名搜索引擎的Web信息提取技术研究.NH  [2.15MB]

我要下载:硕士学位论文-应用于中文人名搜索引擎的Web信息提取技术研究
分享 转发
TOP
沙发

轻轻的我顶了你一下

悄悄的我拿走了积分
TOP
板凳

ding
TOP
地板

顶!
TOP
5#

这个系列的帖子都不错

要顶!

收藏再看!
TOP
6#

...

一日,某君的老婆生小孩,他急急忙忙跑到医院看望,等了n个小时,产房里传来了哭声,他高兴大喊,我做爸爸了!这时医生满脸愁容走出来,告诉他,小孩子先天畸形。某君呆在那,还没明白什么原因,忽然产房里传来了他老婆的喊叫:都怪那天杀的,看贴老不回贴,报应呀 99%的人看完后当场含笑而死.....如果你没有倒地那你就是1% .
TOP
7#

好啊!~

我正需要呢
TOP
8#

刚来论坛,没有那么多钱啊啊
TOP
9#

顶你啊,我明天就要交了
TOP
10#

TOP
发新话题 回复该主题