- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
自动赋词软件设计报告 - Read
目 录 一、引言 2 (一)概念描述 2 (二)背景分析 3 二、软件设计 4 【问题定义】 4 (一)课程设计描述 4 (二)软件设计定义 4 【可行性研究】 5 (一)经济可行性 5 (二)技术可行性 5 (三)操作可行性 5 【需求分析】 6 (一)概述 6 (二)数据描述 6 【总体设计】 8 (一)系统设计 8 (二)结构设计 8 【详细设计】 10 (一)算法分析: 10 (三)代码设计 10 【测试运行】 15 三、软件说明 15 【软件名称】 16 【版本号】 16 【开发人员】 16 【系统不足】 16 【参考文献】 16 自动赋词软件设计说明书 02信息管理与信息系统专业课程设计第三组 指导老师:罗龙艳、秦军昌 【摘要】为了确保软件质量、控制开发进度、增强软件的可读性和可维护行,软件开发过程中我们采用软件结构生命周期法进行分析、设计和控制。总体而言,自动赋词软件的开发过程可分为分为计划期、开发期和运行期,在此基础上又可细分为八个不同的阶段,即是:问题定义、可行性研究、需求分析、总体设计、详细设计、程序编程、运行测试、软件维护。 一、引言 (一)概念描述 标引indexing) 通过对文献的分析,选用确切的检索标识(类号、标题词、叙词、关键词、人名、地名等),用以反映该文献的内容的过程。主要指选用检索语言词或自然语言词反映文献主题内容,并以之作为检索标识的过程。标引是文献加工中的重要环节。标引可按使用检索语言的类型区分,使用分类检索语言时?,称为分类标引?;使用主题检索语言时,称为主题标引。主题标引又分为受控标引与非控标引。标引的实质,是按文献的内容特征对其进行主题类属的划分与区分。由于计算机化检索系统的建立和文献数据库的应用,出现了自动标引。自动标引是指利用计算机对文献自动进行标引,以代替人的脑力劳动。自动标引有两种形式:抽词标引与赋词标引。无论抽词标引或赋词标引,首先都需要将文献转化为机读形式。抽词标引以文献内词的出现频率作为是否取为标引词(用作检索标识的检索词,亦称索引词)的判据。设立频率阈时,一般以相对频率代替绝对频率效果较好。赋词标引则须将词表存入机内,作为计算机对比选用标引词的依据。为了解决汉语文献的自动标引,须解决汉语中词的自动切分问题。自动赋词自动赋词标引则是指由计算机来自动完成这一过程。它与自动抽词标引的最大的一个区别就是,所使用的标引词来自于某一受控词表,而不是来自文本本身。 Internet技术的迅猛发展以及用户对信息检索技术需求的提高,导致传统的信息组织技术(主要讨论标引技术)与用户未满足需求矛盾的加剧和深化。在传统的信息组织工作中,人们主要采用的是人工标引,这种标引方法由于人为控制因素的加入,所以标引深度比较高,也比较准确。但是完全人工的做法使得这种标引的成本很高,而且由于人的精力是有限的,所以标引的速度、数量、质量也只能勉强满足传统信息源的新增水平,此外,由于主要是人工完成,因此一些外界影响因素的干扰十分明显,比如:标引人员本身的素质、标引内容是否是他们比较熟悉的内容,甚至标引人员的心情都会极大的影响标引结果。网络信息资源不同于以往的那些书本、报刊等传统信息源,它的数量极大,并且每天都在不断的膨胀中,而且其内容变化更新频繁,发布的机构复杂、来源混乱,仍然采用人工标引的方法显然是不适应的了,我们对网络资源的加工整序,就不得不考虑一些新的方法。当前,最可行的就是引入机器,实现自动化处理。其一,是对网络资源,主要是网页的文本信息进行自动标引处理;其二,则是考虑从文本检索的角度实现网络资源的整序与应用。 对于自动标引,其优势是显而易见的。首先,自动标引可以实现较高的速度和质量赋词,这样就可以从容地处理高速膨胀的网络资源,同时,也可以适应网络资源更新快、不稳定的特点。其次,自动标引的费用比较低,在投入了初期的系统建设、硬件购买的固定成本后,其边际成本增长是比较低的,更适合标引数量大的信息源。而人工标引的成本却只会随着标引数量的增加而相应增加,在网络时代显得不够经济。再次,自动标引的质量随着现有技术的提高更加符合人们的需要,它的标引能力、处理稳定性都大大的超过了人工标引 我们的自动赋词标引软件的设计和开发正是着重从自动标引角度出发,面向中文网络文本信息资源,通过对现有自动标引系统的研究以及相关理论的探索,关注中文网络文本信息资源的整序和组织。 开发设计出能够满足用户需求的实用性软件使我们的最终目标;在软件开发过程中不断提高自己的专业素养和理论水平是我们的主要目标。 二、软件设计 【问题定义】 (一)课程设计描述 问题基本内容是基于关联词表的自动赋词标引,具体要求如下: a. 选定某一主题,建立相应的关联词表 b. 给出文献关键词与关联词表匹配的具体算法 c. 程序实现 我们自动赋词标引软
您可能关注的文档
最近下载
- 《背影》课内阅读训练.doc VIP
- Amason艾茉森电子乐器VP-73GH说明书.pdf
- 《机械臂结构》课件.ppt VIP
- 护理学本科毕业论文范文范文本科护理护理学毕业论文范文.doc
- 11CD008-4 固定资产投资项目节能评估文件编制要点及示例(电气)(OCR).pdf VIP
- 单片机课程设计报告 简易电子琴 .pdf VIP
- 网课章节答案《科学启蒙》超星尔雅答案2023.pdf VIP
- 吉他六线谱空白模版A4 六线 2mm 8行 通用版2打印模板.pdf VIP
- 安全生产规章制度和操作规程完整版.pdf VIP
- 国家开放大学《管理英语4》边学边练Unit 1-4(答案全).docx VIP
有哪些信誉好的足球投注网站
文档评论(0)