- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据挖掘技术的读者信息推送系统结构设计
摘要 本文基于关联规则算法的数据挖掘技术,对图书馆读者信息推送系统的结构进行了设计。系统目标为针对图书馆中日常产生的相关数据进行数据挖掘,为图书馆信息推送提供参考和决策支持,为系统的详细设计做好准备。 中国论文网 关键词 数据挖掘;关联规则;信息推送;系统设计 中图分类号TP39 文献标识码A 文章编号 1674-6708(2012)79-0210-02 图书馆日常的读者借阅活动中,读者的借阅行为在图书馆信息管理系统中积累了大量的数据。但是,这些事务性的数据并没有发挥其应有的价值。这些数据的功能现阶段只是停留在简单的读者借阅历史查询上,没有经过加工、整理及应用。除此之外,读者在使用图书检索系统的过程中,有着大量的检索行为,这些检索行为也产生了大量的数据。如何利用这些海量的数据为读者提供更优质的服务就成了我们研究的重点之一。 本文的研究重点是基于图书馆日常的读者服务数据,通过使用数据挖掘的手段,分析读者的信息使用情况,最后提出一个可以为读者个性化信息推送提供参考的具体方案,借以有效提高高校图书馆的读者服务质量,提高图书馆的读者服务水平。鉴于系统整体比较庞大,因此本文只是讨论系统的总体结构设计,以为将来系统的详细设计做好准备。 1 系统目标 在图书馆提供信息服务的过程中,涉及的读者类型丰富,涉及的馆藏资源庞杂。系统的设计目标是为图书馆为读者提供个性化的信息推送服务提供辅助支撑。因此,系统的设计主要以“向特定的读者,推送特定的信息”为最终目标。 信息推送的过程中,涉及到的信息很多。系统的设计过程中不可能做到面面俱到,因此,本系统的设计目标主要完成以下特定目标: 1)获取读者信息,提供读者服务。根据读者的条码号,找出读者的类型和使用习惯。利用数据挖掘的技术手段向读者提供特定的有效信息。当读者用自己的证件号登陆书目查询系统、数据库检索系统时,可以判定读者身份,根据读者身份及读者信息使用习惯向读者推送相关信息资源,包括图书资源、期刊资源、电子数据库资源等; 2)分析入藏资源,制定推送计划。对于新入藏的信息资源,根据信息资源的特点,向特定的读者群提供信息推送服务。比如,当图书馆新到一批图书时,将新书书目中的部分图书推送给特定的读者群; 3)收集检索历史,优化资源配置。根据用户的书目检索历史记录,用户的数字资源检索记录等读者利用图书馆信息资源的情况,结合本馆的信息资源配置情况,调整图书馆的资源配置,如藏书配置、资源购置分配。专业信息建设计划等,扩大图书馆信息服务的满意度。 根据前文所述系统目标,系统的核心是利用相关馆藏数据及读者使用文献情况数据来服务读者信息推送工作。根据系统的输入和输出,将系统划分成数据接口模块、数据预处理模块、数据挖掘模块、用户接口模块共四个模块,每一层模块为上一层模块提供数据支持。 2 主要功能模块 在图书馆的实际应用中,伴随着图书馆的文献资源建设和图书馆的读者信息服务,会产生相当多的数据。但是,这些数据种类繁多。从数据的分布上,数据分布在不同服务器,不同平台,不同的数据库中;从数据的存储结构看,数据类型,数据库中相关数据的分布也不尽相同。因此,系统首先通过数据连接模块将这些数据进行整合,然后通过数据预处理手段,将数据规范化,解决异构问题,将数据统一到信息推送数据库中。最后,通过数据挖掘的手段,使用关联规则算法,得到相关的关联规则。用户接口模块利用这些规则,完成系统的既定目标。各模块的功能具体如下: 1)数据接口模块 作为最底层的模块,数据连接模块的功能,是对上层的预处理模块屏蔽底层数据库的连接细节,使得上层模块在进行数据库读写操作时,可以使用统一的接口和语法。目的是将上层模块从繁琐的数据连接中解脱出来,从而可以把精力放在具体的事务处理上,简化了数据预处理模块的结构,同时提高了系统的可维护性和扩展性,扩充新的数据源类型时,只要修改数据连接模块就可以了。 数据接口模块,向下,通过.net框架中的类,使用OleDbConnection,SQL connection等连接Oracle、SQL Server等数据库,向上,为数据预处理模块提供统一的接口。 2)数据预处理模块 高质量的决策必然依赖于高质量的数据。数据预处理模块的功能是,在实施数据挖掘以前,利用数据连接层提供的数据,及时检测数据异常,尽早调整数据并规约待分析数据。为下面的数据挖掘工作提供干净、准确、简洁的数据。数据预处理模块通过对数据的清洗、集成、变换、简化操作后,将处理完成的数据导入读者信息推送服务数据库中,为数据挖掘工作做好准备。其基本流程如下: (1)数据预处理模块首先利用数据连接模块从相关的数据库中抽取读者信息服务可以使用的数据表。因为各个数据库中的数据表有很多,但是可以为读者
文档评论(0)