基于word文档的数据格式转换.docxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于word文档的数据格式转换 医学研究的第一步是研究设计,除了专业设计外,还包括统计设计。在统计设计中,我们认为应考虑计算机和计算机的正确使用。数据数据存储的媒体和存储格式的问题会影响数据处理步骤中处理工具的选择和操作。在临床科研中要将采集的各种数据输入计算机,通常是以纸质的格式化专题病案做为收集资料的方式,在数据处理阶段借用计算机对资料进行整理和分析;也有设计较为严谨的课题要求从工作伊始就要建立相应的统计资料数据库,这对于后期的数据处理是极为有利的。但也必须注意,按研究要求所设计的数据采集格式一定要对应于数据库中表的字段结构,不要误解为仅仅是将收集的数据资料输入到计算机的格式化文本文档中,如Word文件等,这种用Word文档形式保存统计数据的方法(尤其是对计量资料)并不可取。因此,它要求科研人员要熟悉计算机应用技术,从技术性和非技术性2个方面减少数据信息失真,提高统计数据质量和科研项目的管理效率。1 1 数据和方法 1.1 资料保储方式单一 为保证某课题数据质量并完整地保存其研究资料,科研人员将每份纸质病案(其主要数据内容是计量资料)以Word文档形式,按纸质病案表格的排版形式保存于计算机中,并规定了每份Word文档的命名要对应于纸质的病案编号,以方便研究人员的查阅和专家组在评审时的校验。但是该课题任务书本身就有建立统计资料数据库的要求,直到研究后期在数据处理时才发现这种保储方式对数据处理所造成的被动。解决的方法一是按要求建立数据库并向数据库中输入每份病案,但对大样本和复杂格式的内容资料,在录入时容易出现错误并同时加大课题工作量;二是利用工具软件对Word文档进行数据格式的转换,然后再将转换后的数据批量地读入按要求所建立的数据库中。 1.2 文献错误检索模块 从网上下载免费的文件合并工具软件(本例使用FileJoin软件,见图1),将所有Word文档(每份病案)合并为一个文件,对合并后的Word文件另存为纯文本的txt文件,再编制程序将txt文档读入数据表中(本例采用VFP数据库管理程序),同时程序会根据病案字段的格式化特征,如数据、字符、日期和时间等读入数据并完成初步的逻辑校验,如出生日期和填表日期与年龄的关系等。用程序再次对数据进行进一步的逻辑检查,对不合格的样本提出复核请求。程序提供检索查询功能,如按病案编号检索、按实验对象检索、打印输出等。程序支持将数据库转换为Excel文档,以方便诸如SPSS等统计软件的数据调用,见表1。 2 资料校验和数据库管理系统 将每份以Word文档形式保存的病案转换到数据库中并编制管理程序,既满足了研究课题任务书本身对建立统计资料数据库的要求,同时也方便了研究人员在核对、查阅数据,保存研究资料,专家组在鉴定评审时校验资料和统计软件进行数据调用等方面的应用。所编制的《课题数据库管理系统》程序的基本功能包括:数据的导入(如txt文件的导入)和导出(如Excel文件的导出),数据的逻辑校验和对不合格的样本的打印输出,数据的检索检索和打印输出等,见图2。 这种根据研究目的建立的数据库及管理程序对于保证数据质量、完整地记录和保存科研资料及研究结果、方便课题人员研究等方面起到了积极的作用,尤其是在反复地进行课题数据指标的筛选、统计分组等方面,其数据检索和数据导出更加方便灵活。 3 用文件合并进行合并 当用不同软件处理同一数据对象时,存在着一个数据转换问题,通常不同软件的数据文件转换过程比较复杂,常需要借用数据转换的工具软件。 3.1本例中每份病案资料是用固定格式的Word文档保存的,Word本身所提供的文件合并方法,在文件合并后其内容的排列格式易发生混乱,不利于后期处理,在此我们借用网上免费下载的文件合并工具软件进行合并操作。 3.2Word是字处理软件,而本例中的统计资料主要是计量资料,因此用Word文档来保存此数据类型的作法是不可取的。 3.3txt文档也是纯文本文件,我们把它做为数据转换的纽带,因为Word格式的文件与纯文本文件具有互换性,而纯文本文件可以方便地生成各种形式的数据文件(如Excel文件、dbf文件等)。 3.4本例中的病案资料是用固定格式以文本文件形式保存的,这种固定格式是转换成结构化数据文件的前提,它能对生成的数据文件做出规范的结构化保证。 3.5在完成由文本文件向数据文件的转换后,应编制程序,根据病案字段的格式化特征完成数据资料的逻辑校验,从而保证统计数据的质量,以便顺利地进入统计分析阶段。

文档评论(0)

182****7741 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档