- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字文本的特征.ppt
数字文本处理的基础 数字文本的概念 文本:通过文字、符号的形式表现、传递信息的方式。读者能通过阅读文本数据中的文字、符号获得信息,文本数据是学习、生活、研究资料的主要成分,主要载体形态为:图书、报刊、政府文献、会议论文、学位论文、单位论文、技术报告、产品说明书、网页等。 数字文本:纸质的文本转换成计算机能识别的二进制文件,也称为文本数据资源。 数字文本的特征 数字文本的分类 数字文本的三种类型: 1.纯文字文本:使用字处理软件,通过录入、编辑、排版后生成,生成后的文本包含排版信息,显示效果受系统字库和软件平台的影响,在不同机器上显示会出现不同的效果,严重时还会出现乱码等现象。使用文本文字素材占用的字节数比较小,导入后设置字体、大小、颜色比较方便。 2.图像文本:运用绘图工具软件(如Photoshop)生成,使用图像文本可提高多媒体作品的表现力,存储图像文本时可存为JPG、BMP、GIF、TIF等不同的格式,在作品中使用不会出现乱码,但所占的字节数要大于纯文本格式。 3.动态文本:运用动画制作软件(如3DStudioMAX)制作,可根据作品的需要,设置不同的动作,具有很强的动感和三维立体效果,制作片头时使用的比较多,一般存储为动态的GIF和Flash格式,这两种格式所占字节数比较少,也可以存储为视频文件(如AVI、MPEG),但所占用的字节数较大。 数字文本的格式 文本格式的定义 文本格式指用来对数据以及相关信息(包括结构、布局、压缩算法等)进行编码的软件算法。在文本数据的数字化过程中,很多公司和组织机构都根据需要制定了自己的数字文本格式,导致了多种数字文本格式并存的局面。 数字文本的基本格式 数字文本的基本格式: 可编辑的文本格式 网页文本格式 电子资源文本格式 数学文本格式 可编辑的文本格式 TXT格式(也称纯文本格式) 使用Windows操作系统的写字板、记事本和Word可查看这种格式的文件。 优点:文件体积小;阅读不受限制。 缺点:不能插入图片、图表等;不能建立超链接;不支持字体样式编辑。 DOC格式 使用Microsoft Word 或WordPerfect for Windows创建和打开的。 优点:DOC格式可以在文件中嵌入图表、图片、数学公式,建立超链接等。 缺点: 由于文件中包含了字体信息、段落格式、文字色彩、页眉页脚等信息,文件体积相对纯文本文件较大。 DOC格式必威体育官网网址,且不开放源代码,因此,其他公司的字处理程序都无法识别微软的文档。 DOC格式文件版本向下不兼容。新版本的Office用了老版本不支持的新格式,所以Office的用户必须升级(即使你并不需要什么新功能),从而提高用户成本。 RTF格式是由Microsoft创建的,RTF文件的组成包含控制字、控制符以及表明文档属性的组。使用Microsoft Word打开。 优点: RTF格式文件容易识别。 RTF格式文件可以在不同程序和同一程序不同版本之间传递数据,且它的格式信息不会丢失或破坏。 RTF格式文件具有很强的编排功能,可以实现文字和各种插入对象的混排,文字也可以实现各式各样的格式编排。 缺点: 内容繁多。控制字太多,增加了文档编写的难度。 RTF格式赋予作为控制符的字符特殊含义,使其作为文本出现时容易产生混乱。 WPS格式 HTML格式 1989年诞生于欧洲核子研究中心,是W3C协会专为World Wide Web而设计的,专用于Web页的开发。可用专门的HTML编辑器或Frontpage、Dreamweaver等网页制作工具进行编辑,通过Navigator、Internet Explorer等浏览器显示文本、图形和其它的任何内容。优点:简单和统一。 缺点:①可重用性差;②信息交互的局限性;③扩展性差,无法支持精确查询;④处理能力差,影响效率;⑤固定的标签集合;⑥对特殊字符的支持不够 XML格式 电子资源文本格式 PS格式 CAJ格式 VIP格式 维普公司系列数据库使用的是vip全文浏览器,它支持vip、tif、wp等格式文件。它可以在线阅读维普数据库原文,也可以阅读下载到本地硬盘的电子数据全文。优点:可原版原貌显示原文。 缺点:与其它的格式互不兼容。 IFR格式 PDG格式 CEB格式 EBK格式 美国微软公司开发的软件Microsoft Reader的一种专有的文件格式,只能使用Microsoft Reader来阅读。 优点: 支持全屏阅读。 没有滚动条,翻页全部使用点击页码来实现,像看一本真正的纸质书。 缺
文档评论(0)