[计算机软件及应用]第五章 数字媒体及应用n.ppt

[计算机软件及应用]第五章 数字媒体及应用n.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[计算机软件及应用]第五章 数字媒体及应用n

应天职业技术学院校级精品课程 第五章 数字媒体及应用 第五章 数字媒体及应用 5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用 5.1 文本与文本处理 文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体 文本由一系列 “字符”(character)组成,每个字符均使用二进制编码表示 文本在计算机中的处理过程是: 5.1 文本与文本处理 5.1.1 字符的编码 5.1.2 文本准备 5.1.3 文本的分类与表示 5.1.4 文本编辑、排版与处理 5.1.5 文本的展现 5.1.1 字符的编码 字符采用二进位编码方式 西文字符的编码标准 汉字字符的编码标准 西文字符的编码 西文由拉丁字母、数字、标点符号及一些特殊符号所组成 西文字符集中每个字符各有一个代码,构成该字符集的代码表简称码表 西文字符的编码—ASCII码(美国标准信息交换码) ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符(最高位为0) 存在问题:空间太小,不够使用 解决方法:扩充ASCII码 标准ASCII字符集及其码表 ASCII码 认识部分ASCII码字符对应的十六进制、十进制数值 汉字字符的编码 中文文本的基本组成单位是汉字 汉字的特点:数量大,字形复杂,同音字多,异体字多 汉字编码的问题: 确定收入多少字、哪些字? 汉字在字符集中的排序方式 确定使用的代码结构和代码空间 汉字字符的编码 国家标准GB2312 汉字扩充规范 GBK 国家标准GB18030 台湾地区的标准汉字字符集BIG 5,俗称“大五码” 国际标准UCS/Unicode GB2312汉字编码 1980年颁布GB2312-1980 GB2312字符集由三个部分构成: GB2312汉字编码 区位码、国标码、机内码的换算 例:位于20行83列的汉字,其国标码和机内码分别为多少 总结:区位码(H)+2020=国标码(H) 国标码(H)+8080=机内码(H) 区位码(H)+A0A0=机内码(H) 了解汉字编码方式 例:B5 C8 30 41 BF BC 8C 9A 中包含几个汉字 总结:汉字占两个字节,且 〉A1 A1 GB2312汉字编码的缺点 编码效率不高 GB2312汉字字数太少,无法满足一些特殊应用的需要:没有繁体字 与ASCII码不兼容 其它汉字编码 GBK GB18030 UCS/Unicode(国际标准) 几种汉字编码的对比 5.1.2 文本准备 文字符号输入计算机的方法 汉字的键盘输入 汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉字的“键盘输入编码” 优秀的汉字键盘输入编码应具有的特点: 易学习、易记忆 效率高(平均击键次数较少) 重码少 容量大(可输入的汉字字数多) 汉字键盘输入方法的比较 非击键方式汉字输入 书写板 话筒 扫描仪 5.1.3 文本的分类与表示 分类 排版格式:简单文本、丰富格式文本 内容组织方式:线形文本、超文本 简单文本 没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是 .txt 由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息 例:windows 附件中“记事本” 丰富格式文本 有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本” 丰富格式文本中,除了正文内容之外,还使用了许多“标记”来描述字符的属性和格式的设置。 例: windows 附件中“写字板”、WORD、FRONTPAGE 认识一些文本后缀名:RTF、DOC、HTML 超文本 若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成 “超文本” 传统文本线形结构,超本文网状结构 几个概念:超链、链源、链宿 区别:超媒体 5.1.4 文本的编辑与排版 文本编辑 目的:确保文本内容正确无误 操作:对字、词、句、段进行添加、删除、修改等操作 文本排版 目的:使文本清晰、美观、便于阅读 操作内容:对文本中的字符、段落乃至整篇文章的格式进行设计和调整,分成3个层次: 对字符格式进行设置 对段落格式进行设置 对文档页面进行格式设置 文本处理 文本处理 使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、压缩、加密和检索等有关的处理 文本处理内容: 字数统计,词频统计,简/繁体相互转换,汉字/拼音相互转换 词语排序,词语错误检测,文句语法检查 自动分词,词性标注,词义辨识,大陆/台湾术语转换 关键词提取,文摘自动生成,文本分类 文本检索(关键词检索、全

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档