第5章 多媒体通信系统中的关键技术..PPTVIP

第5章 多媒体通信系统中的关键技术..PPT

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 多媒体通信系统中的关键技术 5.1 多媒体信息输入输出技术 多媒体计算机所涉及的输入输出技术包括视频图像技术、音频技术、语音技术、图形技术和文本技术等。 多媒体系统通过一些具有特定功能的卡来支持媒体数据的输入输出。(如视频卡、声卡、VGA与TV转换卡、图形加速卡、光盘接口卡等) 多媒体计算机正是通过这些卡,完成与各种外部设备的连接,从而形成一个制作和播放多媒体应用的工作环境。 5.1.1 视频信息输入输出技术 视频卡是多媒体计算机用来完成视频信息输入输出功能的主要器件。 主要种类: 电视接收卡 视频转换/捕获卡 视频编码卡 MPEG卡 实际应用中常把多种功能集成于一块卡中 1. 视频卡的基本工作原理 2. 常用视频卡 视频接收卡(电视接收卡) 一般与视频转换/捕获卡组合在一起 视频转换/捕获卡 视频转换卡完成计算机视频信号和电视视频信号间的转换 完成由计算机的VGA信号到各种标准制式的电视信号的转换并在电视机上播放或进行录像(PC-TV,VGA-TV) 完成将标准的各种制式电视信号转换成计算机屏幕上显示的VGA信号(TV-VGA) 视频转换/捕获卡 视频捕获卡主要功能是从视频图像信息中实时或非实时地捕获静态或短时间的动态视频图像。 MPEG卡 压缩卡:对静止和动态图像按照相应的标准进行实时和非实时的压缩和还原处理。 解压缩卡(影碟卡):把MPEG文件进行解压缩并恢复播放。它可以播放MPEG-1标准压缩的数字影视片(如VCD)。 视频卡发展方向 与影视技术的结合:可以在一块高档卡上集成视频输入输出、压缩和解压缩、特技效果及视频编辑功能。 与网络通信技术结合:完成多媒体视频会议、可视电话和多媒体通信功能 3. 摄像头 针对网络视频应用 模拟摄像头:获得的视频信号必须通过计算机的视频卡数字化并压缩才能送进计算机进行处理。 数字摄像头:直接捕捉视频图像,然后通过USB或IEEE1394高速接口输入计算机。 工作原理:外界景物通过镜头生成光学图像,再投射到图像传感器表明转换为模拟信号,经A/D变换转为数字图像信号,送到数字处理芯片DSP进行加工,在通过与计算机的接口传输到计算机中进行处理,最后通过显示器显示。 主要性能指标 摄像器件:CCD(成像质量高),CMOS 像素分辨率:30万、130万。。。 颜色深度:24真彩、30真彩。。。 视频捕获速度:帧率,影响流畅度 接口方式:USB速度快,连接简单,即插拔 4. 投影仪 多媒体显示设备 分类 CRT:实现最早、应用最广、技术成熟、分辨率高 亮度较低、机身体积大、对焦汇聚调整复杂 LCD:体积小、重量轻、便携、亮度高、色彩丰富 DLP:画面质量稳定、图像显示细腻 技术指标 亮度 分辨率 灯泡寿命 5.1.2 音频信息输入输出技术 实现:音频卡(声卡),安装在PC内部使PC发出各种声音的硬件板卡,是PC进行所有与声音相关处理的硬件设备。 音频卡工作原理 音频卡的主要功能 录制和播放声音文件 对声音文件进行编辑和合成 倒播、增加回音、淡入淡出、循环放音、交换声道等 对数字声音文件进行压缩和解压缩 MIDI音乐录制和合成 利用计算机完成对外部电子乐器的操作和控制 文语转换和语音识别 让计算机朗读文本和让计算机听懂声音信息 声卡的主要作用是对声音信息进行录制和回放 可支持的采样频率 8kHz,11.025kHz——针对一般语音质量的要求 16kHz,22.05kHz,32kHz——针对普通音乐效果 44.10kHz,48kHz——针对高保真音乐效果 5.1.3 语音识别和语音合成技术 语音识别技术 狭义语音识别:排除不同人的发音差异,提取代表语音的共性特征。 说话人语音识别:寻求说话者的个性特征以辨别说话人的身份。 最早的语音识别系统出现在1955年(Bell)。随着识别技术的发展,一些研究机构相继推出语音识别系统:IBM的Via Vioce系统;剑桥大学的HTK系统;微软的Whisper系统等。 语音识别技术 语音识别系统的分类 按可识别词汇量的多少:100以下,100-1000,1000以上 按语音的输入方式:孤立词、连接词、连续词 按发音者类型:特定人、限定人、非特定人 按发音者的声纹:根据语音识别说话人身份 语音合成技术 实现的方式 录音/重放模式 利用数字信号处理技术,采用参数合成的方式来实现语音合成 语音合成的三个层次 从文本到语音 从概念到语音 从意向到语音 有限词汇的计算机语音输出 语音报时、公共汽车报站、叫号系统 基于语音合成技术的文语转化(TTS) 除了完成文字到语音的映射外,还要完成对书面文字的理解以及对语音韵律的处理 文语转换技术 有声电子文档、信息电话查询系统、基于计算机的办公教学娱乐多媒体软件、嵌入式操作系统。。 包括文本分析、韵律生成、语音合

文档评论(0)

fg09h0as + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档