多媒体信息处理基础.ppt

  1. 1、本文档共105页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.1 多媒体的基本概念 1.2 音频信息处理基础 1.3 图像信息处理基础 1.4 视频信号的数字化 1.5 MATALAB在图像处理中的应用 熟悉多媒体及多媒体技术的基本概念及特征。 了解声音的基本特性及主观感觉。 熟悉音频、图像、视频信号数字化的过程,掌握均匀量化的原理。 掌握彩色三要素、三基色原理及混色方法等色度学基本知识。 理解RGB、YUV、YIQ、YCbCr、HSI/HSV等颜色空间的表示及转换。 熟悉ITU-R BT.601建议的主要内容。 了解MATLAB在图像处理和分析领域的应用。 1.1 多媒体的基本概念 1.1.1 媒体的概念 1.1.2 多媒体与多媒体技术 1.媒体(medium) 按传统的说法,媒体指的是信息的载体,如: 报纸、杂志、电视、广播、因特网… 在计算机领域有两种含义: 信息的存储实体,如磁盘、光盘、磁带、半导体存储器等,中文常译为媒质或媒介; 传递信息的基本元素,如文字、声音、图形、动画和图像等。 在多媒体技术中所说的媒体一般指感知媒体。常见的感知媒体包括: (1)视觉媒体:图像、图形、符号、视频、动画等。 (2)听觉媒体:声音、语音、音乐和音响。 (3)触觉媒体:通过直接或间接与人体接触,使人能感觉到对象的位置、大小、方向、方位、质地等性质。 图像由像素组成 位图(bitmap,bit-mapped image ) 对位图进行操作时,只能对图中的像素进行操作,而不能把位图中的物体作为独立实体进行操作。 画位图或编辑位图的软件称为画图程序;存放位图的格式称为位图格式;存储的内容是描述像素的数值。 位图的获取通常用扫描仪、数码相机和相关的数字化设备。 位图文件占据的存储空间比较大,影响位图文件大小的因素 图像分辨率:分辨率越高,表示组成一幅图的像素就越多,图像文件就越大 像素深度:像素深度越深,表达单个像素的颜色和亮度的位数越多,图像文件就越大 灰度图像(gray-scale image或intensity image):只有明暗不同的像素而没有彩色像素组成的图像。按灰度级的数目来划分: 单色图像(二值图像):只有黑白两种颜色的图像。 每个像素的像素值用1bit存储,其值是“0”或“1” 灰度图像:如果每个像素的像素值用一个字节表示,灰度值级数就等于256级,每个像素可以是0~255之间的任何一个值。 彩色图像(color image) 每个像素包含颜色信息的图像。 可按照颜色的数目划分: 256色图像:每个像素的R、G和B值用一个字节来表示,一幅640×480的彩色图像需要300 KB的存储空间 真彩色图像:每个像素的R、G、B分量分别用一个字节表示,一幅640×480的真彩色图像需要900 KB的存储空间 帧动画 音频(Audio)可分为波形声音、语音和音乐。 波形声音 包含了所有的声音形式 自然界中的各种声音,包括人的说话声、音乐、天空的惊雷等,可以用一种模拟的连续波形表示。 语音:不仅是一种波形声音,而且还具有内在的语言、语音学内涵,可以经由特殊的方法而提取。波形声音也可以表现和记录语音,但常把语音作为一种特殊的听觉媒体。 1.1 多媒体的基本概念 1.2 音频信息处理基础 1.3 图像信息处理基础 1.4 视频信号的数字化 1.5 MATALAB在图像处理中的应用 1.2 音频信息处理基础 1.2.1 声音的基本特性 1.2.2 声音的主观感觉 1.2.3 音频信号的数字化 声音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。 数字化实际上就是对模拟信号进行采样、量化和编码。 采样(Sampling):每隔一定的时间间隔,抽取信号的一个瞬时幅度值(样本值),即在时间上将模拟信号进行离散化。采样后所得到的一系列在时间上离散的样本值称为样值序列。 奈奎斯特(Nyquist)采样定理:只要采样频率大于或等于声音信号最高频率的两倍( fs≥2fmax ),就可以通过理想低通滤波器,从样值序列中无失真地恢复原始模拟信号。也就是说,在满足奈奎斯特采样定理的条件下,在时间上离散的样值序列包含有采样前模拟信号的全部信息。  常用音频采样频率:8kHz、11.025kHz、22.05kHz、32kHz、44.1kHz、48kHz、96kHz 量化(Quantization):对每个样值的连续幅度进行离散化,即用有限个幅度值近似原来连续变化的幅度值,把模拟信号的连续幅度变为有限数量、有一定间隔的离散值。 均匀量化(线性量化):量化器的每个量化间隔都相等,量化电平取各量化区间的中间值。 非均匀量化(非线性量化):量化器的各个量化间隔是不相等的。 编码(Encoding):采样、量化后的信号还不是数字信号,需

文档评论(0)

企管文库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档