问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

什么是音频数字化,图像数字化,请详细讲解

发布网友 发布时间:2022-04-25 21:16

我来回答

1个回答

热心网友 时间:2022-05-07 03:39

从字面上来说,数字化 (Digital) 就是以数字来表示,例如用数字去记录一张桌子的长宽尺寸,各木料间的角度,这就是一种数字化。跟数位常常一起被提到的字是模拟 (Analog/Analogue) ,模拟的意思就是用一种相似的东西去表达,例如将桌子用传统相机将三视图拍下来,就是一种模拟的记录方式。

两个概念:

1、分贝(dB):声波振幅的度量单位,非绝对、非线性、对数式度量方式。以人耳所能听到的最静的声音为1dB,那么会造*耳听觉损伤的最大声音为100dB。人们正常语音交谈大约为20dB。10dB意味着音量放大10倍,而20dB却不是20倍,而是100倍(10的2次方)。

2、频率(Hz):人们能感知的声音音高。男性语音为180Hz,女性歌声为600Hz,钢琴上C调至A调间为440Hz,电视机发出人所能听到的声音是17kHz,人耳能够感知的最高声音频率为20kHz。

将音频数字化,其实就是将声音数字化。最常见的方式是透过脉冲编码调制PCM(Pulse Code Molation) 。运作原理如下。首先我们考虑声音经过麦克风,转换成一连串电压变化的信号,如图一所示。这张图的横座标为秒,纵座标为电压大小。要将这样的信号转为 PCM 格式的方法,是先以等时距分割。我们假设用每 0.01 秒分割,则得到图二。

我们把分割线与信号图形交叉处的座标位置记录下来,可以得到如下资料,(0.01,11.65) 、(0.02,14.00) 、 (0.03,16.00) 、 (0.04,17.74) … ..(0.18,15.94) 、 (0.19,17.7) 、 (0.20,20) 。好了,我们现在已经把这个波形以数字记录下来了。由于我们已经知道时间间隔是固定的 0.01 秒,因此我们只要把纵座标记录下来就可以了,得到的结果就是 11.65 14.00 16.00 17.74 19.00 19.89 20.34 20.07 19.44 18.59 17.47 16.31 15.23 14.43 13.89 13.71 14.49 15.94 17.70 20.00 这一数列。这一串数字就是将以上信号数字化的结果。看吧,我们确实用数字记录了事物。在以上的范例中,我们的采样频率是 100Hz(1/0.01 秒 ) 。其实电脑中的 .WAV 档的内容就是类似这个样子,文件头中记录了采样频率和可容许最大记录振幅,后面就是一连串表示振幅大小的数字,有正有负。常见CD唱盘是以PCM格式记录,而它的采样频率 (Sample Rate) 是 44100Hz ,振幅采样精度/数位是 16Bits ,也就是说振幅最小可达 -32768(-2^16/2) ,最大可达 +32767(2^16/2-1) 。CD唱盘是以螺旋状由内到外储存资料,可以存储74分钟的音乐。CD唱盘的规格为什么是 44.1kHz、16Bits呢?关于 44.1kHz 这个数字的选取分为两个层面。首先人耳的聆听范围是 20Hz 到 20kHz ,根据 Nyquist Functions ,理论上只要用 40kHz 以上的采样频率就可以完整记录 20kHz 以下的信号。那么为什么要用 44.1kHz 这个数字呢?那是因为在 CD 发明前硬盘还很贵,所以主要将数字音频信号储存媒体是录像带,用黑白来记录 0 与 1 。而当时的录像带格式为每秒 30 张,而一张图又可以分为 490 条线,每一条线又可以储存三个取样信号,因此每秒有 30*490*3=44100 个取样点,而为了研发的方便, CD唱盘也继承了这个规格,这就是 44.1kHz 的由来。在这里我们可以发现无论使用多么高的采样精度/数位,记录的数字跟实际的信号大小总是有误差,因此数字化无法完全记录原始信号。我们称这个数字化造成失真称为量化失真。

--------------------------------------------------------------------------------

数字化的最大好处是资料传输与保存的不易失真。记录的资料只要数字大小不改变,记录的资料内容就不会改变。如果我们用传统类比的方式记录以上信号,例如使用录音带表面的磁场强度来表达振幅大小,我们在复制资料时,无论电路设计多么严谨,总是无法避免杂讯的介入。这些杂讯会变成复制后资料的一部份,造成失真,且复制越多次信噪比 ( 信号大小与噪音大小的比值 ) 会越来越低,资料的细节也越来越少。如果多次复制过录音带,对以上的经验应该不陌生。在数字化的世界里,这串数字转换为二进制,以电压的高低来判读1与0,还可以加上各种检查码,使得出错机率很低,因此在一般的情况下无论复制多少次,资料的内容都是相同,达到不失真的目的。
那么,数字化的资料如何转换成原来的音频信号呢?在计算机的声卡中一块芯片叫做 DAC(Digital to Analog Converter) ,中文称数模转换器。DAC的功能如其名是把数字信号转换回模拟信号。我们可以把DAC想像成 16 个小电阻,各个电阻值是以二的倍数增大。当 DAC 接受到来自计算机中的二进制 PCM 信号,遇到 0 时相对应的电阻就开启,遇到 1 相对应的电阻不作用,如此每一批 16Bits 数字信号都可以转换回相对应的电压大小。我们可以想像这个电压大小看起来似乎会像阶梯一样一格一格,跟原来平滑的信号有些差异,因此再输出前还要通过一个低通滤波器,将高次谐波滤除,这样声音就会变得比较平滑了。

从前面的内容可以看出,音频数字化就是将模拟的(连续的)声音波形数字化(离散化),以便利用数字计算机进行处理的过程,主要包参数括采样频率(Sample Rate)和采样数位/采样精度(Quantizing,也称量化级)两个方面,这二者决定了数字化音频的质量。采样频率是对声音波形每秒钟进采样的次数。根据这种采样方法,采样频率是能够再现声音频率的一倍。人耳听觉的频率上限在2OkHz左右,为了保证声音不失真,采样频率应在4OkHz左右。经常使用的采样频率有11.025kHz、22.05kHz和44.lkHz等。采样频率越高,声音失真越小、音频数据量越大。采样数位是每个采样点的振幅动态响应数据范围,经常采用的有8位、12位和16位。例如,8位量化级表示每个采样点可以表示256个(0-255)不同量化值,而16位量化级则可表示65536个不同量化值。采样量化位数越高音质越好,数据量也越大。

反映音频数字化质量的另一个因素是通道(或声道)个数。记录声音时,如果每次生成一个声波数据,称为单声道;每次生成二个声波数据,称为立体声(双声道),立体声更能反映人的听觉感受。

除了上述因素外,数字化音频的质量还受其它一些因素(如扬声器质量,麦克风优劣,计算机声卡A/D与D/A(模/数、数/模)转换芯片品质,各个设备连接线屏蔽效果好坏等)的影响。

综上所述,声音数字化的采样频率和量化级越高,结果越接近原始声音,但记录数字声音所需存储空间也随之增加。可以用下面的公式估算声音数字化后每秒所需的存储量(假定不经压缩):

存储量=(采样频率*采样数位)/8(字节数)

若采用双声道录音,存储量再增加一倍。例如,数字激光唱盘(CD-DA,红皮书标准)的标准采样频率为44.lkHz,采样数位为16位,立体声,可以几乎无失真地播出频率高达22kHz的声音,这也是人类所能听到的最高频率声音。激光唱盘一分钟音乐需要的存储量为:

44.1*1000*l6*2*60/8=10,584,000(字节)=10.584MBytes

这个数值就是微软Windows系统中WAVE(.WAV)声音文件在硬盘中所占磁盘空间的存储量。由MICROSOFT公司开发的WAV声音文件格式,是如今计算机中最为常见的声音文件类型之一,它符合RIFF文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台机器应用程序所广泛支持。另外,WAVE格式支持MSADPCM、CCIPTALAW、CCIPT-LAW和其他压缩算法,支持多种音频位数,采样频率和声道,但其缺点是文件体积较大,所以不适合长时间记录。因此,才会出现各种音频压缩编/解码技术的出现,例如,MP3,RM,WMA,VQF,ASF等等它们各自有自己的应用领域,并且不断在竞争中求得发展。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
介绍几部恐怖片,是欧美的僵尸那种的,最好人类有(好枪)去对抗的_百度知 ... 求推荐几部欧美丧尸片,剧情一定要好,要吓人。例如僵尸世界大战... 结婚讲究门当户对什么意思 读书|《简•爱》:婚姻中的门当户对,是爱情基础上的人格平等 关于婚姻应该门当户对的文学作品 拿到美国临时绿卡一共有几种途径?除了结婚还有什么途径吗? 申请美国临时绿卡要申请多长时间才能拿到 vivox21格式化怎么用 vivo手机怎么格式化(vivo手机怎么格式化恢复到最初) 请问什么是“羹”啊? 语音信号转变为数字信号经过哪些步骤 简述声音的数字化过程。 声音信号数字化的过程包括什么 声音信号的数字化 简述音频数字化步骤 声音的数字化过程是? 舟山海域特产的红色的鱼是什么鱼? 爽肤水排行 告诉我下 什么牌子的立拍得相机好? 有一种鱼体型像带鱼,是红色的,叫什么鱼? pola的黑pa和红pa哪个好 POLA宝丽 美白面膜的评价怎么样 日本pola暗红酵素怎么样?有人吃过没? 有用过日本POLA化妆品的吗?怎么样? 关于我国外卖用户规模近5亿人这一现象,你有何看法? 有一个人骑马的50元硬币是哪国钱值多少人民币 这个是什么硬币啊邏? 求美国硬币的图片..谢谢 人民币硬币图片 有1亿圆硬币的图片吗, 数字化声音信号 还原成 模拟声音信号的过程? 怎么写招聘业务员 怎么写招聘销售业务员 招聘业务员需要问些什么问题? 如何招聘好的业务员 招业务员需要注意什么? 招聘业务员信息怎么写 业务员招聘要求 业务员招聘内容怎么写 脖子后面痒起疙瘩还有耳朵后面 是怎么回事 好莱客股票是什么? 脸上 脖子 耳后 起了一层细密的小疙瘩 不仔细看看不出来 但能摸出来 请问咋回事 公司招聘业务员一般有些什么要求 专业什么的。。 好莱客的股价为什么会跌这么多 招聘业务员的基本要求 脖子耳根后部长了一片小疙瘩 选好莱客股票的理由 为何保险公司一直在大量招聘业务员,背后真相是什么? 好莱客衣柜是一线品牌 有公司招聘业务担当,请问业务担当是做什么的?和市场销售有什么区别?