UID662925
威望142
金钱65185
交易诚信度0
主题286
帖子41280
注册时间2010-2-25
最后登录2024-7-21
核心会员
      
交易诚信度0
注册时间2010-2-25
|

楼主 |
发表于 2010-10-8 11:54
|
显示全部楼层
(原创)音频模拟数字转换解析,也谈对奈奎斯特采样定理的疑问
作者小严QQ:835801527
作者博客(全是原创技术文章)地址:http://blog.sina.com.cn/omarte
数字音响已经发展很多年了,可是用google在网上搜索并没有能比较详细解释模拟音乐信号转换成数字数据的知识普及文章,利用2010年国庆假期我尽自己的力量来说说好了。
音乐信号模拟/数字转换主要掌握两个概念,一个是采样比特率,另一个是采样频率。图一是输入6.3kHz模拟音频信号,用48kHz采样频率,1Bit进行模拟/数字转换的示意图。请看图一 1Bit示意图。随便说说为了让大家更好的研究交流本文所附的所有图片都够大够清晰,如果觉得看不清应该是网站压缩了,请点击图片以获得更大清晰图片。
图一
因为1Bit转换精度很低,这样的数字记录无疑是很粗糙的。我们将采样精度提高到2Bit来看看会是什么情况。请看图二 2Bit示意图。
图二
继续看看3Bit的情况。请看图三 3Bit示意图。
图三
继续看看4Bit的情况。请看图四 4Bit示意图。
图四
每增加1Bit取样状态增加一倍,数据量也增加一倍,动态范围也增加6dB。爱好音响的同学常常争执24Bit好还是把16Bit做好才是正道的话题,请看图五 比特数 数据量 动态范围关系图。
图五
现在音响界常常争论的一个问题,CD格式的16 Bit动态范围 96dB是否足够使用?一方认为不够,另一份认为足够了多了是浪费。网络上公说公有理,婆说婆有理地争论了很长时间。持CD足够使用论观点的人主要基于两种思考,一是中间级设备本底噪音高,二是听音环境噪音高。这二者都会导致在实际使用中显不出高比特率大动态范围的好处来,96dB动态范围足够用。争论还在继续让我们也加入进来。
现在我们对比特率、动态范围有基础了解后可以自己来做这方面的理论分析,就当做是学习知识后巩固的习题好了,用本文前面提到的知识做一比较示意图。参见图六 16Bit 20Bit 24Bit比较示意图。
图六
动态范围24Bit的144dB能比CD格式16Bit的96dB大不少。图中使用小方块来表示数据量比值。由图可见在相同采样频率情况下20Bit的数据量是16Bit的16倍,而24Bit的数据量是16Bit的256倍。
对听音环境噪音高显不出高比特率大动态范围的好处来的论点,我们也来做一个分析。先设问:我们最大的听音声压是多少分贝(dB)?我们的听音环境噪声是多少分贝(dB)?将这两个值一相减就得到了我们能听到的动态范围了。
有同学能挣会花用的是mbl 7006合并式放大器,120W/8欧姆,185W/4欧姆。配上丹拿焦点140书架箱,灵敏度86dB/m/W,阻抗4欧姆。在距离音箱一米的地方连续声压是86+10 log185 ≈ 109dB。如果在距离音箱2米外听音声压衰减是20 log2 ≈ 6dB,能听到的最大声压是109 – 6 = 103 dB,因为是左右声道共俩只箱在听音位置上的最大声压是103 + 3 = 106 dB。家住小区听音时间环境噪音在40 dB左右,他(她)能听到的动态范围是106 – 40 = 66 dB。CD格式16Bit动态范围有96dB足够了。
再看另一位同学比较喜欢大声,前世修桥补路现在用上灵敏度101dB/m/W的美国westlake SM-1VF音箱搭配1000瓦的功放。在距离音箱一米的地方连续声压是101+10 log1000=131dB。如果在距离音箱4米外听音声压衰减是20 log4 ≈ 12dB,能听到的最大声压是131 – 12 = 119 dB,因为是左右声道共俩只箱在听音位置上的最大声压是119 + 3 = 122 dB。这同学比较执着,也为后世着想行善积德布施盖庙后,听音室设计装修化了大力气,达到了演播室的噪声水平不超过34dB(A),混响时间也做到小于0.5秒。他(她)能听到的动态范围是122 – 34 = 88 dB。CD格式16Bit动态范围有96dB从数据来看还有富余。可是实际上够不够用呢?我的答案在文章最后请慢慢看来。
另一种观点是音响系统的前级会产生瓶颈,请看拙作《音响配置之:被浪费了的信噪比》。
链接地址
http://www.jd-bbs.com/thread-2408445-1-1.html
http://www.audiobar.net/viewthread.php?tid=318188
http://www.ca001.com/bbs/thread-248692-1-1.html
比特率告一段落现在说说采样频率。采样时间是采样频率的倒数,比如采样频率是48kHz,那么每一次采样的间隔时间就是1/48000 = 0.000002083333333(3的循环)秒 ≈ 2.083微秒(uS),这样每隔2.083微秒(uS)就对音频模拟输入信号做一次判定,判定当前信号是65536种(16Bit)状态中的哪一种,然后把数据传输出去ADC就完成了自己的工作。
如果是20Bit /48kHz采样,那就是每隔2.083微秒(uS)就对音频模拟输入信号做一次判定,判定当前信号是1048576种状态中的哪一种。
同理如果是10Bit /48kHz采样,那就是每隔2.083微秒(uS)就对音频模拟输入信号做一次判定,判定当前信号是1024种状态中的哪一种。
其它比特数请看本文前部分以求融会贯通,并可参考图五。
音频采样的采样频率很多主要使用的有8kHz、11.025kHz、16kHz、22.05kHz、37.8kHz、44.1kHz、48kHz、96kHz、192kHz等。
知道了这些基础知识我们很容易做出示意图来帮助我们分析问题,请看图七 6.3 kHz正弦波48 kHz取样的情况。
图七
由图我们可以看到数字化的信号(黑色)和输入信号(橙色)的区别还是很大,这种区别就是失真,6.3 kHz产生如此明显的失真,在高频段会不会失真更大?请看图八 16 kHz正弦波48 kHz取样的情况。
图八
由图可见在输入信号频率升高到16 kHz后模数转换失真比6.3 kHz时更大。取样频率48 kHz是信号频率16 kHz的3倍也会出现明显的失真。那么以前流传的“根据奈奎斯特采样定理,允许重建的有用信号的频率要低于采样频率fs的一半,即如果采样频率为50Hz,则频率低于25Hz的信号可以被可靠地重建和分析。”是否正确?是我们对奈奎斯特采样定理理解错误,还是奈奎斯特出错,还是翻译上出了问题?欢迎讨论。
继续探索问题在知识的海洋里……洗澡,要穿游泳衣还要带救生圈,不要人云亦云,要不他错了我也跟着错就糟糕了。我们再做图九 24 kHz正弦波48 kHz取样的情况。
图九
图中我们发现数字转换后的能量大小和相位关系很大,不同相位时结果并不恒定,在有的相位甚至完全没有能量如图九最上面情况。这个结果是我再次对奈奎斯特采样定理产生怀疑。外国人的事先不管他继续说说采样频率。
那么提高采样频率是不是会改善高频的表现呢?请看图十10 kHz正弦波48kHz和96 kHz取样的情况。
图十
有了比较我们很清楚看出96 kHz取样比48kHz明显胜出,波形失真更小。继续比较图十一16 kHz正弦波96kHz取样的情况。
图十一
看来提高采样频率对改善高频失真的效果真是立竿见影,图十一的情况比图八的情况好多了,就因为提高了一倍的采样频率。
对音响我们已经有太多误解有太多错误的过去了,比如对电子管,比如对LP……所以对新设备我的建议是把它搬进听音室接上系统——听,好不好靠耳朵收货,数据也好理论也好都是参考,耳朵才是大老板,切勿本末倒置。
另,我在文章中埋下了一个比较专业的计算错误,希望认真看文章的人能提出来。一个小游戏,呵呵! |
|