普通的CD采用了數(shù)字技術,不過它只是簡單地把模擬信號加以數(shù)字化。為了把模擬信號數(shù)字化,首先要對模擬信號進行采樣。根據Nyquest采樣定律,通常其采樣頻率至少是信號中的最高頻率分量的兩倍。對于高質量的音頻信號,其頻率范圍是從20Hz-20kHz。所以其采樣頻率必須在40kHz以上。在CD中采用了44.1kHz的采樣頻率。在對模擬信號采樣以后,還必須對其幅度上加以分層。在CD中,其分層以后的幅度信號用16比特的二進制信號來表示,也就是把模擬的音頻信號在幅度上分為65,536層。這樣,它的動態(tài)范圍就可以達到96分貝=20Log65536(6分貝/比特)。這種直接模數(shù)(A/D)變換的方法也稱為PCM編碼。直接數(shù)字化的最大缺點是比特率非常高。達到44.1x16=705.6kbps,或即88.2kBbps。比特率高就意味著要求的存儲容量很大。要記錄1分鐘的音樂,就需要5.292MB的存儲容量。對于兩路立體聲,就需要10.584MB。而要記錄幾十分鐘的音樂就需要幾百兆的存儲容量。
把模擬信號轉換成數(shù)字信號的過程稱為模/數(shù)轉換,它主要包括:
采樣:在時間軸上對信號數(shù)字化;
量化:在幅度軸上對信號數(shù)字化;
編碼:按一定格式記錄采樣和量化后的數(shù)字數(shù)據。
脈沖編碼調制PCM(Pulse Code Modulation)是一種模數(shù)轉換的最基本編碼方法,CD-DA就是采用的這種編碼方式。
采樣頻率是指一秒鐘內采樣的次數(shù)。奈奎斯特(Harry Nyquist)
如果對某一模擬信號進行采樣,則采樣后可還原的最高信號頻率只有采樣頻率的一半,或者說只要采樣頻率高于輸入信號最高頻率的兩倍,就能從采樣信號系列重構原始信號。
根據該采樣理論,CD激光唱盤采樣頻率為44KHz,可記錄的最高音頻為22KHz,這樣的音質與原始聲音相差無幾,也就是我們常說的超級高保真音質(Super High Fidelity-HiFi)。
采樣的三個標準頻率分別為:44.1KHz,22.05KHz和11.025KHz。
量化位是對模擬音頻信號的幅度軸進行數(shù)字化,它決定了模擬信號數(shù)字化以后的動態(tài)范圍。由于計算機按字節(jié)運算,一般的量化位數(shù)為8位和16位。量化位越高,信號的動態(tài)范圍越大,數(shù)字化后的音頻信號就越可能接近原始信號,但所需要的存貯空間也越大。
量化位 等份 動態(tài)范圍(dB) 應用 8 256 48-50 數(shù)字 16 65536 96-100 CD-DA 聲道數(shù) 有單聲道和雙聲道之分。雙聲道又稱為立體聲,在硬件中要占兩條線路,音質、音色好,但立體聲數(shù)字化后所占空間比單聲道多一倍。
編碼的作用一是采用一定的格式來記錄數(shù)字數(shù)據,二是采用一定的算法來壓縮數(shù)字數(shù)據。
壓縮編碼的基本指標之一就是壓縮比:壓縮比通常小于1。壓縮算法包括有損壓縮和無損壓縮;有損壓縮指解壓后數(shù)據不能復原,要丟失一部分信息。壓縮比越小,丟掉的信息越多、信號還原后失真越大。根據不同的應用,可以選用不同的壓縮編碼算法,如PCM,ADPC,MP3,RA等等。
數(shù)據率為每秒bit數(shù),它與信息在計算機中的實時傳輸有直接關系,而其總數(shù)據量又與計算機的存儲空間有直接關系。因此,數(shù)據率是計算機處理時要掌握的基本技術參數(shù),未經壓縮的數(shù)字音頻數(shù)據率可按下式計算:
數(shù)據率=采樣頻率(Hz)×量化位數(shù)(bit)×聲道數(shù)(bit/s)
用數(shù)字音頻產生的數(shù)據一般以WAVE的文件格式存貯,以".WAV"作為文件擴展名。WAV文件由三部分組成:文件頭,標明是WAVE文件、文件結構和數(shù)據的總字節(jié);數(shù)字化參數(shù)如采樣率、聲道數(shù)、編碼算法等等;最后是實際波形數(shù)據。WAVE格式是一種Windows下通用的數(shù)字音頻標準,用Windows自帶的媒體播放器可以播放WAV文件。MP3的應用雖然很看好,但目前還需專門的播放軟件,其中較成熟的為RealPlayer。
為了存儲數(shù)字化了的音樂,就只能盡量開發(fā)高容量的存儲系統(tǒng)。在70年代末,終于開發(fā)出了利用激光讀寫的光盤存儲系統(tǒng)。因為這種光盤比起密紋唱片,無論在體積和重量上都要小得多,輕得多,所以稱它為CD(CompactDisk)。意思為輕便的碟片。而一張CD的容量大約為650MB,也就只能存儲61.4分鐘音樂。
純粹音樂CD通常也稱為CD-DA。DA就是數(shù)字音頻(Digital Audio)的縮寫。它的技術指標是由一本所謂的"紅皮書"所定義。這本紅皮書是菲立普公司和索尼公司在1980年公布的。以后,在1987年,又由國際電工委員會(IEC)制定為IEC908標準。根據這些標準可以比較精確地計算一張CD所能存儲的音樂時間。實際上在CD碟片中是以扇區(qū)為單位的,每個扇區(qū)中所包含的字節(jié)數(shù)為2352個字節(jié)??偣灿?45k個扇區(qū)。因此總的字節(jié)數(shù)為345kx2352=811440kB??梢源娣?6.92分鐘的立體聲音樂。還有一種方法來計算播放的時間,CD在播放時,其播放的速度為每秒鐘75個扇區(qū)。一張CD有345k個扇區(qū),因而可以播放的時間為345k/75=4600秒=76分40秒。兩種方法計算的結果是一樣的。
因為音頻信號數(shù)字化以后需要很大的存儲容量來存放,所以很早就有人開始研究音頻信號的壓縮問題。音頻信號的壓縮不同于計算機中二進制信號的壓縮,在計算機中,二進制信號的壓縮必須是無損的,也就是說,信號經過壓縮和解壓縮以后,必須和原來的信號一樣,不能有一個比特的錯誤。這種壓縮稱為無損壓縮。但是音頻信號的壓縮就不一樣,它的壓縮可以是有損的只要壓縮以后的聲音和原來的聲音聽上去和原來的聲音一樣就可以了。因為人的耳朵對某些失真并不靈敏,所以,壓縮時的潛力就比較大,也就是壓縮的比例可以很大。音頻信號在采用各種標準的無損壓縮時,其壓縮比頂多可以達到1.4倍。但在采用有損壓縮時其壓縮比就可以很高。下面是幾種標準的壓縮方法的性能。按質量由高往低排列。
需要注意的是,其中的Mbyte不是正好1兆比特,而是1024x1024=1048576Byte。必須指出,這些壓縮都是以犧牲音質作為代價的,尤其是最后兩種方法,靠降低采樣率和降低分辨率來取得的。這對音質的損失太大,所以這些方法并不可取。