以文本方式查看主題 - 曙海教育集團論壇 (http://www.xinguifushi.cn/bbs/index.asp) -- DSP2000技術(shù)討論 (http://www.xinguifushi.cn/bbs/list.asp?boardid=27) ---- DSP—數(shù)字化音頻領(lǐng)域的未來 (http://www.xinguifushi.cn/bbs/dispbbs.asp?boardid=27&id=1575) |
||
-- 作者:wangxinxin -- 發(fā)布時間:2010-11-20 13:38:45 -- DSP—數(shù)字化音頻領(lǐng)域的未來 隨著數(shù)字信號處理技術(shù)的日益推進, IT領(lǐng)域的科技成果越來越普遍的應(yīng)用于視音頻領(lǐng)域并大大的推動了視音頻科技的進步,其中DSP(Digital Signal Processor即數(shù)字信號處理器)在音頻領(lǐng)域內(nèi)的應(yīng)用就是一個很好的例子。 DSP的優(yōu)勢 要了解DSP的優(yōu)勢,就必須明白DSP與傳統(tǒng)微處理器在硬件基本架構(gòu)上的不同。 Von Neumann與Harvard基本架構(gòu) 所有的微處理器都是由幾個基本的模塊所組成:運算器以完成數(shù)學(xué)運算、存儲器和解碼器以完成類比信號與數(shù)位信號間的轉(zhuǎn)換。在程序中,在每一周期必須告知微處理器要做些什么。因此微處理器必須從儲存程序的存儲體取得控制指令與一些數(shù)據(jù)而加以運算。但是對于所有的微處理器并不是使用相同的方法,一般來說可分成Von Neumann與Harvard二種基本架構(gòu),同時又有取其二者優(yōu)點而衍生出多種的混合改良架構(gòu),在增加存儲器與周邊裝置后,就成為能作為數(shù)字信號處理應(yīng)用的微處理控制器。 DSP的Modified Harvard架構(gòu) DSP是屬于Modified Harvard架構(gòu),即它具有兩條內(nèi)部總線,一個是數(shù)據(jù)總線,一個是程序總線;而傳統(tǒng)的微處理器內(nèi)部只有一條總線供數(shù)據(jù)傳輸與程序執(zhí)行使用; 從上面我們已經(jīng)看到Modified Harvard架構(gòu)在大量數(shù)學(xué)運算方面有著強大的優(yōu)勢,在DSP內(nèi)部具有硬件乘法器,大量的寄存器,目前最快的可在一個指令周期內(nèi)完成32bit乘32bit的指令,而傳統(tǒng)的微處理器運算系以微代碼來執(zhí)行,遇到乘法運算指令時就得消耗掉好幾個指令周期,加上傳統(tǒng)的微處理器中的寄存器較少,不得不經(jīng)常從外部儲存器傳輸數(shù)據(jù)來進行運算,而DSP指令具備重新執(zhí)行功能,因此在數(shù)學(xué)運算速度超越一般傳統(tǒng)的微處理器。 DSP在音頻領(lǐng)域的應(yīng)用 由于不存在線形放大電路非理想傳輸函數(shù)所造成的失真缺點,運算速度又比傳統(tǒng)微處理器快,DSP已普遍應(yīng)用于視音頻領(lǐng)域的合成、辨識與編碼;由于對硬盤存儲容量的要求日益提高,使得對VCM(VOICE COIL MOTOR)的定位精度的要求也越來越嚴(yán)謹(jǐn),DSP IC已成為高容量硬盤機的核心元件;DSP還廣泛應(yīng)用在DAT、DLT等磁帶機上,用以控制轉(zhuǎn)速與磁頭讀寫位置;應(yīng)用于全球定位系統(tǒng)(GPS)的接收機之相關(guān)器(CORRELATOR)上,提供計算衛(wèi)星所發(fā)射的射頻信號至接收器距離的功能。圖象處理的離散余弦變換(DCT)應(yīng)用;電視信號的抗多經(jīng)干擾(Ghost Cancellation) 。至于對模糊失真控制(Fuzzy Control)的大量浮點運算,能達到即時要求,更是得心應(yīng)手。
主動噪聲控制 傳統(tǒng)的被動式隔音方法,單純以隔音材料阻隔噪聲,對中、低頻噪音源產(chǎn)生的噪聲幾乎無阻隔能力,因此必須以厚重的隔音材料方能產(chǎn)生效果。主動噪聲控制是以電子閉回路控制的方法,產(chǎn)生和原始噪聲反相的聲音,以抵消原噪聲(如圖-1)。其優(yōu)點在于它對于抑制低頻噪聲極為有效。其應(yīng)用上的限制在于它無法控制中高頻段的噪聲(1.5K赫茲以上)
在通訊的各個環(huán)節(jié),都可能產(chǎn)生惱人的噪聲,其綜合的影響,便是降低通訊效率、成功率。主動噪聲控制技術(shù)能在很多層面提高信噪比,且和傳統(tǒng)簡單的濾波器相比,它能動態(tài)地適應(yīng)各種狀況,過去濾波器所無法處理的不確定噪聲也可相當(dāng)程度地克服。 語音訊號處理 雖然目前許多資料已由數(shù)位編碼后,經(jīng)原有的語音通訊通道收發(fā)。但語音仍然穩(wěn)占所有通訊含量的第一位。對語音訊號的處理的需求,近年來呈現(xiàn)指數(shù)增長。語音技術(shù)可分為如下四項:語音增強(Speech Enhancement),語音辨識(Speech Recognition) ,語音編解碼(Speech Coding/Decoding),回聲抑制(Echo Suppression)。語音增強 圖-2
在信號處理上,針對應(yīng)用場合、背景噪聲特性、語音清晰度對可允許的語音失真的相對要求等 ,我們可制定不同的方案,以滿足任務(wù)需求。例如,語音識別軟體對語音信號的要求,就有別于人耳對語音信號的要求,因此,在完成通訊時,和在完成語音識別任務(wù)時,需使用不同的程序。針對不同任務(wù)研發(fā)機構(gòu)若不能對語音特性具備全面的了解與把握,是無法在這上面取得真正優(yōu)化的結(jié)果。 語音辨識 語音識別系統(tǒng)的核心,應(yīng)具有硬件要求少,自含時間矯正,和能量矯正的特點。目前已實際應(yīng)用的為小辭匯量(200字)系統(tǒng)的獨立語音識別,中辭匯量(1800字)的核心亦完成。在自動語音識別的發(fā)展方向上,將集中於發(fā)展語音控制技術(shù),而非語音輸入技術(shù)。重點在于首次識別的準(zhǔn)確率,而非混合語意的輔助識別。 語音編、解碼 由于在DSP具有語音處理上的強大功能,因此才有可能在語音編碼的設(shè)計、使用上,偏重使用壓縮比較高的“編碼激勵線性預(yù)測”(CELP)型算法。目前使用的開放標(biāo)準(zhǔn)為ITU的G.723.1,這種算法廣泛使用于IP的編解碼上,具有6.3Kbps和5.3Kbps兩種傳輸率,語音品質(zhì)高,抗噪聲能力和計算負(fù)荷適中?商峁┯脩羰褂渺陡鞣N平臺上。同時,專屬的2.4Kbps的語音編碼算法也在開發(fā)中,預(yù)計該算法將在語音品質(zhì)、抗噪聲能力、語音壓縮比、計算負(fù)荷、計算延時上取得更好的平衡。因以硬體性能不斷的提升,會適配較大的計算量的編碼方式,根據(jù)信息論的原理,若在不降低確定的信號指標(biāo)的條件下,如果采用高的壓縮比方式則必然相對的應(yīng)用大運算量的編解碼方式,以在高壓縮比的情況下取得較好的音頻性能。 回聲抑制 在長距離通訊及活動通訊中,經(jīng)常會被回聲所困擾。無論是線性回聲,或是音響回聲,當(dāng)延時超過0.5秒 ,都會在接收端清晰的收到。針對這兩種現(xiàn)象,各有適用的回聲抑制算法;贒SP的算法穩(wěn)定、簡潔,不但抑制響應(yīng)速度快,而且對Double Talk、Near-End-Speech及靜音狀態(tài),皆能保持降噪性能。同時因為線性回聲時間延遲可在1毫秒到900毫秒的大范圍內(nèi)變動,同樣有基于DSP專屬的算法來克服這種變異性對系統(tǒng)帶來的額外負(fù)荷(在傳統(tǒng)的回聲抑制系統(tǒng)中,300毫秒的延時意味者系統(tǒng)性能價格比的急劇劣化)。而這些算法的源代碼亦能應(yīng)用在各種通訊平臺上,解決長程通訊各環(huán)節(jié)所產(chǎn)生的問題。 音樂訊號處理 自從數(shù)字化的音樂規(guī)范開始流行后,因數(shù)字信號處理所附帶的彈性因素,已在影音訊號的儲存 、傳送、播放上,產(chǎn)生了許多開放規(guī)范和專屬規(guī)范。對使用者而言,它們帶來的效果,除了更耐久更廉價的儲存媒介、更多元化的接收管道外,也包括更絢麗的視聽效果。但在終端獲得和原始影音信號源相當(dāng)?shù)挠耙粜Ч侥壳盀橹苟既匀皇前嘿F且不見得有效的。為了實現(xiàn)所謂的“環(huán)場音效”,目前已有諸如Dolby Surround、Dolby ProLogic、AC-3 、THX等各式開放規(guī)范,也有商品化的解碼晶片。但整個環(huán)節(jié)中最弱的一環(huán),是在由揚聲系統(tǒng)到人耳的這一段。這一段的傳遞函數(shù)因不同的聽音者,不同的聽音環(huán)境而隨機的改變,甚至差異極大。原始錄音工程師的心血,在這一段經(jīng)常被糟蹋無遺。而且和傳統(tǒng)音響系統(tǒng)相同,這個性能最不容易把握的環(huán)節(jié),往往也是投資昂貴的一個環(huán)節(jié)。 且以DSP動態(tài)的 補償聲場的變異,基本上可以做到使用一個低成本基于DSP技術(shù)的系統(tǒng)去替代昂貴的非DSP的高檔系統(tǒng),完整還原原始錄音效果。(如圖-3) DSP以其強大的運算能力及優(yōu)良的性能價格比已經(jīng)成為越來越多的數(shù)字化視音頻設(shè)備的核心構(gòu)件,隨著科技的進步,DSP技術(shù)的日益完善,相信DSP的未來就是數(shù)字化音頻領(lǐng)域的未來。 |