??? 1. MPEG標準的發(fā)展
??? MPEG是Moving Pictures Experts Group(動態(tài)圖像專家組)的縮寫。是一個致力于數(shù)字視頻、音頻技術發(fā)展及標準化的杰出組織,它是ISO(International Standard Organization)與IEC(International Electronic Committee)在1988年聯(lián)合成立的,正規(guī)的組織代號是ISO/IEC JTCI/SC29/WG11,成員專家來自于不同國家的最有業(yè)界影響力的研發(fā)機構。?
??? 在十多年的時間里,MPEG組織取得了豐碩的成果,自身也有了很大的發(fā)展。1992年11月,MPEG-1被批準,并于1993年被ISO組織接納為國際標準;1994年11月,MPEG-2標準發(fā)布,并在1995年成為國際標準;MPEG-4標準則于1999年和2001年分別有了版本1和版本2;目前,H.264/MPEG-4 AVC(即 ISO MPEG-4 Part 10)正在制定之中。?
??? 2. ISO MPEG-1 標準?
??? MPEG-1 制定于1992年,為工業(yè)級標準而設計,編號為ISO/IEC 11172。MPEG-1針對CIF標準分辨率(NTSC制為352×240;PAL制為352×288)的圖像進行壓縮,并在標準中規(guī)定了視音頻" title="視音頻">視音頻信息經(jīng)過壓縮后的數(shù)據(jù)碼率最大為1.5Mbps。MPEG-1可實現(xiàn)在不同帶寬的設備,如CD-ROM、Video-CD等數(shù)字媒體上進行存儲,也可以在局域網(wǎng)、ISDN網(wǎng)上進行視音頻信息的傳輸。?
??? 3. ISO MPEG-2 標準?
??? MPEG組織在1994年推出了MPEG-2壓縮標準,并在1995年成為國際標準,編號為ISO/IEC13818。MPEG-2標準是針對標準數(shù)字電視和高清晰度電視在各種應用下的壓縮方案和系統(tǒng)層的詳細規(guī)定,編碼碼率可達100Mbps。MPEG-2不是MPEG-1的簡單升級,它在系統(tǒng)和傳送方面作了更加詳細的規(guī)定和進一步的完善。MPEG-2特別適用于廣播級的數(shù)字電視的編碼和傳送,被認定為SDTV和HDTV的編碼標準。?
??? (1)MPEG-2標準的構成?
??? MPEG-2標準目前分為9個部分,各部分的內(nèi)容描述如下:?
??? 1) 第一部分-ISO/IEC13818-1,System:系統(tǒng),描述多個視頻,音頻和數(shù)據(jù)基本碼流合成傳輸碼流和節(jié)目碼流的方式。?
??? 2) 第二部分-ISO/IEC13818-2,Video:視頻,描述視頻編碼方法。?
??? 3) 第三部分-ISO/IEC13818-3,Audio:音頻,描述與MPEG-1音頻標準反向兼容的音頻編碼" title="音頻編碼">音頻編碼方法。?
??? 4) 第四部分-ISO/IEC13818-4,Compliance:符合測試,描述測試一個編碼碼流是否符合MPEG-2碼流的方法。?
??? 5) 第五部分-ISO/IEC13818-5,Software:軟件,描述了MPEG-2標準的第一、二、三部分的軟件實現(xiàn)方法。?
??? 6) 第六部分-ISO/IEC13818-6,DSM-CC:數(shù)字存儲媒體-命令與控制,描述交互式多媒體網(wǎng)絡中服務器與用戶間的會話信令集。?
??? 以上六個部分均已獲得通過,成為正式的國際標準,并在數(shù)字電視等領域中得到了廣泛的實際應用。此外,MPEG-2標準還有三個部分:第七部分規(guī)定與MPEG-1音頻非反向兼容的多通道音頻編碼;第八部分現(xiàn)已停止;第九部分規(guī)定了傳送碼流的實時接口。?
??? (2)MPEG-2編解碼原理?
??? MPEG-2視頻壓縮的原理是利用了圖像中的兩種特性:空間相關性和時間相關性。這兩種相關性使得圖像中存在大量的冗余信息。為了能夠有效的去除圖像中的冗余信息,MPEG-2標準中將編碼圖像被分為三類,分別稱為I幀,P幀和B幀。I幀圖像采用幀內(nèi)編碼方式。P幀和B幀圖像采用幀間編碼方式。P幀圖像只采用前向時間預測,B幀圖像采用雙向時間預測,可以大大提高壓縮倍數(shù)。?
??? MPEG-2的編碼碼流分為六個層次,從上至下依次為:視頻序列層(Sequence),圖像組層(GOP:Group of Picture),圖像層(Picture),像條層(Slice),宏塊層(MacroBlock)和像塊層(Block)。?
??? 在幀內(nèi)編碼的情況下,編碼圖像僅經(jīng)過DCT,量化器和比特流編碼器即生成編碼比特流。在幀間編碼的情況下,原始圖像首先與幀存儲器中的預測圖像進行比較,計算出運動矢量,由此運動矢量和參考幀生成原始圖像的預測圖像。而后,將原始圖像與預測像素差值所生成的差分圖像數(shù)據(jù)進行DCT變換,再經(jīng)過量化器和比特流編碼器生成輸出的編碼比特流。?
??? (3)MPEG-2中的Profile@Level?
??? 現(xiàn)有MPEG-2視頻標準的技術規(guī)范集包括5類(Profile)4級(Level)組成,并采用分級編碼。類和集的若干組合構成MPEG-2標準在某種特定應用下的子集。?
??? 級(Level)是指MPEG-2的輸入格式,標識從有限清晰度的VHS 質(zhì)量圖像到HDTV圖像,每一種輸入格式編碼后都有一個相應的范圍。共分4級:?
??? 1) 低級LL(Low Level),圖像輸入格式的像素是ITU-R Rec.BT 601格式的1/4,即352×240×30或352×288×25。?
??? 2) 主級ML(Main Level),圖像輸入格式符合ITU-R Rec.BT 601格式,即720×480×30或720×576×25。?
??? 3) 1440高級H14L(High 1440 Level),圖像寬高比為4∶3,采用1440×1080×30的高清晰度格式。?
??? 4) 高級HL(High Level),圖像寬高比為16∶9,采用1920×1080×30的高清晰度格式。?
??? 類(Profile)是指MPEG-2的不同處理方法,每一類都包括壓縮和處理方法的一個集合,較高的類意味著采用較多的編碼工具集,進行更精細的處理,達到更好的圖像質(zhì)量,同時實現(xiàn)的代價也更大。共分5類:?
??? 1) 簡單類SP(Simple Profile),使用最少的編碼工具集。?
??? 2) 主類MP(Main Profile),它比簡單類增加了一種雙向預測方法,在相同比特率的情況下,將給出比簡單類更好的圖像。?
??? 3) 信噪比可分級類SNRP(SNR Scaleable Profile)和空域可分級類SPP(Spatially Scaleable Profile),這兩種類允許將編碼的視頻數(shù)據(jù)分為基本層和附加層,提供了一種多種廣播的方式。?
??? 4) 高級類HP(High Profile),應用于圖像質(zhì)量、比特率要求更高的場合。?
??? (4)MPEG-2的特點及應用?
??? MPEG-2具有以下幾個突出特點:①支持的圖像分辨率最高,包括符合ITU-RRec.601(CCIR601)格式的標準分辨率的數(shù)字電視和更高分辨率的HDTV。②支持包括高速體育運動在內(nèi)的各種活動圖像。③支持的應用最為廣泛,既包括存儲媒體中的DVD,廣播電視中的數(shù)字廣播電視和HDTV,還可應用于交互式的視頻點播(VOD)和準視頻點播(NVOD)。④還能夠適配ATM等寬帶通信網(wǎng)。?
??? 4. ISO MPEG-4標準?
??? MPEG-4于1998年10月定案,在1999年1月成為一個國際性標準,隨后為擴展用途又進行了第二版的開發(fā),于2001年有了其第二個版本。MPEG-4的國際標準編號為ISO/IEC14496。MPEG-4的特點是其更適于交互AV服務以及遠程監(jiān)控,是一個有交互性的動態(tài)圖像標準。?
??? (1)MPEG-4標準的構成?
??? 1) 多媒體傳送整體框架(DMIF):主要解決交互網(wǎng)絡中、廣播環(huán)境下以及磁盤應用中多媒體應用的操作問題。通過DMIF,MPEG-4可以建立起具有特殊品質(zhì)服務(QoS)的信道和面向每個基本流的帶寬。?
??? 2) 數(shù)據(jù)平面:MPEG-4中的數(shù)據(jù)平面可以分為傳輸關系和媒體關系兩部分,并引用了對象描述(OD)和流圖桌面(SMT)的概念,使基本流和AV對象在同一場景中出現(xiàn)。?
??? 3) 緩沖區(qū)管理和實時識別:MPEG-4定義了一個系統(tǒng)解碼模式(SDM),該解碼模式描述了一種理想的處理比特流句法語義的解碼裝置,它要求特殊的緩沖區(qū)和實時模式。通過有效地管理,可以更好地利用有限的緩沖區(qū)空間。?
??? 4) 視頻編碼:MPEG-4支持對自然和合成的視覺對象的編碼,合成的視覺對象包括2D、3D動畫和人面部表情動畫等。?
??? 5) 音頻編碼:MPEG-4不僅支持自然聲音,而且支持合成聲音。它將音頻的合成編碼和自然聲音的編碼相結(jié)合,并支持音頻的對象特征。?
??? 6) 場景描述:場景描述主要用于描述各AV對象在具體AV場景下,如何組織與同步等問題,同時還有AV對象與AV場景的知識產(chǎn)權保護等問題。?
??? (2)MPEG-4編解碼原理?
??? a. 基本思想?
??? MPEG-4編解碼的基本思想是基于圖像內(nèi)容的第二代視頻編解碼方案,并將基于合成的編碼方案也結(jié)合在標準中。它根據(jù)圖像的內(nèi)容將圖像分割成不同的視頻對象VO(Video Object),在編碼過程中對前景對象和后景對象采用不同的編碼策略,對于人們所關心的前景對象,則盡可能的保持對象的細節(jié)及平滑,而對不大關心的后景對象采用大壓縮比" title="壓縮比">壓縮比的編碼策略。?
??? b. 編解碼的數(shù)據(jù)結(jié)構?
??? MPEG-4按照如下五個層次組織要編碼的圖像,從上至下依次為:視頻段VS(Video Session)、視頻對象VO(Video Object)、視頻對象層VOL(Video Object Layer)、視頻對象組層GOV(Group of Video Object Plane)、視頻對象平面VOP(Video Object Plane)。?
??? 在MPEG-4中,VO主要被定義為畫面中分割出來的不同物體,每個VO有三類信息來描述:運動信息、形狀信息、紋理信息。VO的構成依賴于具體應用和系統(tǒng)實際所處環(huán)境,在要求超低比特率的情況下,VO可以是一個矩形幀(即傳統(tǒng)MPEG-1中的矩形幀),從而與原來的標準兼容;對于基于內(nèi)容的表示要求較高的應用來說,VO可能是場景中的某一物體或某一層面,如新聞節(jié)目中的解說員的頭肩像 ;VO也可能是計算機產(chǎn)生的二維、三維圖形等。?
??? c. VOP編碼器結(jié)構?
??? 編碼器主要由兩部分組成:形狀編碼和傳統(tǒng)的運動紋理編碼,其中形狀編碼是MPEG-4在編碼任意形狀的VOP時所必須的。?
??? d. MPEG-4的編解碼流程及框架?
??? MPEG-4的編碼流程:第一步是VO的形成(VO Formation),先要從原始視頻流中分割出VO,之后由編碼控制(Coding control)機制為不同的VO以及各個VO的三類信息分配碼率,之后各個VO分別獨立編碼,最后將各個VO的碼流復合成一個位流。其中,在編碼控制和復合階段可以加入用戶的交互控制或由智能化的算法進行控制。現(xiàn)在的MPEG-4包含了基于網(wǎng)格模型的編碼和Sprite技術。在進行圖像分析后,先考察每個VO是否符合一個模型,典型的如人頭肩像,如是就按模型編碼;再考慮背景能否采用Sprite技術,如是則將背景生產(chǎn)一幅大圖,為每幀產(chǎn)生一個仿射變換和一個位置信息即可;最后才對其余的VO按上述流程編碼。MPEG-4的解碼流程則基本上為編碼器的反過程,這里不再贅述。?
??? (3)MPEG-4中的Profile@Level?
??? (4)MPEG-4的主要應用場合?
??? 從目前的情況看,MPEG-4主要被用于三個領域:數(shù)字電視、交互式的圖形應用(包括內(nèi)容上的合成技術)、交互式多媒體領域等。?
??? (5)MPEG-4的特點及優(yōu)勢?
??? 1) MPEG-4是做為一個國際化的標準來制定研究的,因而具有很好的兼容性及開放性。?
??? 2) MPEG-4提供高壓縮比的同時,對數(shù)據(jù)的損失很小,達到以最小的數(shù)據(jù)獲得最佳的圖像質(zhì)量的目的。?
??? 3) MPEG-4是個開放標準,因其高質(zhì)量的數(shù)字影像,以及允許內(nèi)容創(chuàng)建者從MPEG-2質(zhì)量一直到極低帶寬的Internet流式內(nèi)容全程進行品質(zhì)和帶寬的均衡,而被全世界的無線、電腦及娛樂公司廣泛采用。?
??? 4) 正如MPEG-2將使數(shù)字電視最終完全取代現(xiàn)有的模擬電視那樣,隨著MPEG-4新標準的不斷推出,數(shù)據(jù)壓縮和傳輸技術必將趨向更加規(guī)范化。?
??? 5. H.264/MPEG-4 AVC(ISO MPEG-4 Part 10)?
??? H.264(ITU-T命名),或稱之為MPEG-4 AVC(ISO/IEC命名),是一種由ITU-T與ISO/IEC正在聯(lián)合進行開發(fā)的視頻編解碼方案,即將成為MPEG-4標準的第10部分(ISO MPEG-4 Part 10)。關于該技術的視頻編碼方案,現(xiàn)在正式命名為ITU-T H.264或'JVT/AVC草案'。H.264/MPEG-4 AVC作為MPEG-4標準的擴展(MPEG-4 Part 10),充分利用了現(xiàn)有MPEG-4標準中的各個環(huán)節(jié)。H.264/MPEG-4 AVC就在現(xiàn)有MPEG-4 Advanced Simple Profile的基礎之上進行發(fā)展的。?
??? H.264/MPEG-4 AVC的編解碼方案流程主要包括如下5個部分:精密運動估計與幀內(nèi)估計(Estimation)、變換(Transform)及逆變換、量化(Quantization)及逆量化、環(huán)路濾波器(Loop Filter)、熵編碼(Entropy Coding)。?
??? 盡管H.264/MPEG-4 AVC這項技術雖然還沒有得到正式批準,但是其可以降低50%或更多帶寬的能力,能以少于1Mbps的數(shù)據(jù)率傳輸基于互聯(lián)網(wǎng)協(xié)議(IP)的廣播質(zhì)量級的視頻內(nèi)容,這是目前正式頒布的ISO MPEG-4及MPEG-2編解碼方案根本所不能比擬的。因而,H.264/MPEG-4 AVC將對所有要求高壓縮率、高質(zhì)量的應用領域產(chǎn)生深遠的影響。?
??? 目前Amphion Semiconductor、Envivio、Equator Technologies、iVAST、德州儀器、UB Video和VideoLocus等芯片制造商以及軟件技術供應商都對該項技術進行了相關的研究及產(chǎn)品開發(fā),其中VideoLocus公司推出了VLP4000系統(tǒng)用于H.264/MPEG-4 AVC編解碼、流媒體" title="流媒體">流媒體方案及性能的評估。?
??? 6. DV標準?
??? 數(shù)字攝像機記錄視頻不是以模擬信號,而是以壓縮的數(shù)字信號的方式。為避免出現(xiàn)不兼容的情況,這種技術的主要產(chǎn)品都符合一個數(shù)字壓縮標準:DV。很多國際知名的視頻廠商都發(fā)展和提供DV格式的產(chǎn)品,這其中的傳輸標準被稱為FireWire(IEEE 1394)。DV是一種將DCT壓縮的數(shù)字視頻信號記錄到盒式錄像帶的方法。?
??? (1)DV涉及的指標?
??? 1) 取樣頻率及取樣比:DV使用的是4∶2∶0的數(shù)字分量記錄系統(tǒng),視頻亮度取樣頻率為13.5MHz,色差信號取樣頻率是3.375MHz。?
??? 2) 量化深度:DV對取樣后的亮度及色差信號進行8-bit量化。?
??? 3) 視頻信號壓縮比:DV格式采用的是幀內(nèi)壓縮方法,壓縮比為5∶1,壓縮后視頻碼流在進一步處理后記錄在磁帶上。?
??? (2)DV(IEEE l394)接口?
??? IEEE l394是標準的高速、短距數(shù)據(jù)傳輸交換協(xié)議。IEEE1394已經(jīng)被數(shù)字VCR聯(lián)盟確認為標準的數(shù)字接口,被數(shù)字視頻協(xié)會確認為數(shù)字傳輸標準。VESA(視頻專家標準協(xié)會)認同1394用于家庭網(wǎng)絡,并且歐洲數(shù)字視頻廣播(DVB)也認同將IEEE1394用于數(shù)字電視接口。?
??? (3)DV的特點?
??? 1) DV格式具有優(yōu)異的圖像質(zhì)量,它具有高清晰度,寬色度帶寬,能還原色彩絢麗的圖像、無抖動的穩(wěn)定畫面等特點。?
??? 2) DV格式能對聲音進行數(shù)字記錄,為了與優(yōu)越的圖像相配合,DV格式提供了優(yōu)質(zhì)的PCM音頻記錄。?
??? 3) DV格式基于它的應用特點,不能調(diào)整輸出碼率。?
??? 4) 支持DV的MiniDV盒帶比VHS盒帶小巧許多,使得MiniDV的帶倉、磁鼓和帶盤機構等也相應變得更加精巧。?
??? 7. MXF格式標準?
??? 素材交換格式(Media eXchange Format, MXF)是廠商之間和主要組織(如Pro-MPEG、EBU和AAF協(xié)會)之間合作的巨大進展。MXF是一種在服務器、數(shù)據(jù)流磁帶機和數(shù)字檔案之間交換節(jié)目素材的文件格式。其內(nèi)容可能為完整的節(jié)目以及整套廣播電視節(jié)目或片段。MXF可自成體系運用,無需外部素材即可保存完整的內(nèi)容。目前素材交換格式(MXF)標準化工作已發(fā)展到第9版本。?
??? (1)MXF文件格式?
??? MXF把統(tǒng)稱為實體的視頻、音頻和節(jié)目數(shù)據(jù)(如文本)與元數(shù)據(jù)" title="元數(shù)據(jù)">元數(shù)據(jù)捆綁在一起,并將它們置于一個包內(nèi),其主體基于碼流并攜帶實體和某些元數(shù)據(jù)。它保存視頻幀的一個片段,每個片段輔之于有關的音頻和數(shù)據(jù)實體以及基于幀的元數(shù)據(jù)。后者一般包含時間碼和每個視頻幀的文件格式信息。主體可基于若干不同類型的素材(實體),包括MPEG、DV和非壓縮視頻/音頻,它還使用SMPTE KLV數(shù)據(jù)編碼系統(tǒng),這使之具有成為公認標準的優(yōu)勢。?
??? MXF是音頻/視頻/元數(shù)據(jù)的打包結(jié)構,由文件頭、文件尾、文件體以及可選的索引部分組成。索引部分包括部分元數(shù)據(jù)和文件參數(shù)用于文件訪問,文件體部分可以是多種視音頻格式,如MPEG,DV和非壓縮的AV數(shù)據(jù)。文件體由若干場景文件構成,每個場景文件都是由圖像、聲音和元數(shù)據(jù)組成的。?
??? (2)MXF的元數(shù)據(jù)(Metadata)?
??? 1) 元數(shù)據(jù)的含義?
??? 元數(shù)據(jù)就是與視音頻數(shù)據(jù)結(jié)合在一起的輔助信息,它記錄了與節(jié)目制作相關的數(shù)據(jù),如:拍攝時間、拍攝地點、人物、場景編號及其他相關信息。這些信息在節(jié)目制作、傳送、復制及播出的各個階段,始終與視音頻信號密切結(jié)合。?
??? 2) 元數(shù)據(jù)的作用?
??? 元數(shù)據(jù)(Metadata)在日后的素材管理、資料查找、交互式節(jié)目制作與播出等應用中,將大大提高我們的工作效率,并起到舉足輕重的作用。利用元數(shù)據(jù),我們可以輕松的實現(xiàn)素材查找。除了可以直接觀看視頻畫面之外,還可以通過元數(shù)據(jù)查看其他相關數(shù)據(jù),獲得更直觀、更豐富、更形象的資訊。?
??? (3)MXF與AAF的關系?
??? AAF是Advanced Authoring Format的縮寫,意為'先進制作格式'。AAF是一個協(xié)會,它包括了目前世界上主要的電子設備供應商、計算機軟硬件廠家和一些廣播機構。協(xié)會主要負責制定用于增強的編輯和制作的通用AV文件格式標準,即AAF格式。AAF格式是一種用于多媒體創(chuàng)作及后期制作、面向企業(yè)界的開放式標準。?
??? AAF是一種帶標簽和地址的圖像/聲音/元數(shù)據(jù)打包方式,?
??? MXF與AAF這兩種格式具有互補性。AAF可以對現(xiàn)有的各種媒體文件格式進行集成和補充;而MXF對AAF文件和現(xiàn)有的各種流媒體格式都有這樣的效能。MXF和AAF都可以單獨使用,它們在各自的應用領域各有所長;與此同時,用戶對任何一者無須有依賴性。例如,一個單純的廣播系統(tǒng)可以使用MXF格式;一個后期制作室可以只使用AAF格式;而一個帶有后期制作設施的廣播機構,則可以同時使用這兩種格式。?
??? MXF與AAF這兩種文件格式在很多方面非常相似,從這兩種文件的關系上來看MXF是AAF的子集。?
??? (4)MXF的作用?
??? 1) 使用MXF文件,我們可以利用成熟、實用且構造簡單、價格并不昂貴的IT網(wǎng)絡傳送高質(zhì)量的視音頻數(shù)據(jù)。?
??? 2) 應用MXF文件技術,可以在所有支持即將成為國際標準的MXF文件格式的各個廠家設備(錄像機、服務器、非線性制作設備)之間傳送視頻數(shù)據(jù)。?
??? 3) 除了提供更好的互操作性,即在不同的設備和不同的應用之間處理視頻和音頻。MXF另外的貢獻是傳送元數(shù)據(jù)。從一開始就把MXF作為一種新文件格式來開發(fā),因此對元數(shù)據(jù)應用加以大量的關注。這不僅對MXF文件的恰當運行非常重要,而且還將導致功能強大的新型媒體管理工具的出現(xiàn)。?
??? 二 流媒體標準?
??? 1. ISMA MPEG-4流媒體標準?
??? ISMA是國際互聯(lián)網(wǎng)流媒體聯(lián)盟(Internet Streaming Media Alliance)的簡稱,它是由蘋果、思科、IBM、Sun、Philips、Kasenna等產(chǎn)業(yè)界巨人于2000年12月14日發(fā)起并宣布成立,目前其正式成員達到30家以上。ISMA聯(lián)盟的宗旨為推動開發(fā)與使用IP端到端媒體流解決方案的國際開放性標準。其官方網(wǎng)站(www.ISM-Alliance.org)作用在于發(fā)表各項完成的規(guī)范并發(fā)布聯(lián)盟的活動信息。?
??? 由于MPEG-4作為MPEG-1及MPEG-2的替代技術標準,可以將較大的流媒體文件在保證視音頻質(zhì)量情況下壓縮的非常小,更利于在網(wǎng)絡上傳播?;诖?,ISMA MPEG-4標準正是由ISMA制定并發(fā)布的基于ISO MPEG-4的流媒體新標準。?
??? ISMA發(fā)布了新標準的第一個規(guī)范說明--ISMA 1.0。該規(guī)范說明允許用戶僅下載一個插件,就可以使用不同公司的播放器欣賞網(wǎng)絡音頻與視頻;而且使用范圍不局限于PC機,還包括各種掌上無線設備(如PDA、手機等)。?
??? ISMA 1.0目前有兩個版本:Profile 0和Profile 1。前者是為了無線網(wǎng)絡及帶寬較窄的網(wǎng)絡準備的,可以適用于手機、PDA等掌上無線設備;后者是為了寬帶設計的,可以應用于機頂盒以及PC機。ISMA希望MPEG-4 能夠最終代替MPEG-2標準,但是新標準在視頻效果及交互性方面有待改進,目前仍在不斷的發(fā)展及提高之中。?
??? 2. QuickTime?
??? (1)QuickTime MOV格式?
??? Apple公司的QuickTime MOV文件格式是數(shù)字媒體領域的工業(yè)標準。QuickTime MOV文件格式定義了存儲數(shù)字媒體內(nèi)容的標準方法,使用這種文件格式不僅可以存儲單個的媒體內(nèi)容(如視頻幀或音頻采樣),而且能保存對該媒體作品的完整描述。?
??? QuickTime MOV文件格式被設計用來適應為與數(shù)字化媒體一同工作需要存儲的各種數(shù)據(jù)。它將媒體描述和媒體數(shù)據(jù)分開存儲,媒體描述包含軌道數(shù)目、視頻壓縮格式和時間信息等,同時包含媒體數(shù)據(jù)存儲區(qū)域的索引。媒體數(shù)據(jù)是指所有的采樣數(shù)據(jù),如視頻幀和音頻采樣。由于這種文件格式能用來描述幾乎所有的媒體結(jié)構,是應用程序間(不管運行平臺如何)交換數(shù)據(jù)的理想格式。?
??? (2)QuickTime支持的ISO/ISMA MPEG4流媒體格式?
??? Apple公司的QuickTime從5.0版本開始采用MPEG-4相關的壓縮技術,并且在其最新版本QuickTime 6中率先提出支持ISO/ISMA MPEG-4流媒體格式(mp4文件格式),而且是世界上用于創(chuàng)建、流化和觀看MPEG-4內(nèi)容的首款完全媒體解決方案。?
??? QuickTime在ISO/ISMA MPEG-4的流媒體應用方面具有以下明顯特征:?
??? 1) 采用完全符合ISO MPEG-4標準的視頻編解碼,用于MPEG-4影像內(nèi)容的編碼和解碼。?
??? 2) 符合互聯(lián)網(wǎng)流式媒體聯(lián)盟(ISMA)的1.0規(guī)范,并全面支持ISMA 1.0標準中的兩個版本:ISMA Profile 0 和ISMA Profile 1。?
??? 3) 采用Instant-On Streaming(即時通媒體流)技術,其特點是可消除緩沖延時,達到即時進退、幀進、幀退、拖動間播放、停止播放后還能進行自由定位瀏覽等功能,使用戶能簡捷快速地掃過流式媒體內(nèi)容而定位到要觀看的特定部分。這是RealVideo和Windows Media目前根本不能達到的功能。?
??? 4) 在MPEG-4中采用高級音頻編碼(AAC)的音頻編碼技術,能夠以小得多的文件提供比MP3好得多的音質(zhì),也比Windows Media Audio(WMA)更強。?
??? 3. Windows Media Technologies?
??? Microsoft Windows Media 技術是一個能適應多種網(wǎng)絡帶寬條件的流式多媒體信息的發(fā)布平臺,提供密切結(jié)合的一系列服務和工具用以創(chuàng)造、管理、廣播和接收通過 Internet 和企業(yè) Intranet 傳送的極其豐富的流式化多媒體演示內(nèi)容,包括了流式媒體的制作、發(fā)布、播放和管理的一整套解決方案。另外,還提供了開發(fā)工具包(SDK)供二次開發(fā)使用。?
??? (1)Windows Media 9 Series Platform?
??? Microsoft Windows Media 9 Series Platform是一套涉及編解碼、服務器、播放器、軟件開發(fā)包等各個方面的完整多媒體解決平臺。它作為多媒體領域的最新核心技術,在編解碼質(zhì)量、穩(wěn)定性、集成性、流媒體性能、功能等方面都有了較大的提高,同時該平臺緊密的和Windows操作系統(tǒng)結(jié)合在一起,將在廣播、電視、網(wǎng)絡、遠程教學、遠程服務等方面有著廣泛應用。?
??? (2)Windows Media Video 9(WMV 9)?
??? Windows Media Video 9(WMV 9)是Microsoft視頻媒體技術的首要Codec,它派生于MPEG-4,幾個專有擴展功能使其可在給定碼率下提供更好的圖像質(zhì)量,在這種意義下,Windows Media Video 9是流式視頻中質(zhì)量最高的Codec之一。?
??? WMV 9的主要優(yōu)點包括:本地或網(wǎng)絡回放、圖像質(zhì)量優(yōu)秀、可擴充的媒體類型、部件下載、可伸縮的媒體類型、流的優(yōu)先級化、多碼率合成、多語言支持、環(huán)境獨立性、豐富的流間關系以及擴展性等。但是WMV 9也具有一些缺陷,如系統(tǒng)平臺只能采用Windows操作系統(tǒng),跨平臺支持能力差;轉(zhuǎn)碼生成WMV 9的效率較低;流式媒體內(nèi)容的瀏覽沒有采用QuickTime瀏覽 ISO/ISMA MPEG-4視頻內(nèi)容的方便等。?
??? 4. RealNetworks的RealVideo技術?
??? RealNetworks公司所制定的視音頻壓縮規(guī)范稱為RealMedia,是目前在Internet上相當流行的跨平臺的、客戶/服務器結(jié)構的多媒體應用標準,它采用音頻/視頻流和同步回放技術來實現(xiàn)在Internet上全帶寬地提供優(yōu)質(zhì)的多媒體,同時也能夠在Internet上以28.8kbit/s的傳輸速率提供立體聲和連續(xù)視頻。?
??? RealVideo技術的整套流媒體解決方案主要包括:?
??? 1) 客戶端播放軟件RealPlayer,可以獨立運行,也可以作為插件在瀏覽器中運行,目前最新版本為RealOne Player。?
??? 2) 制作端產(chǎn)品是內(nèi)容制作軟件RealProducer,它將其他各種媒體格式的文件壓縮轉(zhuǎn)換為Real流媒體格式文件,目前最新版本為Helix Producer Plus 9.0。第三方開發(fā)者可以通過RealNetworks公司提供的SDK將它們的媒體格式轉(zhuǎn)換成RealMedia文件格式。?
??? 3) 服務器端軟件RealServer用于提供流式服務,目前最新版本為Helix Server 9.0?
??? 5. DivX MPEG-4?
??? DivX MPEG-4的基礎技術來源于微軟的MPEG-4 V3版本,由DivXNetworks發(fā)起一個開放源碼項目ProjectMayo而開發(fā)出來的。?
??? DivX MPEG-4具有以下特點:MPEG-4算法采用完全符合ISO MPEG-4標準的OpenDivX Codec;畫質(zhì)優(yōu)秀、容量小;播放環(huán)境簡單方便;直接可以采用AVI文件進行流媒體播放等應用。?
??? 三 音頻編碼標準?
??? 1. LPCM?
??? LPCM(線性脈沖編碼調(diào)制)是一種非壓縮音頻數(shù)字化技術,是一種未壓縮的原音重現(xiàn),在普通CD、DVD及其他各種要求最高音頻質(zhì)量的場合中已經(jīng)得到廣泛的應用。?
??? 各種應用場合中的LPCM原理是一樣的,區(qū)別在于采樣頻率和量化精度不同。普通CD規(guī)格為16bit/44.1kHz,DVD的規(guī)格則有多種,量化精度可分為16bit、20bit、24bit,采樣頻率分為48kHz、96kHz。此外,LPCM信號中可錄入杜比環(huán)繞聲信息,供現(xiàn)有的杜比定向邏輯環(huán)繞聲系統(tǒng)使用。?
??? 2. MP3(MPEG Audio Layer-3)?
??? MP3是MPEG Audio Layer-3的簡稱,是從MPEG-1標準衍生的、開放的編碼方案,1993年由德國夫朗和費研究院和法國湯姆生公司合作發(fā)展成功。?
??? MP3音頻壓縮技術是一種失真壓縮,其原理是把聲音頻率中人耳幾乎聽不到的音域在音頻中去除,采用高效率的變換編碼音頻壓縮算法對聲音進行壓縮,從而使得文件體積大為縮小,可達到12∶1的壓縮比。?
??? MP3的頻率范圍最高為44kHz,最低為20Hz。在128Kbps的碼率下,MP3可以達到接近CD音質(zhì)的聲音質(zhì)量。但是由于損失了音頻中的甚高、甚低音部分(盡管人耳不是非常敏感),使MP3畢竟要比CD稍遜一些。?
??? 3. WMA(Windows Media Audio)?
??? WMA為Windows Media Audio的縮寫,是微軟公司制定的音樂文件格式。WMA Codec 是Microsoft音頻技術的首要Codec。據(jù)微軟自身發(fā)表的聲明,目前最新的版本W(wǎng)MA 9.0相對于WMA 8,在壓縮率上有著20%的提升。?
??? WMA類似于MP3,同樣是一種失真壓縮,損失了聲音中人耳極不敏感的甚高、甚低音部分。但與MP3相比較起來,仍然具有不少優(yōu)勢。?
??? 1) 它具有與MP3相當?shù)囊糍|(zhì),但容量更小。?
??? 2) 更先進的壓縮算法在給定速率下可獲得更好的質(zhì)量。?
??? 3) 特別適合于低速率傳輸。?
??? 4) 除了損失了的音頻成份外,WMA比起MP3在頻譜結(jié)構上更接近于原始音頻,因而相對起來具有更好的聲音保真度。?
??? 4. AAC(Advanced Audio Coding)?
??? AAC是高級音頻編碼(Advanced Audio Coding)的縮寫。AAC是由動態(tài)圖像專家組(MPEG)開發(fā)的,已經(jīng)被國際標準化組織(ISO)討論通過,成為了MPEG-2國際標準的一部分,同時它也是一種開放的音頻編碼標準。?
??? (1)AAC的編碼原理及特點?
??? 1) AAC是一種高壓縮比的音頻壓縮算法,但它的壓縮比要遠超過較老的音頻壓縮算法,如AC-3、MP3等。并且其質(zhì)量可以同未壓縮的CD音質(zhì)相媲美。?
??? 2) 同其他類似的音頻編碼算法一樣,AAC也是采用了變換編碼算法,但AAC使用了分辨率更高的濾波器組,因此它可以達到更高的壓縮比。?
??? 3) AAC使用了臨時噪聲重整、后向自適應線性預測、聯(lián)合立體聲技術和量化哈夫曼編碼等最新技術,這些新技術的使用都使壓縮比得到進一步的提高。?
??? 4) AAC支持更多種采樣率和比特率、支持1個到48個音軌、支持多達15個低頻音軌、具有多種語言的兼容能力、還有多達15個內(nèi)嵌數(shù)據(jù)流。?
??? 5) AAC支持更寬的聲音頻率范圍,最高可達到96kHz,最低可達8Hz,遠寬于MP3 20-44kHz的范圍?
??? 6) 不同于MP3及WMA,AAC幾乎不損失聲音頻率中的甚高、甚低頻率成分,并且比WMA在頻譜結(jié)構上更接近于原始音頻,因而聲音的保真度更好。專業(yè)評測中表明,AAC比WMA聲音更清晰,而且更接近原音。?
??? 7) AAC采用優(yōu)化的算法達到了更高的解碼效率,解碼時只需較少的處理能力。?
??? (2)專業(yè)評價?
??? 1) AAC以128Kbps(立體聲)的速率對音樂進行壓縮,然后經(jīng)由專家辨認,結(jié)論是其結(jié)果同原始未壓縮時的聲音'區(qū)別不出來'。?
??? 2) AAC以96Kbps的速度壓縮音樂,通常其壓縮后的質(zhì)量比MP3在128Kbps壓縮后的質(zhì)量還要高。AAC在128Kbps壓縮音樂后的性能比MP3在相同速度壓縮音樂后得到的性能高很多。?
??? 3) AAC是唯一一個在歐洲廣播聯(lián)盟主辦的64Kbps聽力測試中被評為'優(yōu)秀'的因特網(wǎng)音頻數(shù)字多媒體編解碼器。?
??? 4) 鑒于其卓越的性能和質(zhì)量,AAC已成為MPEG-4規(guī)范的核心,同時它還是因特網(wǎng)、無線網(wǎng)以及數(shù)字廣播網(wǎng)領域中的新一代音頻數(shù)字解碼器的選擇。?
??? 四 靜態(tài)圖像壓縮標準?
??? 1. JPEG標準?
??? JPEG標準,即國際多灰度靜止圖像數(shù)字壓縮編碼標準,由JPEG專家組(Joint Photographic Experts Group)于1991年3月提出的ISO CD10918號建議草案而來,其標準號為ISO 10918-1。JPEG是一個適用于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標準。?
??? (1)JPEG標準的組成部分?
??? JPEG標準包括基于DPCM(差分脈沖編碼調(diào)制)的無損壓縮編碼,基于DCT(離散余弦變換)和Fuffman編碼的有損壓縮算法兩個部分。前者不會產(chǎn)生失真,但壓縮比很??;后一種算法進行圖像壓縮信息雖有損失,但壓縮比可以很大,例如壓縮20倍左右時,人眼基本上看不出失真。目前我們對JPEG標準的應用主要是其高壓縮比的有損壓縮算法。?
??? (2)JPEG算法的三個基本步驟?
??? JPEG算法操作可分成以下三個基本步驟:?
??? 1) 通過離散余弦變換(DCT)去除數(shù)據(jù)冗余。?
??? 2) 使用量化表對DCT系數(shù)進行量化,量化表是根據(jù)人類視覺系統(tǒng)和壓縮圖像類型的特點進行優(yōu)化的量化系數(shù)矩陣。?
??? 3) 對量化后的DCT系數(shù)進行編碼使其熵達到最小,熵編碼采用Fuffman可變字長編碼。?
??? (3)JPEG的應用?
??? 鑒于JPEG優(yōu)良的品質(zhì),使得它在短短的幾年內(nèi)就獲得極大的成功,目前絕大多數(shù)的圖像都是采用JPEG的壓縮標準,各類瀏覽器、圖片瀏覽處理工具均支持JPEG圖像格式。同時由于JPEG格式的文件尺寸較小,Web頁有可能以較短的下載時間提供大量精美的圖像,使得JPEG成為網(wǎng)絡上最受歡迎的圖像格式。?
??? 2. JPEG2000標準?
??? 隨著多媒體應用領域的激增,傳統(tǒng)JPEG壓縮技術已無法滿足人們對多媒體圖像資料的要求。因此,更高壓縮率以及更多新功能的新一代靜態(tài)圖像壓縮技術 JPEG 2000 隨之誕生。?
??? JPEG2000標準同樣由JPEG 組織負責制定。自1997年3月開始籌劃,于2000年3月出臺。其標準號為ISO 15444。?
??? (1)JPEG2000編碼原理?
????
??? JPEG 2000與傳統(tǒng) JPEG 最大的不同,在于它放棄了 JPEG 所采用的以離散馀弦轉(zhuǎn)換(DCT)為主的區(qū)塊編碼方式,而改采用以小波轉(zhuǎn)換(Wavelet transform)為主的多解析編碼方式。小波轉(zhuǎn)換的主要目的是要將圖像的頻率成分抽取出來,分別加以控制及編碼。?
??? (2)JPEG2000的優(yōu)點:?
??? 1) JPEG2000作為JPEG升級標準,高壓縮比(低碼率)是其目標,其壓縮率比JPEG高約 30%左右。?
??? 2) JPEG2000同時支持有損和無損壓縮,其無損壓縮具有很好的實用價值,因此它適合保存重要圖片。?
??? 3) JPEG2000的一個極其重要的特征就是采用小波變換后,JPEG2000 能實現(xiàn)漸進傳輸,這也就是我們常說的'漸現(xiàn)'特性。它先傳輸圖像的輪廓,然后逐步傳輸數(shù)據(jù),不斷提高圖像質(zhì)量,讓圖像由朦朧到清晰顯示,而不必是像現(xiàn)在的 JPEG 一樣,由上到下慢慢顯示。?
??? 4) JPEG2000能方便的實現(xiàn)對碼流的隨機存取與處理,保證位錯誤的魯棒性。?
??? 5) JPEG2000支持所謂的'感興趣區(qū)域'特性,你可以任意指定圖像上你感興趣區(qū)域的壓縮質(zhì)量,還可以選擇指定的部份先解壓縮,這樣我們就可以很方便的突出圖片中的重點進行瀏覽。?
??? (3)JPEG2000圖片的壓縮?
??? 目前有很多公司、機構提供了JPEG2000的壓縮工具及編解碼器。主要有LuraWave SmartCompress Freeware for Windows、Elecard Wavelet Image Compressor等。其中以LuraTech的LuraWave SmartCompress 及相應編碼器生成的LuraWave(lwf)格式最有名。?
??? (4)常用軟件對JPEG2000的支持?
??? 鑒于JPEG2000圖片不能直接通過一些常用軟件顯示的問題,眾多廠家已經(jīng)開發(fā)出了各種的插件來解決該問題。在這方面,同樣以LuraTech開發(fā)的插件最有名。ACDSee 4.0以上的版本已經(jīng)能夠通過LuraTech的插件直接支持JPEG2000圖片(lwf格式)的顯示。LuraTech公司還推出了一系列讓 PHOTOSHOP 、IE 等常用影像、網(wǎng)絡軟件支持JPEG2000圖片的插件,較有效解決了JPEG2000圖片不能直接通過一些常用軟件顯示的問題。