《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 顯示光電 > 新品快遞 > AM335x 平臺(tái)在全彩LED 顯示墻異步控制卡的應(yīng)用

AM335x 平臺(tái)在全彩LED 顯示墻異步控制卡的應(yīng)用

2015-02-03

摘要 

全彩LED 顯示墻異步控制卡以成本低,集中管理等特點(diǎn),逐漸成為全彩LED 顯示墻控制卡的主流。AM335x 具有豐富的硬件外設(shè),基于 Linux 的軟件方案,包含 GPU Composition模塊能提供完整的多圖層疊加縮放等功能,十分適合全彩 LED 顯示墻的異步控制卡應(yīng)用。本文將從硬件和軟件兩個(gè)方面介紹基于AM335x 提供的相應(yīng)解決方案。 

1 全彩LED 顯示墻控制卡簡(jiǎn)介 

全彩 LE D顯示顯控制卡根據(jù)控制方式, 可以分顯兩大顯: 同步控制卡和異步控制卡。 

1.1 同步控制卡 

全彩LED 同步顯示墻主要由PC,同步控制卡和LED 顯示模塊組三部分組成,其連接方式如下: 

 

                圖 1 同步控制模塊圖

同步控制卡將DVI 信號(hào)轉(zhuǎn)成LED 顯示模組所需要的視頻信號(hào)格式,而且用以太網(wǎng)的方式傳輸給LED 顯示模組。同步控制卡本身不做視頻解碼等處理,僅做格式轉(zhuǎn)換。因此,一般采用FPGA 實(shí)現(xiàn)該功能。 

1.2 異步控制卡 

全彩LED 異步顯示墻由異步控制卡和LED 顯示模組組成,其連接方式如下: 

                  圖 2 異步控制卡模塊圖

由上圖,異步控制卡主要由兩個(gè)大的部分組成: 

· 視頻處理模塊。  

在此模塊中,SOC 從網(wǎng)口得到視頻流以及UI 的素材,進(jìn)行視頻解碼和UI 繪制,最后通過(guò)LCD 接口傳送給FPGA。 

· 視頻信號(hào)轉(zhuǎn)換模塊。 

在此模塊中,F(xiàn)PGA 將視頻信號(hào)轉(zhuǎn)換成LED 顯示模組所需的信號(hào),并通過(guò)網(wǎng)口輸出,該功能和同步控制卡的功能一樣。 

對(duì)比兩種方案,可見異步控制卡具體有成本低,便于集中管理的特點(diǎn)。 

2 異步控制卡系統(tǒng)分析 

下面從硬件和軟件兩個(gè)方面分析其主芯片的系統(tǒng)需求。 

2.1 硬件部分 

從硬件上看,視頻處理模塊部分主要由最小系統(tǒng)和外圍模塊兩大部分組成。 

· 最小系統(tǒng) 

最小系統(tǒng)由主芯片,電源系統(tǒng),DDR 和存儲(chǔ)四部分組成。 

不同級(jí)別的全彩屏對(duì)SOC 的處理能力有不同要求,具體的要求在軟件部分有說(shuō)明。 

· 外圍模塊 

- 音頻接口,LCD 接口。即LED 顯示墻的基本需求。 

- 網(wǎng)絡(luò)接口。百兆甚至千兆網(wǎng)口可以有效保證顯示內(nèi)容更新的高效性。 

- USB 接口。便于系統(tǒng)升級(jí),以及擴(kuò)展基于USB 各種外設(shè)。 

- SD 卡/TF 卡支持。便于系統(tǒng)升級(jí)以及內(nèi)容的本地更新。 

此外,異步卡一般和LED 顯示墻一起放置于室外,所以需要可工作在寬溫度范圍的工業(yè)級(jí)芯片。 

2.2 軟件部分 

軟件部分主要由操作系統(tǒng)和應(yīng)用軟件兩大部分組成。 

2.2.1 操作系統(tǒng) 

在異步控制卡行業(yè)中,主流系統(tǒng)選擇了Linux。 

2.2.2 應(yīng)用軟件 

應(yīng)用軟件主要包含三個(gè)部分: 

· 多媒體部分。 

用于對(duì)音視頻碼流的解碼。 

全彩屏主要分為高端和中低端兩個(gè)檔次: 

- 高端,視頻分辨率以及顯示分辨率要求在720p 分辨率以上。 

- 中低端 ,視頻分辨率以及顯示分辨率在640x480 以內(nèi)。 

由于LED 墻一般顯示物理面積大,而且亮度高,所以對(duì)視頻流的幀率要求較高,要求在每秒25 幀以上。因此,對(duì)于高端產(chǎn)品,一般需帶有視頻硬解碼模塊的主芯片,其價(jià)格一般較高;對(duì)于低端產(chǎn)品,使用軟解碼可實(shí)現(xiàn),所以需要運(yùn)算性能較強(qiáng)的主芯片,成本優(yōu)勢(shì)較好。 

· UI 部分。 

用于顯示字幕,圖片等,并處理UI 元素和視頻層的疊加。疊加部分。由于涉及到透明度,尺寸變換等,運(yùn)算需求也很大,所以需要主芯片具有相關(guān)的硬件加速模塊。 

· 遠(yuǎn)程控制部分。 

該部分主要實(shí)現(xiàn)上位機(jī)對(duì)各控制卡的遠(yuǎn)程控制,內(nèi)容更新等功能。該部分一般通過(guò)網(wǎng)絡(luò)應(yīng)用層實(shí)現(xiàn),各控制廠家有自己的協(xié)議。 

3 AM335x 的解決方案 

AM335x 是TI 新近推出的基于ARM Cortex-A8 的SOC,外設(shè)豐富,主要針對(duì)工業(yè)應(yīng)用領(lǐng)域。針對(duì)異步控制卡應(yīng)用,TI 也提供了基于Linux 的解決方案。下面將從硬件和軟件兩方面分別介紹該方案。 

3.1 硬件方案 

AM335x 具有一個(gè)強(qiáng)勁的核心Cortex-A8, 該核的運(yùn)算能力可達(dá)2.0DMIPS/MHz, 而且AM335x的主頻可到1GHz,即運(yùn)算總的能力可達(dá)2000 DMIPS,可流暢解碼640x480 的MPEG4 視頻流,而且有足夠的運(yùn)算余量繪制各種UI。 

此外,AM335x 還有一個(gè)3D 圖形加速核,SGX530,可支持OpenGL ES2.0。TI 在OpenGL ES2.0 之上提供了相應(yīng)的軟件方案,將SGX530 用于視頻幀的尺寸縮放以及實(shí)現(xiàn)對(duì)UI 層和視頻層的透明疊加的加速,后面軟件部分會(huì)詳細(xì)介紹該方案。 

同時(shí),AM335x 具有豐富的外設(shè),如下圖所示: 

                     圖 3 AM335x 異步控制卡硬件模塊圖 

由上圖可見AM335x 可完全涵蓋所有異步控制卡的外設(shè)需求,不需要其他擴(kuò)展。因此,總體成本具有很強(qiáng)競(jìng)爭(zhēng)力。 

TI 的開發(fā)板GP EVM(可查閱參考文檔 [1] )都可以很便利的進(jìn)行LED 應(yīng)用的評(píng)估和開發(fā),下文中的軟件方案是以GP EVM 為平臺(tái)進(jìn)行開發(fā)的。 

3.2 軟件方案 

軟件方案主要分為操作系統(tǒng)和應(yīng)用軟件兩大塊,具體介紹如下。 

3.2.1 操作系統(tǒng) 

如前所述,Linux 是異步控制卡的主流操作系統(tǒng),因此,本方案也選擇了Linux 作為平臺(tái)。AM335x EZSDK 提供了Linux 的完整開發(fā)包,包括板級(jí)支持包,交叉編譯器,文件系統(tǒng)等,可查閱參考文檔 [2] 。 

3.2.2 軟件模塊 

· UI 

在基于Linux 的異步控制卡平臺(tái)上,QT 以免費(fèi),開源,開發(fā)資料全以及在嵌入式系統(tǒng)上運(yùn)行效率高等特點(diǎn),已經(jīng)成為異步控制卡廠商開發(fā)UI 主要的平臺(tái)。在EZSDK 中已包含對(duì)QT4 的移植,可查閱參考文檔[3]。QT 在開源網(wǎng)站上也有很豐富的資源,可查閱參考文檔 [4] 。 

· 多媒體 

在EZSDK 中提供Gstreamer+ffmpeg 的多媒體解決方案,可查閱參考文檔[5] 和參考Gstreamer 文檔(參考文檔[6])。在多媒體中,由于格式比較多,各種編碼的復(fù)雜度以及編碼質(zhì)量差異較大是一個(gè)難點(diǎn)。而在LED 顯示墻的應(yīng)用場(chǎng)景中,多媒體碼流可接受轉(zhuǎn)碼方式,所以可指定碼流的格式。這里,推薦的多媒體格式MP4(MPEG4+AAC),其中MPEG4 選擇simple profile,對(duì)此種碼流,若分辨率為640x480,AM335x 可流暢解碼每秒25 幀以上。 

· 顯示后端

AM335x 只有一個(gè)功能簡(jiǎn)單的LCD 控制器,該控制器只支持RGB 格式,其在Linux 中的驅(qū)動(dòng)為framebuffer,可查閱參考文檔 [7] 。相應(yīng)的上述兩個(gè)模塊的顯示后端也以framebuffer 為基礎(chǔ):

- Gstreamer 的后端顯示插件采用fbdevsink。由于視頻解碼后的格式為YUV 格式,而AM335x 自帶的LCD 控制器只支持RGB 格式,因此此處可使用Gstreamer 的插件ffmpegcolourspace 進(jìn)行色度空間的轉(zhuǎn)換 

- QT 默認(rèn)以framebuffer 為顯示后端。 

Framebuffer 會(huì)接收來(lái)自QT 和Gstreamer 的圖像幀數(shù)據(jù),然后進(jìn)行OSD 的疊加和縮放等操作,數(shù)據(jù)流如下圖所示: 

                  圖 4 默認(rèn)軟件方案數(shù)據(jù)流程圖 

3.2.3 軟件復(fù)雜度分析 

在圖4 中,深色模塊為運(yùn)算較密集模塊,具體分析如下: 

· Gstreamer 的解碼和ffmpegcolourspace(CSC plugin)兩個(gè)模塊。 

ARM 雖然有較強(qiáng)的運(yùn)算能力,但對(duì)于較大分辨率的視頻解碼,視頻解碼的宏塊運(yùn)算等需較大運(yùn)算量。另外,色度空間涉及浮點(diǎn)運(yùn)算,而且為逐點(diǎn)運(yùn)算,所以運(yùn)算量需求也不小。 

以640x480 分辨率的MP4(MPEG4 simple profile+AAC) 為例,若幀率為30fps 時(shí),ARM 核的loading 在91%左右,其中ffmpegcolourspace 模塊約占運(yùn)算量的50%。

· Framebuffer 模塊。 

在該模塊中的 OSD 疊加指的是 UI 圖層和視頻圖層之間的疊加,而且是包含帶透明度的疊加,而圖層的縮放是指對(duì)原圖等比例的縮放,因而需對(duì)每一幀數(shù)據(jù)的每個(gè)像素點(diǎn)進(jìn)行浮點(diǎn)乘加運(yùn)算,參考ffmpegcolourspace 的運(yùn)算量,該部分運(yùn)算量也應(yīng)較大。 

可見,ARM 核無(wú)法獨(dú)自勝任系統(tǒng)所需的全部運(yùn)算。 

3.2.4 基于GPU 的優(yōu)化方案 – GPU Composition 

GPU Composition 軟件模塊,調(diào)用 SGX530 模塊進(jìn)行色彩空間轉(zhuǎn)換,OSD 疊加,圖層縮放功能,分擔(dān)A8 的運(yùn)算負(fù)載使其專注于QT,視頻解碼等應(yīng)用,下面將具體介紹。 

· GPU Composition 模塊的編譯和安裝 

在TI Wiki 上有明確說(shuō)明,可查閱參考文檔[8]。 

· GPU Composition 設(shè)計(jì)分析 

A. 各功能模塊 

                 圖 5 GPU Composition 軟件模塊圖  

 

SGX530 實(shí)現(xiàn)的功能模塊標(biāo)記為深色,具體功能如下: 

a. gpuvsink 該模塊設(shè)計(jì)為Gstreamer 視頻顯示后端插件,將視頻解碼器解出的YUV 數(shù)據(jù)幀,傳送給SGX530 模塊。按照標(biāo)準(zhǔn)的Gstreamer 視頻顯示后端插件設(shè)計(jì),可采用標(biāo)準(zhǔn)的顯示后端接口編程。對(duì)于視頻輸入的尺寸,要求其寬(width)為4 個(gè)像素點(diǎn)的倍數(shù)。其輸出視頻幀數(shù)據(jù)這里可稱為Video Plane。 

b. linuxfbofs 

該模塊 設(shè)計(jì)為QT 架構(gòu)中的顯示后端,將QT 的幀數(shù)據(jù)發(fā)送到SGX530 模塊中處理。linuxfbofs 和framebuffer 有同樣的接口,對(duì)于QT 應(yīng)用開發(fā)是透明的。其輸出界面幀數(shù)據(jù)為Graphics Plane。 

GPU Composition 

該模塊基于Open GL ES 2.0 接口設(shè)計(jì),對(duì)輸入的Video plane 和Graphics Plane 進(jìn)行色彩空間轉(zhuǎn)換,圖層縮放,OSD 疊加等操作,將最終的幀數(shù)據(jù)推送到Framebuffer 中顯示。 

B. 模塊間的數(shù)據(jù)流 

模塊間的數(shù)據(jù)以Plane 的形式傳遞,具體介紹如下: 

a. Plane 格式 

Video Plane 可支持YUV422,NV12,I420 和 YUV420 格式幀數(shù)據(jù)。 

Graphics Plane 可支持RGB565,RGB888 和ARGB8888 幀數(shù)據(jù)。 

GPU Composition 接收這些格式的幀數(shù)據(jù),并將其轉(zhuǎn)換為RGB 格式,進(jìn)行圖層縮放,OSD 疊加等操作。 

b. Plane 的內(nèi)存分配 

SGX530 輸入內(nèi)存(Buffer),只支持物理地址連續(xù)的Buffer。因此,在gpuvsink 和linuxfbofs 中,使用cmem(具體可查閱參考文檔[9])據(jù)此要求分配內(nèi)存Pool 來(lái)存儲(chǔ)幀數(shù)據(jù),需在Linux 啟動(dòng)時(shí)通過(guò)命令行參數(shù) ”mem=”配置預(yù)留給Kernel 的內(nèi)存,而剩下的內(nèi)存即是給cmem 所準(zhǔn)備,用于分配物理連續(xù)的內(nèi)存。 

其大小的計(jì)算公式如下: 

Pool size for Graphics Plane = width * height * Bytes Per Pixel 

Pool size for Video Plane = video frame width * height * 2 (Bytes Per Pixel) * 8 (buffers) 

對(duì)于一個(gè)Video Plane 可能需要多個(gè)Buffer,其具體個(gè)數(shù)定義在 

gpu-compositing/gpuvsink/src/gst_render_bridge.h 

#define PROP_DEF_QUEUE_SIZE 8 

c. Pool 傳遞 

Graphics Plane 和Video Plane 以指針的形式將Pool 傳遞給GPU Composition。 

C. 模塊間的控制流 

a. 配置信息數(shù)據(jù)結(jié)構(gòu) 

對(duì)于Graphics Plane,通過(guò)命名管道“"/opt/gpu-compositing/named_pipes/video_cfg_and_data_plane_X"”其配置信息在下面數(shù)據(jù)結(jié)構(gòu)中 

關(guān)于此配置信息中,比較重要的有如下幾點(diǎn): 

· 對(duì)于 QT 而言,對(duì)入的對(duì)對(duì)參數(shù)來(lái)自 Linux 的 FB 對(duì)對(duì),即對(duì) LCD 屏的對(duì)示分辨率。 

· 關(guān)于透明度(Alpha),Video plane 在底部,因此,Graphics Plane 決定 Video Plane的可對(duì)度。Alpha 可分對(duì):全局Alpha,整個(gè)Plane 使用同一的一個(gè)Alpha 對(duì);以像素點(diǎn)(Pixel)對(duì)對(duì)位的Alpha, 即像素的數(shù)據(jù)格式對(duì)ARGB8888, 可以在局部對(duì)置Alpha。 

· 可以通對(duì)對(duì)置對(duì)出的對(duì)構(gòu)體out_g 對(duì)對(duì)對(duì)出Plane 的對(duì)放。 

對(duì)于Video Plane, 配置信息如下: 

此配置結(jié)構(gòu)體中的輸入信息,會(huì)通過(guò)Gstreamer 的標(biāo)準(zhǔn)接口,通過(guò)前級(jí)的Gstreamer Plugin 進(jìn)行配置。如前所述,輸入視頻幀的寬(width)的像素點(diǎn)數(shù),需為4 的倍數(shù);對(duì)于輸出信息,和Graphics Plane 一樣,可以通過(guò)配置輸出數(shù)據(jù)結(jié)構(gòu)out,實(shí)現(xiàn)縮放功能。 

b. 命名管道( named pipe)配置信息 

上述配置信息,通過(guò)存放于文件系統(tǒng)中的命名管道,傳遞到GPU Composition 模塊。 

對(duì)于linuxfbofs,命名管道文件為/opt/gpu-compositing/named_pipes/gfx_cfg_plane_X 。 

對(duì)于gpuvsink,命名管道文件為/opt/gpu-compositing/named_pipes/video_cfg_and_data_plane_X 

4 方案實(shí)驗(yàn) 

筆者基于GPU Composition 方案,在AM335x  EVM 板上,開發(fā)了Gstreamer 和QT 應(yīng)用程序,以驗(yàn)證整個(gè)異步LED 顯示墻方案的性能。 

4.1 代碼及編譯 

代碼分成兩個(gè)應(yīng)用: 

· Gstreamer 部分,可在參考文檔[10]下載,為一個(gè)視頻播放器,可循環(huán)播放MP4 視頻 

· QT 部分,可以在參考文檔 [11] 下載,包括一個(gè)時(shí)鐘和滾動(dòng)字幕。 

可以根據(jù)參考文檔[8]進(jìn)行編譯。 

4.2 代碼運(yùn)行 

在AM335x EVM(AM3358 主頻為720MHz)上,運(yùn)行命令行如下: 

這里播放的視頻流為mp4 格式,其包含有分辨率為640x480 的MPEG4 simple profile 碼流以及AAC 音頻流。 

運(yùn)行效果圖如下: 

                                          圖 6 示例運(yùn)行效果圖 

可以從截圖中看到,OSD 層和視頻層的透明度疊加很清楚。 

4.3 性能分析 

關(guān)于GPU Composition 方案的性能提高,可以參考下面兩個(gè)截圖。 

圖7 中,沒有使用GPU Composition 方案,CPU 除了要做解碼,也需要做色彩空間轉(zhuǎn)換,其CPU 占用率達(dá)到91%。 

圖8 中,使用了GPU 分擔(dān)了視頻疊加,色彩空間轉(zhuǎn)換等運(yùn)算,在整個(gè)系統(tǒng)的總運(yùn)算量明顯大于僅僅Gstreamer 播放視頻的情況下,ARM 核的CPU 占用率僅僅只有58%,仍給應(yīng)用程序留下運(yùn)行的空間。 

更多的示例可查閱參考文獻(xiàn)[8]。 

                     圖 7 單Cortex-A8 軟解視頻流的系統(tǒng)負(fù)載 

                 圖 8 GPU Composition 方案視頻播放的系統(tǒng)負(fù)載

5 總結(jié) 

本文主要介紹了基于AM335x 的全彩LED 顯示墻異步控制卡方案,重點(diǎn)介紹了基于GPU 的軟件解決方案,在實(shí)現(xiàn)LED 顯示墻所需的視頻層和OSD 層疊加,縮放等功能的基礎(chǔ)上,仍給客戶定制的應(yīng)用程序提供了足夠的開發(fā)空間。希望該方案能加速客戶進(jìn)行異步控制卡的開發(fā)。 

6 參考文獻(xiàn) 

1.  http://www.ti.com/tool/tmdxevm3358 

2. http://processors.wiki.ti.com/index.php/Sitara_Linux_Software_Developer%E2%80%99s_Guide 

3.  http://processors.wiki.ti.com/index.php/Building_Qt 

4.  http://qt-project.org/ 

5.  http://processors.wiki.ti.com/index.php/ARM_Multimedia_Users_Guide 

6.  http://gstreamer.freedesktop.org/ 

7.  http://processors.wiki.ti.com/index.php/AM335x_LCD_Controller_Driver%27s_Guide 

8.  http://processors.wiki.ti.com/index.php/GPU_Compositing#About_GPU_Compositing 

9.  http://processors.wiki.ti.com/index.php/CMEM_Overview 

10. http://processors.wiki.ti.com/index.php/File:Playbin2.zip 

11. http://processors.wiki.ti.com/index.php/File:Clock.zip 

12. http://processors.wiki.ti.com/index.php/Graphics_SDK_Quick_installation_and_user_guide 

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。