《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 設計應用 > 基于顯著圖與稀疏特征的圖像視覺效果評價
基于顯著圖與稀疏特征的圖像視覺效果評價
2015年微型機與應用第8期
易 瑜1,薄 華1,孫 強2
(1.上海海事大學 信息工程學院,上海 201306;2.西安理工大學 自動化與信息工程學院,陜西 西安 710000)
摘要: 提出一種基于顯著圖與稀疏特征的圖像視覺評價算法,其中顯著圖類似于視覺閾值,提取出圖像中的視覺注意區(qū)域,并使用獨立成分分析(Independent Component Analysis ,ICA)等同于稀疏編碼,來提取該區(qū)域的稀疏特征。最后通過綜合特征相似性和灰度相關性,得到一種全參考圖像質量評價方法。通過在3個標準圖像數(shù)據(jù)庫測試的結果表明,相對于其他評價算法,該方法很好地擬合了人眼主觀評價。
Abstract:
Key words :

  摘  要: 提出一種基于顯著圖稀疏特征的圖像視覺評價算法,其中顯著圖類似于視覺閾值,提取出圖像中的視覺注意區(qū)域,并使用獨立成分分析(Independent Component Analysis ,ICA)等同于稀疏編碼,來提取該區(qū)域的稀疏特征。最后通過綜合特征相似性和灰度相關性,得到一種全參考圖像質量評價方法。通過在3個標準圖像數(shù)據(jù)庫測試的結果表明,相對于其他評價算法,該方法很好地擬合了人眼主觀評價。
  關鍵詞: 稀疏特征;顯著圖;ICA;圖像質量評價
0 引言
  在圖像的獲取、壓縮、傳輸、儲存和重構的過程中,經(jīng)常伴隨著圖像的視覺效果的變化,有很多方法可以用來度量這種變化對圖像視覺質量的影響。隨著圖像與視頻處理技術的發(fā)展,人們也越來越需要更加精確的圖像評價方法。
  圖像質量評價方法可以分成兩大類:通過人眼的主觀評價和使用算法模擬人眼視覺的客觀評價??陀^評價算法的理想效果是其預測評價結果能考慮人眼主觀評價的視覺機理??陀^評價方法又可分為三種類型:全參考、半?yún)⒖己蜔o參考圖像評價,本文提出的是一種全參考的評價方法,即參考圖像是完全已知的。
  在視覺領域,視覺皮層負責人對視覺世界大部分的意識感知,是HVS的重要組成部分[1]。稀疏編碼,類似于ICA[2],已被證明與視覺皮層測量有關,而且能提供很好的圖像質量的量化預測。本文所采用的方法是結合圖像顯著圖與稀疏特征,構造出一種度量圖像視覺效果的指標。參考文獻[3]提出了一種視覺信噪比方法(VSNR),該方法分為兩個階段:首先用視覺閾值篩選出視覺失真部分,然后量化失真部分,作為圖像視覺質量評價指標。本文中,顯著圖類似于視覺閾值,篩選出視覺重要的參考與失真圖像塊對,然后利用特征檢測矩陣提取圖像塊的稀疏特征,最后綜合失真圖像與原始圖像的特征相似度與灰度相關性,得到一個度量指標。
1 圖像視覺質量評價方法
  本文提出的評價方法的完整流程圖如圖1所示。

Image 001.png

  1.1 特征檢測矩陣的訓練
  每一幅圖像或圖像塊x都可以用矩陣A中的基向量與系數(shù)向量s的線性疊加來表示:x=A*s。通過轉化又可以變換為s=W*x(W為A的逆矩陣),系數(shù)向量s稱為圖像的稀疏特征。通常稀疏編碼的目的是為了得到一個權值矩陣W,本文稱其為特征檢測矩陣,將圖像塊變換成一個稀疏系數(shù)向量s。
  本文選擇FastICA算法[4]從矩陣z中學習得到特征檢測矩陣,z為原始樣本的轉換矩陣。首先通過定點法來更新正交矩陣Ww的每一列,ww是正交矩陣的列向量:
1.png

  其中,p代表一次迭代過程,E(·)表示期望,g(·)是方程G(·)的導數(shù),g′(·)是g(·)的導數(shù)。
2.png

  其中,迭代閾值為:
3.png

  M等于8。最終:
4.png

  V是在PCA降維過程中得到的8×64的白化矩陣,經(jīng)過一系列轉換最終得到8×64的特征檢測矩陣W。
  1.2 圖像顯著圖
  對于人眼視覺,并不是每一個圖像塊都具有同等的視覺重要性。可以通過一些量化手段,提取圖像中的視覺重要區(qū)域。本文選用一種譜殘余(Spectral Residual,SR)[5]的方法提取圖像的顯著區(qū)域。SR方法通過處理圖像的幅度譜得到殘余譜,再利用傅里葉變換得到空間域顯著圖。
  1.3 參考-失真圖像塊對的選擇
  本文用A表示參考圖像,B表示失真圖像,O表示參考圖像的目標圖。將這三幅圖像分成8×8且不重疊的圖像塊,然后將每個圖像塊展開成向量形式。
5.png

  其中,N表示圖像塊的個數(shù),E2)DODP7PHX4F17TV@7_1CU.pngJ8~@TE72}B6GO5[9F%{H1PR.jpg則表示為選擇后的圖像塊。
  1.4 特征提取與特征相似性測量
  選擇完參考-失真圖像塊對后,分別提取參考圖像與失真圖像塊的稀疏特征。經(jīng)過變換后的圖像塊向量都會變成一個8×1的稀疏系數(shù)向量。
6.png

  7.png

  Yref和Ydis分別為參考圖像與失真圖像的稀疏特征矩陣。所以,關于參考-失真圖像的特征相似性的測量可以表示為:
8.jpg

  其中,M和N分別代表特征矩陣的行數(shù)和列數(shù),C為一個接近于0的正實數(shù)。
  1.5 灰度相關性測量
  本文僅測量圖像顯著性區(qū)域的灰度相關性,其目的是為了減少非顯著區(qū)域對整體評價所產(chǎn)生的干擾。

9.png

  UB3XEGU$]%OHCELZFX~88)N.jpg分別表示Ath與Bth的均值,C1為一個接近于0的正實數(shù)。
  1.6 綜合評價
  整合以上兩種測量方法,可以得到一種綜合的評價指標:

10.png

  本文中,u的取值為0.55。
2實驗分析
  在實驗中,本文采用了三個獨立的圖像數(shù)據(jù)庫來驗證所提出的圖像視覺質量評價算法,分別是TID2008[6]、CSIQ[7]和A57[2]。該數(shù)據(jù)庫涵蓋了如壓縮效應、模糊、閃變效應噪聲和傳輸效應失真等,每一個圖像庫都附帶人眼主觀評價分數(shù)。本文使用了斯皮爾曼相關系數(shù)(SROCC)、皮爾遜相關系數(shù)(PLOCC)和均方誤差(RMS)評估指標來比較這些客觀結果與主觀結果。
  最后,將本文評價算法的性能評估結果與一些圖像評價算法進行比較,這些算法包括:PSNR、SSIM[8]、PHVSM[9]、IFC[10]、VSNR[3]以及MAD[7]。表1展示了最終的比較結果,其中權值平均表示根據(jù)各個圖像數(shù)據(jù)庫的情況加權求均值。對于評估指標SROCC、PLOCC和RMS,SROCC和PLOCC越接近1表示性能越好,而RMS則越小越好。
  從實驗的結果可以看出,在圖庫TID2008和CSIQ中,相比于其他算法,本文方法的性能更具有優(yōu)越性。但是由于SR方法在壓制圖像非顯著性信息的同時也壓制了顯著性信息,因此在強調細節(jié)重要性的A57圖庫中,本文方法的效果并不十分明顯。
3 結論
  人眼在處理自然場景或圖片時,并不是對每一個空間位置的畸變都能引起同等的視覺注意。本文正是基于這種理念,只對圖像中的顯著性區(qū)域進行分析,對該區(qū)域的每一個圖像塊的稀疏特征進行比較,力求做到更細化的處理。最終的實驗結果證明,本文方法能得到一個不錯的評價效果,但是對于SR方法的局限性仍有改進的空間。此外,用ICA來模擬視覺初期也可以用更加細化的方法替代,這些都是下一步的研究重點。
  參考文獻
  [1] SIMONCELLI E P, OLSHAUSEN B A. Natural image statistics and neural representation[J]. Annual Review of Neuroscience,2001, 24(1): 1193-1216.
  [2] HYVARINEN A, KARHUNEN J, OJA E. Independent component analysis[M]. John Wiley & Sons, 2004.
  [3] CHANDLER D M, HEMAMI S S. VSNR: a wavelet-Based visual signal-to-noise ratio for natural images[J]. Image Processing, IEEE Transactions on, 2007,16(9):2284-2298.
  [4] HYVARINEN A. Fast and robust fixed-point algorithms for independent component analysis[J]. IEEE Transactions on Neural Networks, 1999,10(3):626-634.
  [5] Hou Xiaodi, Zhang Liqing. Saliency detection: a spectral residual approach[C]. IEEE Conference on Computer Vision and Pattern Recognition, CVPR′07,IEEE, 2007:1-8.
  [6] PONOMARENKO N, LUKIN V, ZELENSKY A, et al. TID2008-a database for evaluation of full-reference visual quality assessment metrics[J]. Advances of Modern Radioelectronics, 2009,10(4):30-45.
  [7] LARSON E C, CHANDLER D M. Most apparent distortion: full-reference image quality assessment and the role of strategy[J]. Journal of Electronic Imaging, 2010,19(1): 011006-1-011006-21.
  [8] WANG Z, BOVIK A C, SHEIKH H R, et al. Image quality assessment: from error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612.
  [9] PONOMARENKO N, SILVESTRI F, EGIAZARIAN K, et al. On between-coefficient contrast masking of DCT basis functions[C]. Proceedings of the Third International Workshop on Video Processing and Quality Metrics, 2007.
  [10] SHEIKH H R, BOVIK A C, DE VECIANA G. An information fidelity criterion for image quality assessment using natural scene statistics[J].  IEEE Transactions on Image Processing, 2005,14(12):2117-2128.

此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。