專利名稱:基于隱含主題分析的不良圖像檢測方法
技術領域:
本發明屬于計算機視覺與模式識別的交叉領域,特別涉及基于隱含主題分析的不良圖像語義分類方法,可用于過濾圖像中的色情信息。
背景技術:
隨著20世紀90年代互聯網的蓬勃興起,網絡上的各種信息飛速增長和傳播。特別是隨著3G時代的來臨以及融合網絡概念的提出,圖像以彩信、手機視頻流等為載體在即時通信領域中高速傳播,其中包含大量的淫穢色情等不良信息。大量不良信息的傳播對人們身心健康產生不利影響,因此,提出一種先進的不良信息過濾方法具有深遠意義。對于不良信息過濾,如何正確完成不良信息的檢測成為關鍵,不良信息檢測任務包含如下兩步圖像鑒別性信息提取與描述;圖像隱含語義主題分析與分類。下面分別從這兩個方面的研究現狀、發展動態及其在不良圖像信息檢測中的應用進行綜述與分析。(1)圖像鑒別性信息提取與描述不良圖像中通常裸露大量的皮膚區域和人體隱私器官,因此,首先需要檢測皮膚區域,然后提取皮膚區域內的有鑒別性能的特征點。早期的不良圖像信息檢測忽略了人體膚色區域內特征的代表性,而僅用膚色作為判別的線索,如Fleck等提出的“Finding Naked People. Proceedings of the European Conference of Computer Vision. 1996,2: 593-602. ”方法。膚色描述需要合適的色彩空間。研究表明在YCb(;色彩空間中的Cb(;色度分量上,人類皮膚區域具有良好的聚類特性。考慮到人種、光照色偏等因素對膚色范圍的影響,研究人員常采用高斯混合模型GMM統計出膚色的分布情況。(2)圖像隱含語義主題分析與分類目前,大部分不良信息檢測方法不考慮圖像所隱含的語義信息,導致包含大量類膚色區域的自然圖像或者裸露的人體正常區域被判斷成不良信息。因此,如何根據圖像的語義特征來有效區分圖像性質是提高不良信息檢測技術的關鍵。為分析圖像的語義內容, 受基于文本隱含主題分析方法的啟發,以隱含狄利克雷分配LDA模型為代表的主題模型被計算機視覺研究人員用來表征圖像的語義。LDA模型以詞袋模型為基礎,即將圖像看作一組視覺單詞的組合,視覺單詞之間無順序關系。詞袋模型包括三個步驟特征檢測、特征描述和碼本生成。特征通常用高斯差分算子來檢測;由于SIFT (Scale invariant feature transformation)描述子具有尺度、旋轉和仿射等不變性,通常用于描述特征;最后,對訓練圖像的描述進行K-均值聚類得到圖像的碼本。對圖像首先用高斯差分算子提取顯著特征點,然后對特征進行SIFT描述,將SIFT描述子通過向量量化的方法映射為碼本中某一個確定的視覺單詞。這樣,一幅圖像就可以被看作由若干視覺單詞組成,根據碼本中視覺單詞在一幅圖像中發生的頻次,即可將圖像表示成單詞的共現向量。多幅圖像的共現向量可組成一個共現矩陣,對共現矩陣進行LDA建模,LDA模型是一個圖像_主題-視覺單詞的三層貝葉斯網絡,即將圖像視為由若干隱含的主題組成,而主題由若干視覺單詞組成,由LDA模型可推斷出每幅中隱含主題的混合概率,這樣可以將圖像從高維單詞發生頻次的組合降為低維主題的混合概率。基于主題模型的不良圖像檢測才剛剛起步,Sheng Tang等人在“PornProbe AnLDA-SVM based Pornography Detection System. Proceedings of the Iit ACMInternational Conference on Multimedia. 2009,2 :593_602. ” 一文中采用 LDA 方法以圖像的色度信息為特征,結合SVM方法判別圖像的不良程度。基于主題分析的圖像語義描述是解決不良信息檢測極具潛力的發展方向之一。上述已有的不良信息分類方法主要存在以下三個主要問題
權利要求
1. 一種基于隱含主題分析的不良圖像檢測方法,包括如下過程(1)在顏色空間YCbCr中,構建雙高斯混合模型 (Ia)手動切割包含皮膚區域的圖像I ;(Ib)將圖像I從RGB顏色空間轉換到顏 色空間YCb(;,其中Y表示亮度分量,Cb是藍色色度分量,Cr是紅色色度分量;(Ic)去除亮度分量Y后,在Cb(;色度空間中采用高斯混合模型建立膚色模型,其高斯混合模型的概率密度函數為G(x I κ, ω,μ, Σ) = Σ二 ωηΝ°(χ | μη,Ση)其中K為高斯分量的個數,ω = (ωι,ω2,…,ωκ)是K個獨立高斯分量在混合模型中的權重,Σ κωη= 1,Σ = ( Σ 1;Σ 2,…,Σ κ)和μ = (μι,μ2,…,μκ)分別是各個高斯分量的協方差矩陣和均值向量,凡,=是第η個高斯分量的D維正態密度函數;利用期望最大化EM算法及最小描述長度準則MDL估計高斯混合模型的各個參數ω, μ,Σ,K,建立膚色模型;(Id)手動切割包含頭發區域的圖像I,重復上述步驟(lb)-(Ic),建立頭發區域模型; (Ie)將膚色模型與頭發區域模型級聯,建立雙高斯混合模型;(2)利用貝葉斯模型,剔除膚色區域中的頭發區域;(3)在膚色區域中用高斯差分算子檢測圖像I中的顯著特征點,去除特征點集中在膚色區域邊緣部分的特征點,得到有效的特征點集合V';(4)對特征點集合V'中的有效特征點用尺度不變特征轉換SIFT描述子進行描述,將每個特征點表示成128維的特征向量f ;(5)對訓練集中正常和不良圖像,通過步驟(1)_(4)得到所有圖像的有效特征點的 SIFT描述子,對所有SIFT描述子進行cosine距離測度下的K均值聚類,得到C個聚類中心,定義每個聚類中心為一個視覺單詞,得到圖像的碼本集合W = Iw1, w2, L,wj,其中,w表示視覺單詞,C表示碼本中視覺單詞的數目;(6)對訓練集中每一幅圖像有效特征點的SIFT描述子,通過向量量化的方法計算每個 SIFT描述子與碼本中每個視覺單詞的距離,將SIFT描述子量化為與其最近的那個碼本單詞;(7)根據步驟(5)得到的碼本單詞,統計第j幅圖像中所有單詞的詞頻-逆鑒別性文檔頻率tf-iddf值,將這些值按照單詞在碼本中出現的順序排列成一個有權重的共現向量… 來表示第j幅圖像;(8)所有訓練圖像共現向量組成共現矩陣,采用基于Gibbs取樣算法的LDA模型對共現向量進行LDA建模,得到訓練圖像的混合主題分布θ ;(9)將訓練圖像的混合主題分布θ及其類別標記輸入BP神經網絡,訓練基于BP神經網絡的不良圖像分類器;(10)對待測圖像,根據步驟(1)_(4)得到其有效特征點的SIFT描述子,再利用步驟 (6)-(7)的向量量化法及tf-iddf法,待測圖像被表示成碼本單詞的共現向量,將共現向量輸入到LDA模型得到待測圖像的主題分布θ ‘;(11)將待測圖像的主題分布θ ‘輸入到基于BP神經網絡的不良圖像分類器中,判斷待測圖像是否為不良圖像,最終完成不良圖像的檢測。
2.根據權利要求1所述的不良圖像檢測方法,其特征在于步驟(Ic)所述的利用期望最大化EM算法及最小描述長度準則MDL估計高斯混合模型的各個參數ω,μ,Σ,K,其步驟如下(Icl)隨機初始化高斯分量的個數K;(lc2)使用期望最大化算法EM估計初始化的K值下的高斯混合模型權重ω,均值向量 μ和協方差矩陣Σ的參數值;(lc3)利用距離公式d(l,m)計算高斯混合模型中每兩個高斯分量的距離,選出距離最近的兩個高斯分量,并將其合并為一個高斯分量,以使高斯分量的個數K減l,d(l,m)公式如下
3.根據權利要求1所述的不良圖像檢測方法,其特征在于步驟(8)所述的統計第j幅圖像中所有視覺單詞的詞頻_逆鑒別性文檔頻率tf-iddf值,按如下步驟進行(8a)統計第i個單詞Wi在第j幅圖像中發生的頻次為Iiij,統計第j幅圖像中所有單詞發生的頻次為ΣΙΡΜ,根據下式計算第j幅圖像中第i個單詞發生的詞頻tfy
4.根據權利要求1所述的不良圖像檢測方法,其特征在于步驟(9)所述的采用基于Gibbs取樣算法的LDA模型對共現向量進行LDA建模,其步驟如下
全文摘要
本發明公開了一種基于隱含主題分析的不良圖像檢測方法,主要解決現有的不良信息檢測方法不考慮圖像的語義信息,導致正常圖像誤判的問題。其方案是采用雙混合高斯模型來提取圖像的皮膚區域;通過詞袋模型生成膚色區域中所包含顯著特征的碼本庫,用詞頻-逆鑒別性文檔頻率法將每幅訓練圖像表示成一組有權重的單詞共現向量;所有共現向量組成一個共現矩陣,對共現矩陣進行LDA建模,得到圖像的主題;將訓練圖像的混合主題輸入BP神經網絡,進行不良圖像分類器的訓練;得到待測圖像的主題并輸入到不良圖像分類器,判斷其是否為不良圖像,完成不良圖像檢測。實驗表明,本發明能更好的分辨出不良圖像和正常圖像,可用于過濾圖像中的色情信息。
文檔編號G06N3/08GK102360435SQ20111032987
公開日2012年2月22日 申請日期2011年10月26日 優先權日2011年10月26日
發明者季秀云, 李東陽, 李潔, 王代富, 王華青, 田春娜, 蒲倩, 袁博, 趙林, 高新波 申請人:西安電子科技大學