<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

用于從給定圖像中識別目標銘板圖像的內容的裝置和方法_2

文檔序號:9911572閱讀:來源:國知局
,將所有文本行歸類為一個或多個子 結構。我們通過如下方式將文本行定義為子結構:
[0039] SS = {d,n,ct" ct2,…ctn}公式 3
[0040] 其中:d,n為文本行方向(水平或垂直)及文本行中的字符個數,ct^cb,…(^。為 文本行中字符的對應類型。
[0041 ] 通過遍歷由一個候選銘板圖像的、在文本行的方向上連續的候選連通分量構成 的、與目標銘板圖像中的子結構具有相同的方向、包括相同的字符數量的候選結構,計算每 個候選結構是目標銘板圖像中的文本行的置信概率。根據目標銘板圖像中的文本行之間的 相對位置,計算出一個候選銘板圖像中的、符合該位置關系的候選結構的總置信概率。將總 置信概率最高的候選銘板圖像作為目標銘板圖像,以及將總置信概率最高的候選銘板圖像 中的符合位置關系的候選結構的位置作為目標銘板圖像的內容的位置。
[0042] 具有相同的方向、包括相同的字符數量并且對應字符具有相同的字符類型的不同 文本行屬于同一子結構,其中,對應字符是指不同文本行中的位置順序相同的字符。
[0043] 其中,通過計算候選結構中的各個字符的字符類型與子結構中的對應字符的字符 類型相同的置信概率的平均值,來計算每個候選結構是目標銘板圖像中的文本行的置信概 率。
[0044] 例如,首先,可以通過連通分量的水平重疊和垂直重疊把連通分量聚集成水平行 或垂直行,然后把水平連通分量和垂直連通分量按水平方向和垂直方向升序排列。對于 每個水平子結構,遍歷所有水平行,計算子結構的置信度(公式4),并為每個子結構選擇 topN*m個候選。
[0045]
[0046] 其中:η是子結構字符個數,Pl為子結構字符類型的概率,topN是候選文本行個 數,m為具有相同子結構的文本行個數。
[0047] 最后,通過文本行的相對位置關系選擇相應的子結構,對于每個銘板,選擇具有最 高置信度的銘板布局作為最終銘板內容。
[0048]
[0049] 其中:pn為通過閉合路徑LSD線段方法檢測的候選銘板圖像,押為每個 候選銘板圖像的置信度。
[0050] 在步驟S203中,識別目標銘板圖像的內容。
[0051] 具體地,使用與每個字符的類型相同類型的第一識別引擎(例如,MQDF引擎),對 內容中的每個字符進行初次識別。如果第一識別引擎的可信度低于可信度閾值Th MQDF,則使 用與每個字符的類型相同類型、具有更高精確度的第二識別引擎(例如,CNN引擎),對內容 中的每個字符進行再次識別。
[0052] 在識別出內容中的每個字符之后還可以基于GPS信息對銘板圖像的內容進行校 正。具體地,基于目標銘板圖像的GPS位置,將識別出的內容與數據庫中按照銘板圖像的 GPS位置記錄的內容進行匹配,并且將數據庫中記錄的、與識別出的內容匹配度最高的內容 作為目標銘板圖像的內容,其中,在進行匹配時,數據庫中記錄的內容所處的GPS位置與目 標銘板圖像的GPS位置越接近,則該內容的匹配優先級越高。選擇匹配優先級最高的前N 個銘板內容作為匹配的目標銘板內容。如果匹配置信度TH gps比預定義的閾值高,則選擇數 據庫中的銘板內容作為識別的銘板圖像內容。
[0053] 根據本發明的實施例,利用線段檢測(LSD)算法,能夠快速并準確地檢測銘板圖 像。預定義的銘板布局能夠適用于具有各種語言的各種銘板。并且,通過對內容中的每個 字符進行再次識別以及基于GPS信息對銘板圖像的內容進行校正,能夠有效地提高銘板圖 像識別的準確性。
[0054] 以下參照圖5來描述根據本發明的實施例的用于從給定圖像中識別目標銘板圖 像的內容的裝置500。
[0055] 圖5是示意性地示出根據本發明的實施例的用于從給定圖像中識別目標銘板圖 像的內容的裝置500的框圖。其中,為了簡明起見僅僅示出了與本發明密切相關的部分。在 用于從給定圖像中識別目標銘板圖像的內容的裝置500中,能夠執行以上參考圖2所描述 的用于從給定圖像中識別目標銘板圖像的內容的方法。如圖5所示,用于從給定圖像中識 別目標銘板圖像的內容的裝置500可以包括候選銘板圖像獲取模塊501、目標銘板圖像確 定模塊502以及識別模塊503。
[0056] 具體地,候選銘板圖像獲取模塊501可以被配置成從給定圖像中獲取所述目標銘 板圖像的一個或多個候選銘板圖像。
[0057] 目標銘板圖像確定模塊502可以被配置成利用預先定義的所述目標銘板圖像的 布局,檢測每個候選銘板圖像,從而確定目標銘板圖像以及目標銘板圖像的內容的位置,所 述布局包括:文本行的數量、每個文本行的屬性、文本行之間的相對位置。
[0058] 識別模塊503可以被配置成識別所述目標銘板圖像的內容。
[0059] 文本行的屬性進一步可以包括:文本行的方向、文本行包括的字符數量及每個字 符的字符類型。
[0060] 圖6是示意性地示出根據本發明的實施例的目標銘板圖像確定模塊502的一個實 施例框圖。如圖6所示,目標銘板圖像確定模塊502可以進一步包括候選連通分量獲取單 元601、子結構歸類單元602和目標銘板圖像及內容位置確定單元603。
[0061] 具體地,候選連通分量獲取單元601可以被配置成通過與每個字符類型對應的每 個類型的識別引擎對一個候選銘板圖像的連通分量進行識別,從而獲取候選連通分量。
[0062] 子結構歸類單元602可以被配置成基于目標銘板圖像中的文本行的屬性,將所有 文本行歸類為一個或多個子結構。其中,具有相同的方向、包括相同的字符數量并且對應字 符具有相同的字符類型的不同文本行屬于同一子結構,其中,對應字符是指不同文本行中 的位置順序相同的字符。
[0063] 目標銘板圖像及內容位置確定單元603可以被配置成通過遍歷由所述一個候選 銘板圖像的、在所述文本行的方向上連續的候選連通分量構成的、與目標銘板圖像中的子 結構具有相同的方向、包括相同的字符數量的候選結構,并根據目標銘板圖像中的文本行 之間的相對位置,計算一個候選銘板圖像中的、符合該位置關系的候選結構的總置信概率, 將總置信概率最高的候選銘板圖像作為目標銘板圖像,以及將總置信概率最高的候選銘板 圖像中的符合所述位置關系的候選結構的位置作為目標銘板圖像的內容的位置。
[0064] 具體地,目標銘板圖像及內容位置確定單元603通過計算候選結構中的各個字符 的字符類型與子結構中的對應字符的字符類型相同的置信概率的平均值,來計算每個候選 結構是目標銘板圖像中的文本行的置信概率。
[0065] 圖7是示意性地示出根據本發明的實施例的候選連通分量獲取單元601的一個實 施例框圖。如圖7所示,候選連通分量獲取單元601可以進一步包括連通分量確定子單元 701和候選連通分量確定子單元702。
[0066] 連通分量確定子單元701可以被配置成根據連通分量屬于預定的字符類型的概 率,確定關鍵連通分量和非關鍵連通分量。具體地,如果連通分量屬于所述預定的字符類型 的概率中的最大值大于預定閾值,則將該連通分量作為關鍵連通分量,否則作為非關鍵連 通分量。
[0067] 候選連通分量確定子單元702可以被配置成其被配置成基于對所有關鍵連通分 量計算出的關鍵連通分量的屬性的平均值和偏差,確定候選連通分量。具體地,對所有關鍵 連通分量計算關鍵連通分量的屬性的平均值和偏差,如果非關鍵連通分量的屬性值落在由 所述平均值和偏差構成的范圍之外,則該非關鍵連通分量為噪聲連通分量,剩余的連通分 量和關鍵連通分量為候選連通分量。
[0068] 圖8是示意性地示出根據本發明的實施例的識別模塊503的一個實施例框圖。如 圖8所示,識別模塊503可以進一步包括初次識別單元801及再次識別單元802。
[0069] 初次識別單元801可以被配置成使用與每個字符的類型相同類型的第一識別引 擎,對所述內容中的每個字符進行初次識別,及
[0070] 再次識別單元802可以被配置成如果第一識別引擎的可信度低于可信度閾值,則 使用與每個字符的類型相同類型、具有更高精確度的第二識別引擎,對所述內容中的每個 字符進行再次識別。
[0071] 圖9是示意性地示出根據本發明的實施例的候選銘板圖像獲取模塊501的一個實 施例框圖。如圖9所示,候選銘板圖像獲取模塊501可以進一步包括直線段獲取單元901 和候選銘板圖像獲取單元902。
[0072] 具體地,直線段獲取單元901可以被配置成通過直線段檢測算法對所述給定圖像 進行檢測,從而獲取多個直線段。
[0073] 候選銘板圖像獲取單元902可以被配置成將由構成封閉路徑的直線段集合所限 定的部分,作為所述候選銘板圖像。
[0074] 另外,本發明的實施例的用于從給定圖像中識別目標銘板圖像的內容的裝置還可 以包括字符識別模塊和內容匹配模塊。字符識別模塊可以被配置成識別出內容中的每個字 符。內容匹配模塊可以被配置成基于目標銘板圖像的GPS位置,將識別出的內容與數據庫 中按照銘板圖像的GPS位置記錄的內容進行匹配,數據庫中記錄的內容所處的GPS位置與 目標銘板圖像的GPS位置越接近,則該內容的匹配優先級越高。
[0075] 根據本發明的實施例,能夠快速并準確地檢測銘板圖像。預定義的銘板布局能夠 適
當前第2頁1 2 3 4 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影