<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

用于進行自動光學采集字符的方法、計算機程序產品、數據處理系統和掃描儀的制作方法

文檔序號:6594793閱讀:299來源:國知局
專利名稱:用于進行自動光學采集字符的方法、計算機程序產品、數據處理系統和掃描儀的制作方法
技術領域
本發明涉及一種用于進行自動光學采集字符的方法、計算機程序產品、數據處理系統以及光學掃描儀。
背景技術
由現有技術公知手動掃描儀,在該手動掃描儀中,借助于行掃描攝像機來掃描文件。被稱作行掃描攝像機的是數碼攝像機類型,這種攝相機類型不具有二維的傳感器,而是只具有單個的傳感器排。在這種情況下,通過文件相對于攝像機的不受控制的相對運動來采集圖像數據。在使用帶有行掃描攝像機的掃描儀時,特別的優點在于,行掃描攝像機的光學有效面明顯小于矩陣式攝像機(Matrixkameras)或平面式攝像機的光學有效面,由此, 例如由于灰塵顆粒而產生污染的可能性較小,并且能夠低成本地實現非常高的分辨率。尤其可以將行掃描攝像機實施為所謂的接觸式圖像傳感器(CIS)。但是,在借助于逐行掃描攝影機掃描文件時,缺點是文件相對于行掃描攝像機的前移與該行掃描攝像機的采樣頻率不同步,因為該相對運動是手動實行的,也就是說不受控制。由此導致所采集的圖像數據出現失真。為了解決該問題,例如由US 6,064, 779,US 6,608,297B2 和 US6, 619,551B2 公知 通過機械傳感器(例如輪子或輥子)來采集文件相對于行掃描攝像機的相對運動。與此相反地,US 5,023,922和舊2004/0165224々1提出借助于光學傳感器來采集該相對運動。然后,在機械地或光學地采集文件相對于行掃描攝像機的相對運動的基礎上,進行對圖像數據的矯正。此外,由US7,204,416B1公知借助于以矢量為基礎的模式識別來對由行掃描攝像機所記錄的圖像數據進行矯正。但是,這導致非常巨大的數據處理開支。此外,由US 6,965,703B1公知一種用于對借助于行掃描攝像機所記錄的圖像數據進行矯正的方法,在該方法中,對所掃描的文本的各個字母或者對所掃描的文本的很短的字母順序進行矯正。該方法也在為此所需要的數據處理開支方面具有缺點。

發明內容
與此相對地,本發明的目的在于,實現一種改進的用于借助行掃描攝像機來進行自動光學采集字符的方法、相應的計算機程序產品、數據處理系統以及掃描儀。本發明的目的分別利用獨立權利要求的特征來解決。本發明的實施方式在從屬權利要求中給出。根據本發明的實施方式,實現一種用于對文件進行自動光學采集字符的方法。“文件”例如可以是名片或有價證券或擔保文件(例如ID文件,也就是證明文件, 例如身份證、護照、駕駛證或工作證),或支付手段(例如現金、信用卡),或其他的資格憑證 (例如門票、托運單、簽證或類似物)。文件能夠以紙張和/或塑料為基礎地構成。文件尤
5其能夠書本狀地或卡片狀地構成。此外,該文件還可以是芯片卡。可以單面地或雙面地整面地掃描該文件。也可以只掃描該文件的一個帶有待光學采集的字符的分區域。在可機讀的證明文件(MachineReadable Travel Document-MRTD) 的情況中,該分區域是指所謂的可機讀區域(Machine Readable hne_MRZ)。該MRZ可以與國際民航組織(ICAO)的規范相應地實施。借助于行掃描攝像機掃描文件的至少一個分區域,其中,進行文件相對于行掃描攝像機不受控制的相對運動。因此,該行掃描攝像機例如可以是靜止的,以便手動地將文件引導經過行掃描攝像機上,或者該文件可以是靜止的,方法是將該文件例如平放在底板上,然后引導行掃描攝像機經過文件。另外,也可以讓使用者一只手拿著文件,另一只手拿著行掃描攝像機,從而在掃描時既移動文件又移動行掃描攝像機。文件相對于行掃描攝像機的相對運動是不受控制的,也就是說,該相對運動與行掃描攝像機的采樣頻率不同步。該不受控制的相對運動的運動側寫(Bewegimgsprofil)可以僅依賴于為了掃描該分區域,使用者如何使文件和行掃描攝像機彼此相對運動。因為在掃描過程中,文件相對于行掃描攝像機的相對運動與行掃描攝像機的采樣頻率不同步,所以圖像數據或多或少會失真。借助于預先給定的運動側寫來矯正圖像數據。 例如,針對不同的使用者來采集文件相對于行掃描攝像機的相對運動的運動側寫。從這些運動側寫中測定出平均的典型的運動側寫。于是,將這種典型的運動側寫定義為預先給定的運動側寫,借助于該預先給定的運動側寫來對圖像數據進行第一次矯正。也可以依賴于行掃描攝像機相對于文件的布置來選擇預先給定的運動側寫。如果用于掃描的相對運動在豎直方向上從上向下實行,那么可以假定在此實施的相對運動差不多相當于大約具有重力加速度的自由下落的相對運動。與此相反地,如果文件相對于行掃描攝像機的相對運動在水平方向上進行,那么可以假定該相對運動大約具有恒定的速度。在這種情況下,預先給定的運動側寫可以具有恒定的速度。在這里,把“運動側寫”理解為一種對文件相對于行掃描攝像機的相對運動的描述。例如,該運動側寫可以是在掃描過程中,行掃描攝像機依賴于時間地相對于文件的位置。在具有恒定的加速度的運動側寫中,如果從時間點Ttl上(也就是掃描過程開始時)的速度等于零出發,那么能夠以帶有唯一的運動側寫參數(即恒定的加速度)的方式來描述該運動側寫。可以例如通過機械的或光學的傳感器來采集掃描過程的開始,所述傳感器可以布置在掃描儀100上,以便感測(sensieren)何時文件122的下邊緣經過行掃描攝像機。但是,也可以不帶有這種額外的傳感器地感測掃描的開始,方法是處理器113為此持續地監測由行掃描攝像機所提供的圖像數據。同樣地適用于使用恒定速度的預先給定的運動側寫的情況。在這種情況下,將速度值作為運動側寫參數就足夠了。當然,尤其是當該運動側寫是源自實踐地測定的典型的運動側寫的時候,也可以將該運動側寫作為曲線來儲存。在矯正圖像數據之后,在經矯正的圖像數據的基礎上進行字符識別。“字符識別”可以是指所謂的文字識別,其也稱作光學字符識別(Optical Character Recognition-OCR)。針對字符識別,也可以使用智能字符識別(ICR)方法,在該智能字符識別方法中,在所述光學字符識別中連帶地考慮到上下文內容。
針對從經矯正的圖像數據中識別出的字符輸出全局的置信值(Vertrauenswert)。 該全局置信值是針對字符識別的可靠性的尺度(Mai3),更確切地說,該全局置信值與在經矯正的圖像數據中總共被識別出的字符相關,而與單個的字符無關。因此,全局置信值是針對所有從經矯正的圖像數據中被識別出的字符的唯一的值。全局置信值例如可以是在0% 與100%之間的百分比數據,其中,在0%的全局置信值的情況下,被識別出的字符是隨機值,而在100%的全局置信值的情況下,在字符識別的準確性方面存在絕對的可靠性。這種置信值也被稱作“分數(Score) ”,對此例如參看US 5,048,097和US 7,280,684B2。下面,從預先給定的運動側寫出發,迭代地改變運動側寫,其中,在每次迭代中都重新矯正圖像數據并且進行字符識別。根據優化法來實行運動側寫的改變,其中,將字符識別在每次迭代中所提供的全局置信值用作評估函數。在實施優化法之后,輸出借助于當前運動側寫所識別出的字符。按照本發明的方法的實施方式尤其具有優點,因為一方面不必機械地或光學地采集文件相對于行掃描攝像機的不受控制的相對運動,并且另一方面用于矯正圖像數據的數據處理開支相對小。根據本發明的實施方式,可以通過如下方式進一步改進字符識別,S卩,將文件或文件的所掃描的分區域分成區段。這例如可以根據預先給定的網格(Raster)來實行。用于進一步改進字符識別的出發點是基于優化法所測定出的改變的運動側寫。然后,將該優化法應用于圖像數據的各個區段,其中,代替全局置信值,使用如下局部置信值, 該局部置信值由針對相應被處理的區段的字符識別來提供。因此,局部置信值正如全局置信值那樣由字符識別來測定,兩者的區別在于,局部置信值僅涉及區段之一內部的正確的字符識別的可靠性。因此,區段式地應用優化法,以便區段式地改變運動側寫,從而使各個區段的字符識別的局部置信值最大化。根據本發明的實施方式,預先給定至少第一運動側寫和第二運動側寫。在掃描文件的至少分區域之后,借助于第一預先給定的運動側寫來對圖像數據進行第一次矯正以及借助于第二預先給定的運動側寫來對圖像進行第二次矯正。如果設置有一個或多個其他的運動側寫,那么相應地生成其他版本的經矯正的圖像數據。然后,借助OCR分別從經矯正的圖像數據中識別出字符,并且針對經矯正的圖像數據的每個版本都輸出全局置信值。然后,挑選出至少第一運動側寫和第二運動側寫中實現了帶有最大的全局置信值的字符識別的那個運動側寫。從至少第一運動側寫和第二運動側寫中挑選出的該運動側寫充當根據用于使全局置信值最大化的優化法對運動側寫進行迭代地改變的出發點。第一運動側寫例如可以是加速度恒定的運動側寫。恒定的加速度尤其可以約等于重力加速度g。與此相反地,第二運動側寫可以是速度恒定的運動側寫。如果例如行掃描攝像機是靜止的,并且使用者必須手動地使待掃描的文件豎直地從上向下經過行掃描攝像機,那么令人感到意外地可以將使用者分成兩組當將文件引導經過行掃描攝像機時,第一組使用者讓持有文件的手基本上自由下落。與此相反地,第二組使用者盡力使文件以近似恒定的速度經過行掃描攝像機。基于所述使用者行為,相應的第一運動側寫和第二運動側寫的預先給定尤其具有優點,因為這些運動側寫中的一個運動側寫已經近似地相應于在掃描過程中文件相對于行掃描攝像機的不受控制的相對運動的實際上的運動側寫。于是,利用較少次數的迭代就足夠完成該優化法,并且該優化法還提供較好的結果。在另一方面,本發明涉及一種計算機程序產品,帶有用于進行如下步驟的能執行的程序指令(Programminstruktion)輸入圖像數據,該圖像數據由行掃描攝像機從文件的至少一個分區域中通過掃描來采集;借助于文件和行掃描攝像機的相對運動的預先給定的運動側寫來矯正圖像數據;在經矯正的圖像數據中進行字符識別,其中,測定針對識別出的字符的準確性的全局置信值;迭代地改變運動側寫,其中,在每次迭代中,利用改變的運動側寫來矯正圖像數據并且進行字符識別,并且其中,根據用于使全局置信值最大化的優化法來實行迭代地改變。在另一方面,本發明涉及一種數據處理系統,該數據處理系統帶有用于輸入圖像數據的機構,這些圖像數據由行掃描攝像機從文件的至少一個分區域中通過掃描來采集; 用于借助于文件和行掃描攝像機的相對運動的預先給定的運動側寫來矯正圖像數據的機構;用于在經矯正的圖像數據中進行字符識別的機構,其中,測定針對識別出的字符的準確性的全局置信值;用于迭代地改變運動側寫的機構,其中,在每次迭代中,利用改變的運動側寫來矯正圖像數據并且進行字符識別,并且其中,根據用于使全局置信值最大化的優化法來實行迭代地改變。在另一方面,本發明涉及一種用于對文件進行自動光學采集字符的掃描儀,該掃描儀帶有用于借助于行掃描攝像機來掃描文件的至少一個帶有字符的分區域的機構,其中,進行文件和行掃描攝像機不受控制的相對運動,由此,采集至少所述分區域的圖像數據;用于借助于文件和行掃描攝像機的相對運動的預先給定的運動側寫來矯正圖像數據的機構;用于在經矯正的圖像數據中進行字符識別的機構,其中,測定針對識別出的字符的準確性的全局置信值;用于迭代地改變運動側寫的機構,其中,在每次迭代中,利用改變的運動側寫來矯正圖像數據并且進行字符識別,并且其中,根據用于使全局置信值最大化的優化法來實行迭代地改變。根據本發明的實施方式,掃描文件的整個正面和/或背面。但是,僅以文件的分區域的通過掃描而采集到的圖像數據為基礎,迭代地測定所述改變的運動側寫。該分區域可以是MRZ。在通過實施優化法對用于矯正的運動側寫進行測定之后,借助于該運動側寫來矯正所有掃描到的圖像數據。


下面參考附圖詳細地闡述本發明的實施方式。其中圖1示出按照本發明的掃描儀的實施方式的方框圖;圖2示出按照本發明的方法的實施方式的流程圖;圖3示出按照本發明的數據處理系統的實施方式的方框圖;圖4示出按照本發明的方法的實施方式的流程圖。
具體實施例方式如下實施方式的彼此相應的部件都以相同的附圖標記來表示。圖1示出的是帶有行掃描攝像機102的掃描儀100。該掃描儀100具有用于存儲預先給定的運動側寫106的電子存儲器104。所述預先給定的運動側寫106可以例如以數字化的曲線或可參數化的計算規則的形式指出行掃描攝像機在掃描時間期間依賴于時間的相對于待掃描的文件的位置。在速度恒定的運動側寫106中,行掃描攝像機的位置可以通過公式s = ν · t給出,其中,S是行掃描攝像機與文件的前緣的距離,V是恒定的速度,而t是自掃描過程開始所經過的時間。如果預先給定的是帶有恒定的加速度的運動側寫106,那么相反計算規則是s = l/2a · t2,其中,a是加速度。例如,加速度可以與重力加速度相等。此外,存儲器104用于存儲改變的運動側寫108以及由行掃描攝像機102采集的圖像數據110。存儲器104還用于存儲經矯正的圖像數據112。掃描儀100具有處理器113,以便實施用于進行OCR的程序模塊114。除了通過 OCR識別的字符之外,該程序模塊114還提供單個的置信值,所述置信值是針對從經矯正的圖像數據112中正確識別所有字符的可靠性的尺度。那就是說,程序模塊114并不是針對每個識別出的字符都提供這種置信值,而是僅提供一個唯一的置信值,所述唯一的置信值總體上與從經矯正的圖像數據112中識別出的字符的準確性相關。這種置信值可以由程序模塊114例如通過對針對每個字符所測定的置信值取平均來獲得。如果經矯正的圖像數據 112整體經歷一次OCR,那么該置信值是全局置信值;相反,如果只有圖像數據112的一個區段經歷OCR,那么該置信值是局部置信值。此外,掃描儀100的處理器113用于實施程序模塊115。該程序模塊115用于借助于預先給定的運動側寫106或者借助于改變的運動側寫108來矯正圖像數據110。掃描儀100的處理器113還用于實施程序模塊116,該程序模塊用于執行優化法。 該優化法用于以如下方式為預先給定的運動側寫106的改變的最優化問題找出解決方案, 即,將置信值最大化,該置信值由程序模塊114基于借助于改變的運動側寫矯正的圖像數據112的OCR來測定。該優化法尤其可以是一種逼近法,該逼近法逼近地解決該最優化問題。掃描儀100連接在計算機118上,以便將由程序模塊114識別出的字符傳輸給計算機118。在那里,識別出的字符例如由應用程序120作進一步處理。掃描儀100例如用于掃描證明文件,尤其是文件122。文件122例如帶有護照照片 IM并且具有帶個人數據的文字區126。此外,文件122具有所謂的MRZ 128,所述MRZ帶有光學可讀的字符。例如,借助于行掃描攝像機102來掃描文件122的整個正面或者僅掃描MRZ 128, 方法是使用者手動地從上向下拖動文件122經過行掃描攝像機102。由此,行掃描攝像機 102采集圖像數據110并且將其存儲到存儲器104中。因為文件122和行掃描攝像機102 的相對運動在掃描過程期間不受控制,也就是說,以文件122相對于行掃描攝像機102的前進運動與行掃描攝像機102的重復頻率(Wiederholfrequenz)不同步的方式實行,所以,這樣采集到的圖像數據110或多或少會失真。為了矯正圖像數據110而假定在掃描過程期間,文件122相對于行掃描攝像機 102的不受控制的相對運動近似地與預先給定的運動側寫106相應。啟動程序模塊115用于矯正圖像數據110。該程序模塊使用圖像數據Iio和預先給定的運動側寫106,該程序模塊115借助于預先給定的運動側寫106對圖像數據110進行矯正,并且該程序模塊115將經矯正的圖像數據112保存在存儲器104中。接著,啟動程序模塊114,以便進行OCR,該程序模塊114使用經矯正的圖像數據 112。如果在此所測定的全局置信值已經處在閾值之上,那么將OCR的結果輸出到計算機 118上。如果相反不是這種情況,那么啟動程序模塊116,以便實施優化法。為此,改變預先給定的運動側寫106,并且將生成的、改變的運動側寫108保存在存儲器104中。例如可以使預先給定的運動側寫106增加或減小預先給定的值,例如方法是使運動側寫參數ν或a變大或變小預先給定的值。然后,重新開始實施程序模塊115,以便借助于改變的運動側寫108重新對圖像數據110進行矯正。經矯正的圖像數據112又被寫入到存儲器104中。然后,在這樣獲得的、經矯正的圖像數據112的基礎上,借助于程序模塊 114重新進行OCR。如果全局置信值現在處在閾值之上,那么中止執行優化法,并且將所識別出的字符輸出到計算機118上。相反,如果該全局置信值仍然處于預先限定的閾值之下的話,那么進行一次或多次進一步的迭代,直至該全局置信值達到閾值或滿足中止條件為止,例如最大次數的迭代。如果利用行掃描攝像機102掃描例如文件122的整個正面,那么在本發明的實施方式中可能發生的是為了執行該方法,僅應用從MRZ的區域中掃描的圖像數據。在已經迭代地改變運動側寫,直至與MRZ的圖像數據相關的全局置信值達到閾值或者滿足中止條件之后,緊接著將該改變的運動側寫用于矯正所有掃描的圖片數據,在此即是用于矯正文件的整個正面。這具有的優點是,僅在MRZ的圖像數據的基礎上進行矯正可以是支出較少的, 因為在MRZ方面可以將先驗信息(a priori Information)引入到OCR中,例如用于MRZ的字符、字符間距或其他由ICAO所詳細說明的特征。圖2示出相應的方法。在步驟200中,借助于行掃描攝像機掃描文件,其中,文件相對于行掃描攝像機的相對運動不受控制并且無法與行掃描攝像機的重復頻率同步。在步驟202中,這樣采集的圖像數據借助于預先給定的運動側寫來進行矯正。該預先給定的運動側寫例如可以是源自實踐地測定的典型的運動側寫,該典型的運動側寫以數字化的路徑-時間曲線的形式存儲在掃描儀中。該預先給定的運動側寫也可以存儲為唯一的運動側寫參數,例如恒定的速度ν或恒定的加速度a。在步驟204中,對經矯正的圖像數據進行OCR。針對OCR無法提供關于所識別出的字符的、足夠大的全局置信值的情況,在步驟206中執行迭代的優化法,以便使全局置信值最大化,其中,這通過在每次迭代中改變運動側寫來實行。因此,迭代包括改變基于上一次迭代而得到的運動側寫、借助于此次迭代的改變了的運動側寫對通過掃描所采集的圖像數據進行后續矯正以及對這樣得到的經矯正的圖像數據進行0CR,連帶輸出為此測定的全局置信值。于是,在步驟208中,在優化法的實施結束之后,輸出所識別出的字符。可選地,也可以輸出針對所識別出的字符而測定的全局置信值。圖3示出計算機118的實施方式,該實施方式集成有圖1所示的實施方式的掃描儀100的功能。因此,行掃描攝像機102直接連接在計算機118上。與圖1所示的實施方式的區別在于,存儲器104中存儲有兩個不同的預先給定的運動側寫,即運動側寫A106' 和運動側寫B106"。
10
從程序模塊115中與此相應地生成經矯正的圖像數據A112'和經矯正的圖像數據112 “,更確切地說,是在運動側寫A或運動側寫B的基礎上生成這些經矯正的圖像數據。處理器用于實施程序模塊130,以便挑選出運動側寫A和B之一作為用于借助于程序模塊116實施優化法的出發點。此外,處理器113用于實施程序模塊132,以便根據預先給定的網格將文件122分成區段134. 1至134. 5。為了對文件122的MRZ 1 進行自動光學采集字符,進行如下操作將MRZ 1 手動地并且不受控制地引導經過掃描攝像機102,從而行掃描攝像機采集圖像數據110,這些圖像數據被保存在存儲器104中。然后,啟動程序模塊115,該程序模塊借助于運動側寫A對圖像數據進行矯正。由此得到的經矯正的圖像數據A被保存在存儲器104中。此后,對圖像數據110進行第二次矯正,更確切地說是借助運動側寫B進行該第二次矯正。通過實施程序模塊115而生成的經矯正的圖像數據B同樣被存儲在存儲器104中。接著,啟動程序模塊114,以便根據經矯正的圖像數據A進行OCR并且根據經矯正的圖像數據B進行另一次OCR。針對經矯正的圖像數據A的OCR,由程序模塊114輸出全局置信值A,并且針對經矯正的圖像數據B的OCR,由程序模塊114輸出全局置信值B。程序模塊130將全局置信值A和B相互進行比較并且挑選出這兩個全局置信值中較大的那個全局置信值,并且也由此挑選出運動側寫A或B中的一個運動側寫。例如,如果全局置信值A大于全局置信值B,那么程序模塊130挑選出運動側寫A。在相反的情況下, 程序模塊130則挑選出運動側寫B。由程序模塊130挑選出來的運動側寫就是用于隨后通過程序模塊116來實施優化法的初始值。程序模塊116改變該被挑選出的運動側寫,并且將改變的運動側寫118存儲在存儲器104中。借助于改變的運動側寫108,對圖像數據110重新進行矯正并且在此基礎上進行OCR。該優化法一直迭代地進行,直至所得到的全局置信值達到閾值或者滿足中止條件為止,如同圖1所示的實施方式中的情況。為了進一步改善光學采集字符的質量,可以隨后將文件122分成區段134,如圖3 所示的那樣。為此,圖像數據110被分成相應的圖像數據區段。因此,針對區段134中的每個區段,都存在圖像數據區段,該圖像數據區段包括屬于相關的區段134的圖像數據。然后,針對圖像數據區段中的每個圖像數據區段,借助于程序模塊116實施優化法,更確切地說是從通過先前實施與圖像數據110相關的優化法所得到的改變的運動側寫 108出發來實施該優化法。因此,為了例如針對區段134. 1實施優化法,使用圖像數據110 的第一圖像數據區段以及改變的運動側寫108的相應的第一區段。進一步對改變的運動側寫108的該區段進行優化,以便優化用于該區段134. 1的OCR的局部置信值。針對區段134 中的每個區段進行類似的操作。于是,在針對區段134中的每個區段實施優化法之后,將這樣識別出的字符輸入到用于進行進一步處理的應用程序120中。圖4示出相應的流程圖。在步驟300中,借助于行掃描攝像機掃描文件的至少一個分區域。在步驟302. 1 中,利用預先給定的運動側寫A來矯正這樣采集到的圖像數據,并且在步驟304. 1中,在借助于運動側寫A進行矯正的圖像數據的基礎上進行OCR并且對此測定全局置信值A。
以類似的方法和方式,在步驟302. 2中,借助于預先給定的運動側寫B對圖像數據進行矯正,并且在步驟304. 2中,在利用運動側寫B進行矯正的圖像數據的基礎上進行OCR 并且測定全局置信值B。在步驟306中,挑選出運動側寫A和B中提供較高的全局置信值的那個運動側寫。 然后,從在步驟306中挑選出的運動側寫出發,在步驟308中實施優化法,通過該優化法,迭代地改變該挑選出的運動側寫,以便使全局置信值最大化。當運動側寫A和B分別以唯一的運動側寫參數ν或a的形式存在時,例如可以如下地實施這種優化法在步驟310中,使挑選出的運動側寫的運動側寫參數增大一個預先給定的值。然后,在步驟312中,在這樣改變的運動側寫的基礎上對圖像數據重新進行矯正,并且在步驟 314中,使在步驟312中矯正過的圖像數據經歷OCR并且對此測定出與所采集的字符相關的
置信值。在步驟316中檢驗該置信值是否處在先前迭代的置信值之上。如果當前迭代是第一次迭代,那么檢驗該迭代的置信值是否大于在步驟304. 1或304. 2中所提供的置信值。如果是這種情況,那么返回到步驟310,以便重新提高運動側寫參數。如果情況相反,那么在步驟318中使運動側寫參數的先前的增大撤消,并且取而代之使運動側寫參數減小一個預先給定的值。在此之后,從步驟318返回到步驟312。一直執行該迭代法,直至在步驟314中所測定的置信值達到閾值或滿足中止條件為止。該中止條件例如可以是迭代的最大次數。在步驟308中實施優化法之后,在步驟310中將圖像數據分成區段。緊接著,針對這些區段中的每個區段,區段式地實施步驟308中的優化法,以便區段式地進一步改善光學采集字符的質量。于是,充當評估函數的分別是在步驟314中針對圖像數據的區段所提供的局部置信值,該局部置信值與從該區段中識別出的字符有關。在步驟312中,在針對所有區段實施優化法之后,輸出所識別出的字符。附圖標記列表100掃描儀102行掃描攝像機104存儲器106運動側寫108改變的運動側寫110圖像數據112經矯正的圖像數據113處理器114程序模塊115程序模塊116程序模塊118計算機120應用程序122 文件
124護照照片
126文字區
128MRZ
130程序模塊
132程序模塊
134區段
權利要求
1.用于對文件(12 進行自動光學采集字符的方法,所述方法包括如下步驟-借助于行掃描攝像機(102)掃描所述文件的至少一個帶有字符的分區域(1 ),其中,進行所述文件和所述行掃描攝像機的不受控制的相對運動,由此,采集至少所述分區域的圖像數據(110),-借助所述文件和所述行掃描攝像機的相對運動的預先給定的運動側寫(106)來矯正所述圖像數據,-在經矯正的圖像數據(11 中進行字符識別,其中,測定針對識別出的字符的準確性的全局置信值,-迭代地改變所述運動側寫,其中,在每次迭代中,利用改變的運動側寫來矯正所述圖像數據并且進行所述字符識別,并且其中,根據用于使所述全局置信值最大化的優化法來實行所述迭代地改變。
2.根據權利要求1所述的方法,其中,只要達到中止條件,就結束所述運動側寫的所述迭代地改變,所述方法帶有如下其他步驟-將至少所述分區域分成區段(Π4),-從通過應用所述用于使所述全局置信值最大化的優化法而得到的運動側寫出發,區段式地迭代地改變所述運動側寫,其中,在與所述區段之一相關的每次迭代中,利用該區段的改變的運動側寫來矯正該區段的所述圖像數據并且進行所述字符識別,其中,根據用于使相關的所述區段中的局部置信值最大化的優化法來實行所述區段中的所述運動側寫的所述迭代地改變。
3.根據權利要求1或2所述的方法,其中,預先給定至少第一運動側寫(106')和第二運動側寫(106〃),并且其中,分別利用預先給定的所述運動側寫來矯正所述圖像數據并且進行對經矯正的圖像數據的字符識別,并且其中,挑選出所述運動側寫中提供最大的全局置信值的那個運動側寫用于迭代應用。
4.根據權利要求3所述的方法,其中,所述第一運動側寫具有恒定的加速度。
5.根據權利要求4所述的方法,其中,所述加速度是重力加速度。
6.根據權利要求3、4或5所述的方法,其中,所述第二運動側寫具有恒定的速度。
7.根據權利要求3至6中任意一項所述的方法,其中,所述運動側寫中的每個運動側寫都具有唯一的運動側寫參數,其中,所述運動側寫中的被挑選出用于所述迭代地改變的運動側寫的所述運動側寫參數通過其運動側寫參數的改變而改變。
8.計算機程序產品,帶有用于進行如下步驟的能執行的程序指令-輸入圖像數據(110),所述圖像數據由行掃描攝像機從文件的至少一個分區域中通過掃描來采集,-借助所述文件和所述行掃描攝像機的相對運動的預先給定的運動側寫(106)來矯正所述圖像數據,-在經矯正的圖像數據中進行字符識別,其中,測定針對識別出的字符的準確性的全局置信值,-迭代地改變所述運動側寫,其中,在每次迭代中,利用改變的運動側寫來矯正所述圖像數據并且進行所述字符識別,并且其中,根據用于使所述全局置信值最大化的優化法來實行所述迭代地改變。
9.根據權利要求8所述的計算機程序產品,其中,所述能執行的程序指令設計成用于執行如下其他步驟-只要達到中止條件,就結束所述運動側寫的所述迭代地改變, -將至少所述分區域分成區段(Π4),-從通過應用所述用于使所述全局置信值最大化的優化法而得到的運動側寫出發,區段式地迭代地改變所述運動側寫,其中,在與所述區段之一相關的每次迭代中,利用該區段的改變的運動側寫來矯正該區段的所述圖像數據并且進行所述字符識別,其中,根據用于使相關的所述區段中的局部置信值最大化的優化法來實行所述區段中的所述運動側寫的所述迭代地改變。
10.根據權利要求9所述的計算機程序產品,其中,根據預先給定的網格將至少所述分區域分成區段。
11.數據處理系統,所述數據處理系統帶有-用于輸入圖像數據(110)的機構,所述圖像數據由行掃描攝像機從文件的至少一個分區域中通過掃描來采集,-用于借助所述文件和所述行掃描攝像機的相對運動的預先給定的運動側寫(106)來矯正所述圖像數據的機構(115),-用于在經矯正的圖像數據(112)中進行字符識別的機構(114),其中,測定針對識別出的字符的準確性的全局置信值,-用于迭代地改變所述運動側寫的機構(116),其中,在每次迭代中,利用改變的運動側寫來矯正所述圖像數據并且進行所述字符識別,并且其中,根據用于使所述全局置信值最大化的優化法來實行所述迭代地改變。
12.根據權利要求11所述的數據處理系統,所述數據處理系統帶有-用于存儲至少第一預先給定的運動側寫和第二預先給定的運動側寫的機構(104), -用于挑選出所述至少第一運動側寫和第二運動側寫中的一個運動側寫用于所述迭代地改變的機構(130),其中,挑選出所述運動側寫中的如下運動側寫,即,在借助該運動側寫來矯正所述圖像數據并且進行字符識別之后,該運動側寫提供最大的全局置信值。
13.根據權利要求11或12所述的數據處理系統,其中,所述至少第一運動側寫和第二運動側寫分別以運動側寫參數的形式來存儲,所述運動側寫參數能夠通過所述優化法來改變。
14.用于對文件進行自動光學采集字符的掃描儀,所述掃描儀帶有-用于借助于行掃描攝像機來掃描所述文件的至少一個帶有字符的分區域(1 )的機構(102),其中,進行所述文件和所述行掃描攝像機的不受控制的相對運動,由此,采集至少所述分區域的圖像數據,-用于借助所述文件和所述行掃描攝像機的相對運動的預先給定的運動側寫來矯正所述圖像數據的機構(115),-用于在經矯正的圖像數據中進行字符識別的機構(114),其中,測定針對識別出的字符的準確性的全局置信值,-用于迭代地改變所述運動側寫的機構(116),其中,在每次迭代中,利用改變的運動側寫來矯正所述圖像數據并且進行所述字符識別,并且其中,根據用于使所述全局置信值最大化的優化法來實行所述迭代地改變。
15.根據權利要求14所述的掃描儀,所述掃描儀帶有-用于存儲至少第一預先給定的運動側寫和第二預先給定的運動側寫的機構(104), -用于挑選出所述至少第一運動側寫和第二運動側寫中的一個運動側寫用于所述迭代地改變的機構(130),其中,挑選出所述運動側寫中的如下運動側寫,即,在借助該運動側寫來矯正所述圖像數據并且進行字符識別之后,該運動側寫提供最大的全局置信值。
全文摘要
本發明涉及一種對文件(122)進行自動光學采集字符的方法,該方法包括如下步驟借助于行掃描攝像機(102)掃描所述文件的至少一個帶有字符的分區域(128),其中,進行文件和行掃描攝像機不受控制的相對運動,由此,采集至少所述分區域的圖像數據(110)借助于文件和行掃描攝像機的相對運動的預先給定的運動側寫(106)來矯正圖像數據;在經矯正的圖像數據(112)中進行字符識別,其中,測定針對識別出的字符的準確性的全局置信值;迭代地改變運動側寫,其中,在每次迭代中,利用改變的運動側寫來矯正圖像數據并且進行字符識別,并且其中,根據用于使所述全局置信值最大化的優化法來實行迭代地改變。
文檔編號G06K9/22GK102160065SQ200980136183
公開日2011年8月17日 申請日期2009年9月1日 優先權日2008年9月15日
發明者于爾根·迪特里希, 克里斯蒂安·克拉默, 賴蒙德·阿爾海特, 霍斯特·凱斯勒, 馬丁·施普倫格 申請人:聯邦印制有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影