一種圖片檢測方法與設備的制造方法
【專利摘要】本申請的目的是提供一種圖片檢測方法與設備;獲取已分別標注圖片類型的多個第一圖片,其中,所述圖片類型包括第一類型或第二類型;根據所述第一圖片所對應的上傳用戶信息對所述多個第一圖片進行關聯處理;根據經關聯處理的所述多個第一圖片確定圖片檢測模型,其中,所述圖片檢測模型包括用戶與所述圖片類型的映射關系;利用所述圖片檢測模型確定第二圖片的所述圖片類型。與現有技術相比,本申請通過獲取標注過圖片類型的第一圖片基于圖片所對應的上傳用戶信息對其進行關聯處理,據此確定圖片檢測模型,并利用檢測模型實現對圖片類型的辨識;從而,提高對圖片類型的檢測精度,降低誤判率,縮短模型的建立時間,使得圖片檢測及時有效。
【專利說明】
-種圖片檢測方法與設備
技術領域
[0001] 本申請設及計算機領域,尤其設及一種圖片檢測技術。
【背景技術】
[0002] 隨著大數據時代來臨,各類網站每天有大量的用戶圖片產生。面對海量的圖片數 據,需要一個有效的檢測方法,W解決圖片的辨識和分類。例如,在電商和社交平臺對違禁 圖片進行識別和過濾,從而優化網絡環境,提升用戶體驗。
[0003] 目前,在本領域的現有技術中,對圖片識別算法主要有兩類。第一類,W圖像維度 特征為切入點,對經驗特征進行特征提取,例如SIFP、SURF等。運類算法,檢測準確度不高, 存在較多的誤判。第二類,W數據預測為切入點,利用深度卷積神經網絡學習的方法,對圖 片進行識別。運類算法,相對于第一類提升了檢測的準確度,但是在大數據背景下仍有大量 圖片誤判、漏判。同時,存在訓練檢測模型的初始數據量大、訓練時間長、模型的更新工作量 龐大等缺陷。
【發明內容】
[0004] 本申請的目的是提供一種圖片檢測方法與設備。
[000引根據本申請的一個方面,提供了一種圖片檢測方法,包括:
[0006] 獲取已分別標注圖片類型的多個第一圖片,其中,所述圖片類型包括第一類型或 第二類型;
[0007] 根據所述第一圖片所對應的上傳用戶信息對所述多個第一圖片進行關聯處理; [000引根據經關聯處理的所述多個第一圖片確定圖片檢測模型,其中,所述圖片檢測模 型包括用戶與所述圖片類型的映射關系;
[0009] 利用所述圖片檢測模型確定第二圖片的所述圖片類型。
[0010] 根據本申請的另一方面,還提供了一種圖片檢測設備,包括:
[0011] 第一裝置,用于獲取已分別標注圖片類型的多個第一圖片,其中,所述圖片類型包 括第一類型或第二類型;
[0012] 第二裝置,用于根據所述第一圖片所對應的上傳用戶信息對所述多個第一圖片進 行關聯處理;
[0013] 第Ξ裝置,用于根據經關聯處理的所述多個第一圖片確定圖片檢測模型,其中,所 述圖片檢測模型包括用戶與所述圖片類型的映射關系;
[0014] 第四裝置,用于利用所述圖片檢測模型確定第二圖片的所述圖片類型。
[0015] 與現有技術相比,本申請通過對標注過圖片類型的第一圖片基于圖片所對應的上 傳用戶信息進行關聯處理,據此確定圖片檢測模型,并利用檢測模型實現對圖片類型的辨 識;從而,提高圖片類型的檢測精度,降低誤判率,縮短模型的建立時間。進一步,本申請還 可確定圖片檢測模型的子模型,可根據標注過的第Ξ圖片,快速進行更新,從而,更新圖片 檢測模型,使得圖片檢測及時有效。更進一步,在本申請中,對被檢測模型辨識過的第二圖 片,還可由人工再次進行圖片類型標注,從而,修正圖片檢測模型,使得檢測模型更加精準。
【附圖說明】
[0016] 通過閱讀參照W下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它 特征、目的和優點將會變得更明顯:
[0017] 圖1示出根據本申請一個方面的一種圖片檢測設備的示意圖;
[0018] 圖2示出根據本申請一個優選實施例的一種圖片檢測設備中第Ξ裝置的示意圖;
[0019] 圖3示出根據本申請另一個優選實施例的一種圖片檢測設備中第二單元的示意 圖;
[0020] 圖4示出根據本申請另一個方面的一種圖片檢測方法流程圖;
[0021] 圖5示出根據本申請一個優選實施例的步驟S23的方法流程圖;
[0022] 圖6示出根據本申請另一個優選實施例的步驟S232的方法流程圖。
[0023] 附圖中相同或相似的附圖標記代表相同或相似的部件。
【具體實施方式】
[0024] 下面結合附圖對本申請作進一步詳細描述。
[0025] 在本申請一個典型的配置中,終端、服務網絡的設備和可信方均包括一個或多個 處理器(CPU)、輸入/輸出接口、網絡接口和內存。
[0026] 內存可能包括計算機可讀介質中的非永久性存儲器,隨機存取存儲器(RAM)和/或 非易失性內存等形式,如只讀存儲器(RCM)或閃存(flashRAM)。內存是計算機可讀介質的示 例。
[0027] 計算機可讀介質包括永久性和非永久性、可移動和非可移動媒體可W由任何方法 或技術來實現信息存儲。信息可W是計算機可讀指令、數據結構、程序的模塊或其他數據。 計算機的存儲介質的例子包括,但不限于相變內存(PRAM)、靜態隨機存取存儲器(SRAM)、動 態隨機存取存儲器(DRAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲器(ROM)、電可擦除 可編程只讀存儲器化EPROM)、快閃記憶體或其他內存技術、只讀光盤只讀存儲器(CD-ROM)、 數字多功能光盤(DVD)或其他光學存儲、磁盒式磁帶,磁帶磁盤存儲或其他磁性存儲設備或 任何其他非傳輸介質,可用于存儲可W被計算設備訪問的信息。按照本文中的界定,計算機 可讀介質不包括非暫存電腦可讀媒體(transitory media),如調制的數據信號和載波。
[0028] 圖1示出根據本申請的一個方面的一種圖片檢測設備的示意圖。所述的圖片檢測 設備1包括第一裝置11、第二裝置12、第Ξ裝置13、第四裝置14。
[0029] 其中,第一裝置11獲取已分別標注圖片類型的多個第一圖片,其中,所述圖片類型 包括第一類型或第二類型;第二裝置12根據所述第一圖片所對應的上傳用戶信息對所述多 個第一圖片進行關聯處理;第Ξ裝置13根據經關聯處理的所述多個第一圖片確定圖片檢測 模型,其中,所述圖片檢測模型包括用戶與所述圖片類型的映射關系;第四裝置14利用所述 圖片檢測模型確定第二圖片的所述圖片類型。
[0030] 具體地,第一裝置11獲取已分別標注圖片類型的多個第一圖片,其中,所述圖片類 型包括第一類型或第二類型。在此,第一圖片是作為樣本數據的圖片,第一類型或第二類型 為需要鑒別的圖片類型。例如,在需要對違禁圖片進行檢測時,第一圖片即為已經標注的違 禁圖片和正常圖片,第一類型和第二類型就是違禁圖片和正常圖片。第一圖片在獲取作為 樣本時已經被標注,其中,標注的內容至少包括需要鑒別的圖片類型。標注的方式和來源可 W多樣化,例如,是來自于系統之前人工鑒別后標注過的圖片,或者對圖片的MD5進行計算 并與樣本MD5進行比對并記錄和標注。
[0031] 本領域技術人員應能理解上述標注第一圖片類型的方式僅為舉例,其他現有的或 今后可能出現的標注第一圖片類型的方式如可適用于本發明,也應包含在本發明保護范圍 W內,并在此W引用方式包含于此。
[0032] 所述圖片檢測設備1的第二裝置12,根據所述第一圖片所對應的上傳用戶信息對 所述多個第一圖片進行關聯處理。其中,第一圖片有對應的上傳用戶信息,例如,可W讀取 第一圖片對應的后臺數據庫或日志中的信息,或者根據第一圖片的應用端的用戶ID從后臺 提取其相關信息,然后用S化語言找出對應的賬號信息。進一步,為了將運些信息整合,從而 可W對其進行后續的統一操作,需要對其進行關聯。
[0033] 本領域技術人員應能理解上述獲取第一圖片所對應的上傳用戶信息的方式僅為 舉例,其他現有的或今后可能出現的獲取第一圖片所對應的上傳用戶信息的方式如可適用 于本發明,也應包含在本發明保護范圍W內,并在此W引用方式包含于此。
[0034] 本領域技術人員應可理解,為了準確的對圖片類型進行自動檢測,需要龐大的樣 本數據支撐,故而所獲取第一圖片可有不同的來源,例如,在對阿里平臺的圖片進行鑒別 時,第一圖片的來源可W是淘寶或者來往等應用。來源不同的第一圖片所提取的對應上傳 用戶的數據的主鍵可能會有不同,在關聯成統一的數據表進行處理時會有一定的難度。
[0035] 優選地,第二裝置12基于相同用戶在不同應用中用戶標識的對應關系,根據第一 圖片所對應的上傳用戶信息,對所述多個第一圖片進行關聯處理,使得相同用戶的多個所 述第一圖片進行關聯。在此,所述的相同用戶在不同應用中用戶標識的對應關系,即為同一 用戶在不同應用中的賬號的集合或映射關系。運種對應關系,可W直接利用第Ξ方設備所 提供的應用編程接口從第Ξ方設備獲取,或者相同公司的應用可W直接利用其數據庫中的 賬戶關聯關系,例如,阿里集團的淘寶或往來應用的賬戶都是關聯的,可W直接獲取其對應 關系的數據。具體的,將淘寶和來往的應用中用戶ID、用戶名、用戶數字ID等信息進行關聯, 建立索引,從而將同一用戶在不同應用之間的賬號打通。本領域技術人員應能理解上述獲 取相同用戶在不同應用中用戶標識的對應關系的方式僅為舉例,其他現有的或今后可能出 現的獲取相同用戶在不同應用中用戶標識的對應關系的方式如可適用于本發明,也應包含 在本發明保護范圍W內,并在此W引用方式包含于此。
[0036] 更優選地,第二裝置12基于相同用戶在不同應用中用戶標識的對應關系,對所述 多個第一圖片所對應的各個上傳用戶信息進行關聯處理,并使對應相同用戶的多個所述上 傳用戶信息映射至同一新創建的用戶主鍵信息。在此,將同一用戶在不同應用中的上傳用 戶,映射到同一個信息上,并W此為通用主鍵,從而可W對不同來源的第一圖片進行關聯。 例如,在前文所述的將阿里應用中的信息關聯,建立索引之后,可W提取公共信息即用戶ID 作為新建表的主鍵。同時,用運個新的主鍵重新關聯淘寶、來往等數據,將不同來源的數據 關聯起來。對于無法提取公共信息作為主鍵的實例,可W建立一個新的數據項,將不同應用 中的上傳用戶信息與其進行關聯,最終映射到同一個用戶上。從而,可W根據所述上傳用戶 信息與所述用戶主鍵信息的映射關系,對所述多個第一圖片進行關聯處理,W使得對應同 一個所述用戶主鍵信息的多個所述第一圖片被關聯。
[0037] 所述圖片檢測設備1的第Ξ裝置13根據經關聯處理的所述多個第一圖片確定圖片 檢測模型,其中,所述圖片檢測模型包括用戶與所述圖片類型的映射關系。在此,利用之前 統一關聯處理過的第一圖片及其相關的結構化的數據,確定鑒別圖片類型的圖片檢測模 型。此檢測模型,與用戶W及圖片類型之間有映射關系,即模型中包含用戶W及每個用戶所 上傳圖片的類型等信息,例如,在實際應用中,當需要利用該模型檢測其它圖片是否違禁 時,可直接根據運其中圖片的上傳用戶在該模型中對應的圖片類型來進行確定。
[0038] 所述圖片檢測設備1的第四裝置14,利用所述圖片檢測模型確定第二圖片的所述 圖片類型。得出檢測模型后,可W利用其直接對第二圖片,即用戶新上傳的需要鑒別類型的 圖片進行檢測,從而對圖片類型進行判斷。
[0039] 優選地,所述圖片檢測設備1還包括第五裝置15(未出示),所述第五裝置15根據所 述第二圖片的圖片類型的人工標注信息,修正所述圖片檢測模型。在此,可W將檢測模型嵌 入一個大的系統中,與圖像維度算法模塊W及人工審核模塊一起對圖片類型進行鑒別,從 而進一步提升鑒別的準確度和精度。其中,人工審核模塊可W對檢測模型的結果進行驗證, 從而對預測模型的實時更新提供數據支持,進而對檢測模型進行驗證。
[0040] 圖2示出根據本申請一個優選實施例的一種圖片檢測設備中第Ξ裝置的示意圖。 所述圖片檢測設備1的第Ξ裝置13,包括第一單元131、第二單元132。其中,第一單元131根 據經關聯處理的所述多個第一圖片確定多個用戶的圖片操作記錄信息;第二單元132根據 每個用戶的圖片操作記錄信息,確定圖片檢測模型,其中,所述圖片檢測模型包括用戶與所 述圖片類型的映射關系。
[0041] 具體地,第一單元131根據經關聯處理的所述多個第一圖片確定多個用戶的圖片 操作記錄信息。在此,用戶的圖片操作記錄信息是指與所鑒別的圖片類型相關的一些操作, 例如,在檢測違規和正常圖片時,用戶的圖片操作記錄信息即包括違規操作數W及總操作 數等。
[0042] 接著,第二單元132根據每個用戶的圖片操作記錄信息,確定圖片檢測模型,其中, 所述圖片檢測模型包括用戶與所述圖片類型的映射關系。在此,圖片的操作記錄信息是與 用戶相關的,例如,同一用戶在若干應用中多次上傳違規圖片,則有多個違規操作記錄,在 映射到檢測模型中時,該用戶之后所上傳的圖片會更偏向于被判別為違規圖片。
[0043] 得出圖片檢測模型之后,為了保障檢測模型檢測的準確性,需要根據最新的數據, 對其進行及時更新。因此,第二單元132還可W根據已經分別標注圖片類型的第Ξ圖片,更 新所述圖片檢測模型子模型,進而,根據更新后的所述圖片檢測子模型,更新所述圖片檢測 模型。
[0044] 具體地,所述第Ξ圖片為圖片檢測模型建立后獲得的已被標注過的最新圖片。例 如,可W根據上一天的人工審核記錄W及算法驗證記錄中正常操作的圖片對白名單進行重 新計算。同理,可W對黑名單W及增量模型進行重新計算。由此,可W藉由上述更新的子模 型對檢測模型進行更新。
[0045] 本領域技術人員應能理解上述更新檢測模型的方式僅為舉例,其他現有的或今后 可能出現的更新檢測模型的方式如可適用于本發明,也應包含在本發明保護范圍W內,并 在此W引用方式包含于此。
[0046] 圖3示出根據本申請另一個優選實施例的一種圖片檢測設備中第二單元的示意 圖。所述圖片檢測設備1的第Ξ裝置13中的第二單元132,包括第一子單元1321、第二子單元 1322。其中,第一子單元1321根據每個用戶的圖片操作記錄信息,確定對應的一個或多個圖 片檢測子模型,其中,所述圖片檢測子模型包括用戶與所述圖片類型的映射關系;第二子單 元1322根據所述一個或多個圖片檢測子模型中至少一個,確定對應的圖片檢測模型,其中, 所述圖片檢測模型包括用戶與所述圖片類型的映射關系。
[0047] 具體地,第一子單元1321根據每個用戶的圖片操作記錄信息,確定對應的一個或 多個圖片檢測子模型,其中,所述圖片檢測子模型包括用戶與所述圖片類型的映射關系。在 此,為確定鑒別圖片類型的檢測模型,需要有一些與用戶圖片操作記錄信息相關子模型,從 而可由子模型對檢測模型進行推導。例如,在多個應用賬號中多次上傳違規圖片的同一用 戶,可W被判定為上傳圖片有違規嫌疑比較大,該用戶便可W被放入黑名單,在此,黑名單 即可作為子模型之一。
[0048] 優選地,為將鑒別圖片類型的檢測模型推導的更加準確,上文所述的圖片檢測子 模型包括W下至少任一項:
[0049] 圖片用戶白名單信息;
[0050] 圖片用戶黑名單信息;
[0化1]圖片增量模型。
[0052] W檢測違規圖片為例,同一用戶若在多次上傳圖片的操作中,所上傳的正常圖片 大于一定的比例,則圖片用戶白名單信息會記錄該用戶與正常圖片之間的映射關系。反之, 若該用戶所上傳的違規圖片大于一定的比例,則用戶黑名單信息會記錄該用戶與違規圖片 之間的映射關系。而增量模型則會計算用戶正常操作與違規操作之間相減的一個分數,從 而在后續確立檢測模型的時候可W優化檢測的精確度,去掉一些會導致誤判的案例,保留 一些良好的案例。
[0053] 優選地,第一子單元1321根據每個用戶的圖片操作記錄信息及對應的操作時段信 息,確定對應的一個或多個圖片檢測子模型,其中,所述圖片檢測子模型包括用戶與所述圖 片類型的映射關系。在此,對于子模型的確立,需要基于第一圖片關聯后與通用主鍵之間的 關系,對第一圖片所對應的數據進行提取。其中,圖片操作記錄W檢測違規圖片為例,是上 傳圖片的總數和上傳違規圖片的次數。而操作時段數據的提取,則為了避免只統計某幾個 時段的數據,樣本時間不均勻造成誤判。
[0054] 優選地,建立黑白名單可W計算一個判別黑白名單的闊值,例如,在鑒別違規圖片 時,可W將符合一定時段內違規操作數大于設定闊值的用戶納入黑名單,從而建立黑名單 子模型;將符合一定時段內上傳正常圖片操作數大于設定闊值的用戶納入白名單,從而建 立白名單子模型。W阿里集團對淘寶、來往等應用中違禁圖片的檢測為例,黑名單子模型B 的建立具體規則如下:
[0055] B(id,time) = (id,time |punish>AB)
[0056] 其中,用戶id為通用主鍵,time為用戶操作時間,punish為操作違規數,λΒ為判別 黑名單id的闊值,其計算規則如下描述:
[0化7]
[0060]白名單子模型W的建立具體規則如下:
[0061 ] W(id, time) = (id, time I count-punish>AB)。
[0062] 其中,cout為總操作數,λκ為判別白名單id的闊值其計算規則如下描述:步驟一: 將用戶id依據count-punish的值進行排序;
[0063] 步驟二:選擇上一步最大的20 %的用戶id;
[0064] 步驟S :計算
[0065] 對于增量模型,可W計算其關于正確操作數和違規操作數的權重關系,從而達到 優選案例的作用。具體計算規則如下,其中score即為正確操作數和違規操作數的權重關 系:
[0066] score = (count-punish) X5-punish〇
[0067] 本領域技術人員應能理解上述計算各子模型的方式僅為舉例,其他現有的或今后 可能出現的計算各子模型的方式如可適用于本發明,也應包含在本發明保護范圍W內,并 在此W引用方式包含于此。
[0068] 接著,第二子單元1322根據所述一個或多個圖片檢測子模型中至少一個,確定對 應的圖片檢測模型,其中,所述圖片檢測模型包括用戶與所述圖片類型的映射關系。優選 地,由于子模型中包含了與圖片類型的映射關系,且W鑒別違規圖片為例,每個子模型與操 作違規頻次有一定的相關性,故而可W由其推導出圖片檢測模型。因此,圖片檢測模型中包 含用戶與圖片類型的映射關系。W鑒別違規圖片為例,違規次數較多而被歸入黑名單的用 戶與違規圖片類型有映射關系。
[0069] 具體地,第二子單元1322根據所述一個或多個圖片檢測子模型中至少一個,W及 所述圖片檢測子模型與所述圖片違規頻次信息的正負相關性,確定對應的圖片檢測模型, 其中,所述圖片檢測模型包括用戶與所述圖片類型的映射關系。優選地,W鑒別違規圖片為 例,白名單與增量模型與檢測模型正相關,黑名單與檢測模型負相關,因此,得出計算式如 下:
[0070] P = D+W-B
[0071] 其中,P為檢測模型,D為增量模型,W為白名單,B為黑名單。
[0072] 本領域技術人員應能理解上述計算檢測模型的方式僅為舉例,其他現有的或今后 可能出現的計算檢測模型的方式如可適用于本發明,也應包含在本發明保護范圍W內,并 在此W引用方式包含于此。
[0073] 所述設備1還包括:第六裝置16(未示出),所述第六裝置16用于根據所述多個第一 圖片確定所述圖片檢測模型在不同單位時段下對應的約束參數。其中,所述單位時段是根 據用戶操作或檢測圖片類型的需要將可統計的用戶操作時段進行劃分所得出的單位時段, 例如,將一天劃分為24個時段,即每個單位時段為一個小時。所述約束參數是指通過將用戶 歷史數據也就是第一圖片數據迭代計算或統計W及歸一處理后得出的對應不同時段的可 用于判斷圖片類型的參數,結合圖片檢測模型可對用戶分時段上傳的圖片進行判斷,從而 快速判斷不同時段圖片的類型,例如,在劃分為24個時段的情況下,2點到3點運個時段的約 束參數為S2,假設根據約束參數的迭代條件設置體現用戶正確操作數和違規操作數權重關 系的score大于約束參數則該用戶該時段的上傳圖片為正常圖片,查詢圖片檢測模型表中 用戶A在2點到3點的score,若score的值大于S2,則用戶A在2點到3點上傳的圖片為正常圖 片。確定所述約束參數有利于結合檢測模型對用戶單位時段內上傳的圖片進行圖片類型的 快速判斷,提升圖片類型檢測的效率。
[0074] 優選地,第六裝置16確定所述約束參數的方法包括但不限于W下方法:一、初始化 所述圖片檢測模型在各單位時段對應的約束參數;根據所述多個第一圖片迭代計算所述圖 片檢測模型在各單位時段對應的約束參數,直至由所述圖片檢測模型在各單位時段對應的 約束參數構成的向量在迭代計算前后的距離小于預定的距離闊值。二、根據所述第一圖片 的操作時間所落入的單位時段來統計不同單位時段內包含圖片類型為第一類型的所述第 一圖片的圖片數量信息;對各個單位時段對應的所述圖片數量信息進行歸一化處理,W獲 得所述圖片檢測模型在不同單位時段下對應的約束參數。
[0075] 其中,在方法一中,初始化所述約束參數是指將各段位時段的約束參數賦予一個 迭代計算的初始值,例如,將一天分為24個時段,設置每個單位時段為1個小時,初始化24個 時段的約束參數S1~S24,即設置初始值為S1 = S2 =…= S24 = 0,從而便于后續進行進一步 的迭代計算。方法一主要進行對初始化后的約束參數結合第一圖片數據進行迭代計算,從 而得出不同時段的約束參數,其中,第一圖片數據信息包括但不限于用戶(在迭代計算中表 示為id),上傳圖片的操作時間(在迭代計算中表示為time),體現用戶正確操作數和違規操 作數權重關系的數值(在迭代計算中表示為score),圖片是否違禁(在迭代計算中表示為 illegal)等。迭代公式根據第一圖片數據信息和時段劃分的具體情況確定,本例迭代計算 的公式如下:
[0076]
[0077] 其中,X代表24個時段中的某個時段,例如計算2點到3點的約束參數,則是S2,即X = 2,F代表檢測模型中的表F,true表示圖片違禁為真,將用戶檢測模型中標F中所有用戶ID 對應的歷史數據帶入公式進行迭代計算,當圖片操作時間在需要計算的約束參數所在時 段,且體現用戶正確操作數和違規操作數權重關系的數值大于當前迭代過程中的約束參數 值,且屬于違禁圖片,則在該次迭代中約束參數的值加1。對于迭代計算需要設置迭代的終 止條件,例如通過設置各時段約束參數向量之間的距離不再變化為終止條件,所有計算向 量之間不同樣本間相似性度量的方法均適用于此,本例采用經常用于計算向量距離的漢明 距離化amming dis化nee)進行計算,即當St={Si,S2,. . .,S24}t的漢明距離不再變化時迭代 終止,其中t為迭代次數,到迭代終止時的S1~S24即為對應24個時段的約束參數。
[0078] 本領域技術人員應能理解上述迭代計算得出約束參數的方式僅為舉例,其他現有 的或今后可能出現的迭代計算得出約束參數的方式如可適用于本發明,也應包含在本發明 保護范圍W內,并在此W引用方式包含于此。
[0079] 在方法二中,所述第一圖片的操作時間是根據用戶歷史數據中的記錄進行提取的 用戶上傳第一圖片的時間,所述落入的單位時段是指上傳的第一圖片的時間所屬的單位時 段,例如,將一天按24小時劃分為24個時段,在2點到3點上傳的第一圖片就落在第2個單位 時段,所述第一圖片的數量信息是指在某個時段某種類型圖片的上傳數量。因此,在方法二 中首先統計各用戶在不同時段中所上傳圖片的類型,例如,用戶A在2點到3點所上傳的違禁 圖片數量。所述歸一化處理是指將所述第一圖片的數量信息按不同時段進行統計得出各時 段的對應的第一圖片中第一類型的變化趨勢,例如,建立一張 W時間為橫軸W違禁圖片數 量為縱軸的坐標圖,根據不同時段內用戶上傳的違禁圖片數量畫出變化趨勢圖,或得出相 應的趨勢圖所對應的公式,進而即可獲取不同單位時間段下所對應的約束參數,例如,例如 趨勢顯示2點到3點之間某用戶圖片上傳超過10張為違規圖片的概率超過百分之九十五,貝U 設2-3點之間的約束參數為10,當某用戶上傳圖片數量大于或等于本時段的約束參數,則判 定為違禁圖片。
[0080] 本領域技術人員應能理解上述統計和歸一處理后得出約束參數的方式僅為舉例, 其他現有的或今后可能出現的統計和歸一處理后得出約束參數的方式如可適用于本發明, 也應包含在本發明保護范圍W內,并在此W引用方式包含于此。
[0081] 接著,所述第四裝置14用于利用所述圖片檢測模型及所述圖片檢測模型在目標單 位時段下對應的約束參數,確定第二圖片的所述圖片類型,其中,所述第二圖片的操作時間 所落入所述目標單位時段。其中,所述目標單位時間是指所述第二圖片也就是用戶新上傳 或需要判斷的圖片的上傳操作時間所對應的單位時段,例如,若根據一天24小時劃分有24 個單位時段,所述第二圖片的上傳操作時間是2點21分,則其目標單位時段即為2點到3點運 個時段,即約束參數S2所對應的時段。所述圖片檢測模型的表中存有各用戶的用戶ID,上傳 圖片的操作時間,體現用戶正確操作數和違規操作數權重關系的數值score,圖片是否違禁 等信息,當需要判斷某用戶的第二圖片類型時:若約束參數的計算采用的前文所述的方法 一,則根據該用戶的ID查詢到所述第二圖片對應的目標單位時段用戶的score,將所查詢到 的score值與目標單位時段的約束參數進行比較,例如根據上文舉例迭代公式,若score值 大于目標單位時段的約束參數,則該第二圖片屬于正常圖片;若約束參數的計算采用的前 文所述的方法二,則統計當前目標單位時段內第二圖片的數量信息,并查詢用戶ID在目標 時間段對應的第一圖片類型的變化趨勢所對應的約束參數,例如接上文舉例,在2點到3點 間上約束參數為10,用戶在運一時段上傳的圖片數量超過10則為違禁圖片。
[0082] 本領域技術人員應能理解上述根據檢測模型和約束參數判斷圖片類型的方式僅 為舉例,其他現有的或今后可能出現的根據檢測模型和約束參數判斷圖片類型的方式如可 適用于本發明,也應包含在本發明保護范圍W內,并在此W引用方式包含于此。
[0083] 圖4示出根據本申請另一個方面的一種圖片檢測方法流程圖。
[0084] 其中,在步驟S21中,圖片檢測設備1獲取已分別標注圖片類型的多個第一圖片,其 中,所述圖片類型包括第一類型或第二類型;在步驟S22中圖片檢測設備1根據所述第一圖 片所對應的上傳用戶信息對所述多個第一圖片進行關聯處理;在步驟S23中圖片檢測設備1 根據經關聯處理的所述多個第一圖片確定圖片檢測模型,其中,所述圖片檢測模型包括用 戶與所述圖片類型的映射關系;在步驟S24中圖片檢測設備1利用所述圖片檢測模型確定第 二圖片的所述圖片類型。
[0085] 具體地,在步驟S21中圖片檢測設備1獲取已分別標注圖片類型的多個第一圖片, 其中,所述圖片類型包括第一類型或第二類型。在此,第一圖片是作為樣本數據的圖片,第 一類型或第二類型為需要鑒別的圖片類型。例如,在需要對違禁圖片進行檢測時,第一圖片 即為已經標注的違禁圖片和正常圖片,第一類型和第二類型就是違禁圖片和正常圖片。第 一圖片在獲取作為樣本時已經被標注,其中,標注的內容至少包括需要鑒別的圖片類型。標 注的方式和來源可W多樣化,例如,是來自于系統之前人工鑒別后標注過的圖片,或者對圖 片的MD5進行計算并與樣本MD5進行比對并記錄和標注。
[0086] 本領域技術人員應能理解上述標注第一圖片類型的方式僅為舉例,其他現有的或 今后可能出現的標注第一圖片類型的方式如可適用于本發明,也應包含在本發明保護范圍 W內,并在此W引用方式包含于此。
[0087] 進一步地,在步驟S22中圖片檢測設備1根據所述第一圖片所對應的上傳用戶信息 對所述多個第一圖片進行關聯處理。其中,第一圖片有對應的上傳用戶信息,例如,可W讀 取第一圖片對應的后臺數據庫或日志中的信息,或者根據第一圖片的應用端的用戶ID從后 臺提取其相關信息,然后用SQL語言找出對應的賬號信息。進一步,為了將運些信息整合,從 而可W對其進行后續的統一操作,需要對其進行關聯。
[0088] 本領域技術人員應能理解上述獲取第一圖片所對應的上傳用戶信息的方式僅為 舉例,其他現有的或今后可能出現的獲取第一圖片所對應的上傳用戶信息的方式如可適用 于本發明,也應包含在本發明保護范圍W內,并在此W引用方式包含于此。
[0089] 本領域技術人員應可理解,為了準確的對圖片類型進行自動檢測,需要龐大的樣 本數據支撐,故而所獲取第一圖片可有不同的來源,例如,在對阿里平臺的圖片進行鑒別 時,第一圖片的來源可W是淘寶或者來往等應用。來源不同的第一圖片所提取的對應上傳 用戶的數據的主鍵可能會有不同,在關聯成統一的數據表進行處理時會有一定的難度。
[0090] 優選地,在步驟S22中圖片檢測設備1基于相同用戶在不同應用中用戶標識的對應 關系,根據第一圖片所對應的上傳用戶信息,對所述多個第一圖片進行關聯處理,使得相同 用戶的多個所述第一圖片進行關聯。在此,所述的相同用戶在不同應用中用戶標識的對應 關系,即為同一用戶在不同應用中的賬號的集合或映射關系。運種對應關系,可W直接利用 第Ξ方設備所提供的應用編程接口從第Ξ方設備獲取,或者相同公司的應用可W直接利用 其數據庫中的賬戶關聯關系,例如,阿里集團的淘寶或往來應用的賬戶都是關聯的,可W直 接獲取其對應關系的數據。具體的,將淘寶和來往的應用中用戶ID、用戶名、用戶數字ID等 信息進行關聯,建立索引,從而將同一用戶在不同應用之間的賬號打通。本領域技術人員應 能理解上述獲取相同用戶在不同應用中用戶標識的對應關系的方式僅為舉例,其他現有的 或今后可能出現的獲取相同用戶在不同應用中用戶標識的對應關系的方式如可適用于本 發明,也應包含在本發明保護范圍W內,并在此W引用方式包含于此。
[0091] 更優選地,在步驟S22中圖片檢測設備1基于相同用戶在不同應用中用戶標識的對 應關系,對所述多個第一圖片所對應的各個上傳用戶信息進行關聯處理,并使對應相同用 戶的多個所述上傳用戶信息映射至同一新創建的用戶主鍵信息。在此,將同一用戶在不同 應用中的上傳用戶,映射到同一個信息上,并W此為通用主鍵,從而可W對不同來源的第一 圖片進行關聯。例如,在前文所述的將阿里應用中的信息關聯,建立索引之后,可W提取公 共信息即用戶ID作為新建表的主鍵。同時,用運個新的主鍵重新關聯淘寶、來往等數據,將 不同來源的數據關聯起來。對于無法提取公共信息作為主鍵的實例,可W建立一個新的數 據項,將不同應用中的上傳用戶信息與其進行關聯,最終映射到同一個用戶上。從而,可W 根據所述上傳用戶信息與所述用戶主鍵信息的映射關系,對所述多個第一圖片進行關聯處 理,W使得對應同一個所述用戶主鍵信息的多個所述第一圖片被關聯。
[0092] 進一步地,在步驟S23中圖片檢測設備1根據經關聯處理的所述多個第一圖片確定 圖片檢測模型,其中,所述圖片檢測模型包括用戶與所述圖片類型的映射關系。在此,利用 之前統一關聯處理過的第一圖片及其相關的結構化的數據,確定鑒別圖片類型的圖片檢測 模型。此檢測模型,與用戶W及圖片類型之間有映射關系,即模型中包含用戶W及每個用戶 所上傳圖片的類型等信息,例如,在實際應用中,當需要利用該模型檢測其它圖片是否違禁 時,可直接根據運其中圖片的上傳用戶在該模型中對應的圖片類型來進行確定。
[0093] 更進一步地,在步驟S24中圖片檢測設備1利用所述圖片檢測模型確定第二圖片的 所述圖片類型。得出檢測模型后,可W利用其直接對第二圖片,即用戶新上傳的需要鑒別類 型的圖片進行檢測,從而對圖片類型進行判斷。
[0094] 優選地,還包括步驟S25(未出示),在步驟S25中圖片檢測設備1根據所述第二圖片 的圖片類型的人工標注信息,修正所述圖片檢測模型。在此,可W將檢測模型嵌入一個大的 系統中,與圖像維度算法模塊W及人工審核模塊一起對圖片類型進行鑒別,從而進一步提 升鑒別的準確度和精度。其中,人工審核模塊可W對檢測模型的結果進行驗證,從而對預測 模型的實時更新提供數據支持,進而對檢測模型進行驗證。
[00M]圖5示出根據本申請一個優選實施例的步驟S23的方法流程圖。在步驟S23中,包括 步驟S231、步驟S232。其中,在步驟S231中圖片檢測設備1根據經關聯處理的所述多個第一 圖片確定多個用戶的圖片操作記錄信息;在步驟S232中圖片檢測設備1根據每個用戶的圖 片操作記錄信息,確定圖片檢測模型,其中,所述圖片檢測模型包括用戶與所述圖片類型的 映射關系。
[0096] 具體地,在步驟S231中圖片檢測設備1根據經關聯處理的所述多個第一圖片確定 多個用戶的圖片操作記錄信息。在此,用戶的圖片操作記錄信息是指與所鑒別的圖片類型 相關的一些操作,例如,在檢測違規和正常圖片時,用戶的圖片操作記錄信息即包括違規操 作數W及總操作數等。
[0097] 接著,在步驟S232中圖片檢測設備1根據每個用戶的圖片操作記錄信息,確定圖片 檢測模型,其中,所述圖片檢測模型包括用戶與所述圖片類型的映射關系。在此,圖片的操 作記錄信息是與用戶相關的,例如,同一用戶在若干應用中多次上傳違規圖片,則有多個違 規操作記錄,在映射到檢測模型中時,該用戶之后所上傳的圖片會更偏向于被判別為違規 圖片。
[0098] 得出圖片檢測模型之后,為了保障檢測模型檢測的準確性,需要根據最新的數據, 對其進行及時更新。因此,在步驟S232中圖片檢測設備1還可W根據已經分別標注圖片類型 的第Ξ圖片,更新所述圖片檢測模型子模型,進而,根據更新后的所述圖片檢測子模型,更 新所述圖片檢測模型。
[0099] 具體地,所述第Ξ圖片為圖片檢測模型建立后獲得的已被標注過的最新圖片。例 如,可W根據上一天的人工審核記錄W及算法驗證記錄中正常操作的圖片對白名單進行重 新計算。同理,可W對黑名單W及增量模型進行重新計算。由此,可W藉由上述更新的子模 型對檢測模型進行更新。
[0100] 本領域技術人員應能理解上述更新檢測模型的方式僅為舉例,其他現有的或今后 可能出現的更新檢測模型的方式如可適用于本發明,也應包含在本發明保護范圍w內,并 在此W引用方式包含于此。
[0101] 圖6示出根據本申請另一個優選實施例的步驟S232的方法流程圖。在步驟S232中, 包括步驟S2321、步驟S2322。其中,在步驟S2321中圖片檢測設備1根據每個用戶的圖片操作 記錄信息,確定對應的一個或多個圖片檢測子模型,其中,所述圖片檢測子模型包括用戶與 所述圖片類型的映射關系;在步驟S2322中圖片檢測設備1根據所述一個或多個圖片檢測子 模型中至少一個,確定對應的圖片檢測模型,其中,所述圖片檢測模型包括用戶與所述圖片 類型的映射關系。
[0102] 具體地,在步驟S2321中圖片檢測設備1根據每個用戶的圖片操作記錄信息,確定 對應的一個或多個圖片檢測子模型,其中,所述圖片檢測子模型包括用戶與所述圖片類型 的映射關系。在此,為確定鑒別圖片類型的檢測模型,需要有一些與用戶圖片操作記錄信息 相關子模型,從而可由子模型對檢測模型進行推導。例如,在多個應用賬號中多次上傳違規 圖片的同一用戶,可W被判定為上傳圖片有違規嫌疑比較大,該用戶便可W被放入黑名單, 在此,黑名單即可作為子模型之一。
[0103] 優選地,為將鑒別圖片類型的檢測模型推導的更加準確,上文所述的圖片檢測子 模型包括W下至少任一項:
[0104] 圖片用戶白名單信息;
[0105] 圖片用戶黑名單信息;
[0106] 圖片增量模型。
[0107] W檢測違規圖片為例,同一用戶若在多次上傳圖片的操作中,所上傳的正常圖片 大于一定的比例,則圖片用戶白名單信息會記錄該用戶與正常圖片之間的映射關系。反之, 若該用戶所上傳的違規圖片大于一定的比例,則用戶黑名單信息會記錄該用戶與違規圖片 之間的映射關系。而增量模型則會計算用戶正常操作與違規操作之間相減的一個分數,從 而在后續確立檢測模型的時候可W優化檢測的精確度,去掉一些會導致誤判的案例,保留 一些良好的案例。
[0108] 優選地,在步驟S2321中圖片檢測設備1根據每個用戶的圖片操作記錄信息及對應 的操作時段信息,確定對應的一個或多個圖片檢測子模型,其中,所述圖片檢測子模型包括 用戶與所述圖片類型的映射關系。在此,對于子模型的確立,需要基于第一圖片關聯后與通 用主鍵之間的關系,對第一圖片所對應的數據進行提取。其中,圖片操作記錄W檢測違規圖 片為例,是上傳圖片的總數和上傳違規圖片的次數。而操作時段數據的提取,則為了避免只 統計某幾個時段的數據,樣本時間不均勻造成誤判。
[0109] 優選地,建立黑白名單可W計算一個判別黑白名單的闊值,例如,在鑒別違規圖片 時,可W將符合一定時段內違規操作數大于設定闊值的用戶納入黑名單,從而建立黑名單 子模型;將符合一定時段內上傳正常圖片操作數大于設定闊值的用戶納入白名單,從而建 立白名單子模型。W阿里集團對淘寶、來往等應用中違禁圖片的檢測為例,黑名單子模型B 的建立具體規則如下:
[0110] B(id,time) = (id,time |punish>AB)
[0111] 其中,用戶id為通用主鍵,time為用戶操作時間,punish為操作違規數,λΒ為判別 黑名單id的闊值,其計算規則如下描述:
[0115] 白名單子模型W的建立具體規則如下:
[0116] W(id, time) = (id, time I count-punish>入B)。
[0117] 其中,cout為總操作數,λκ為判別白名單id的闊值其計算規則如下描述:步驟一: 將用戶id依據count-punish的值進行排序;
[0118] 步驟二:選擇上一步最大的20 %的用戶id;
[0119] 步驟立:計算
[0120] 對于增量模型,可W計算其關于正確操作數和違規操作數的權重關系,從而達到 優選案例的作用。具體計算規則如下,其中score即為正確操作數和違規操作數的權重關 系:
[0121 ] score = (count-punish) X5-punish〇
[0122] 本領域技術人員應能理解上述計算各子模型的方式僅為舉例,其他現有的或今后 可能出現的計算各子模型的方式如可適用于本發明,也應包含在本發明保護范圍W內,并 在此W引用方式包含于此。
[0123] 接著,在步驟S2322中圖片檢測設備1根據所述一個或多個圖片檢測子模型中至少 一個,確定對應的圖片檢測模型,其中,所述圖片檢測模型包括用戶與所述圖片類型的映射 關系。優選地,由于子模型中包含了與圖片類型的映射關系,且W鑒別違規圖片為例,每個 子模型與操作違規頻次有一定的相關性,故而可W由其推導出圖片檢測模型。因此,圖片檢 測模型中包含用戶與圖片類型的映射關系。W鑒別違規圖片為例,違規次數較多而被歸入 黑名單的用戶與違規圖片類型有映射關系。
[0124] 具體地,在步驟S2322中圖片檢測設備1根據所述一個或多個圖片檢測子模型中至 少一個,W及所述圖片檢測子模型與所述圖片違規頻次信息的正負相關性,確定對應的圖 片檢測模型,其中,所述圖片檢測模型包括用戶與所述圖片類型的映射關系。優選地,W鑒 別違規圖片為例,白名單與增量模型與檢測模型正相關,黑名單與檢測模型負相關,因此, 得出計算式如下:
[0125] P = D+W-B
[0126] 其中,P為檢測模型,D為增量模型,W為白名單,B為黑名單。
[0127] 本領域技術人員應能理解上述計算檢測模型的方式僅為舉例,其他現有的或今后 可能出現的計算檢測模型的方式如可適用于本發明,也應包含在本發明保護范圍W內,并 在此W引用方式包含于此。
[0128] 所述方法還包括:步驟S26(未示出),所述步驟S26用于根據所述多個第一圖片確 定所述圖片檢測模型在不同單位時段下對應的約束參數。其中,所述單位時段是根據用戶 操作或檢測圖片類型的需要將可統計的用戶操作時段進行劃分所得出的單位時段,例如, 將一天劃分為24個時段,即每個單位時段為一個小時。所述約束參數是指通過將用戶歷史 數據也就是第一圖片數據迭代計算或統計W及歸一處理后得出的對應不同時段的可用于 判斷圖片類型的參數,結合圖片檢測模型可對用戶分時段上傳的圖片進行判斷,從而快速 判斷不同時段圖片的類型,例如,在劃分為24個時段的情況下,2點到3點運個時段的約束參 數為S2,假設根據約束參數的迭代條件設置體現用戶正確操作數和違規操作數權重關系的 score大于約束參數則該用戶該時段的上傳圖片為正常圖片,查詢圖片檢測模型表中用戶A 在2點到3點的score,若score的值大于S2,則用戶A在2點到3點上傳的圖片為正常圖片。確 定所述約束參數有利于結合檢測模型對用戶單位時段內上傳的圖片進行圖片類型的快速 判斷,提升圖片類型檢測的效率。
[0129] 優選地,步驟S26確定所述約束參數的方法包括但不限于W下方法:一、初始化所 述圖片檢測模型在各單位時段對應的約束參數;根據所述多個第一圖片迭代計算所述圖片 檢測模型在各單位時段對應的約束參數,直至由所述圖片檢測模型在各單位時段對應的約 束參數構成的向量在迭代計算前后的距離小于預定的距離闊值。二、根據所述第一圖片的 操作時間所落入的單位時段來統計不同單位時段內包含圖片類型為第一類型的所述第一 圖片的圖片數量信息;對各個單位時段對應的所述圖片數量信息進行歸一化處理,W獲得 所述圖片檢測模型在不同單位時段下對應的約束參數。
[0130] 其中,在方法一中,初始化所述約束參數是指將各段位時段的約束參數賦予一個 迭代計算的初始值,例如,將一天分為24個時段,設置每個單位時段為1個小時,初始化24個 時段的約束參數S1~S24,即設置初始值為S1 = S2 =…= S24 = 0,從而便于后續進行進一步 的迭代計算。方法一主要進行對初始化后的約束參數結合第一圖片數據進行迭代計算,從 而得出不同時段的約束參數,其中,第一圖片數據信息包括但不限于用戶(在迭代計算中表 示為id),上傳圖片的操作時間(在迭代計算中表示為time),體現用戶正確操作數和違規操 作數權重關系的數值(在迭代計算中表示為score),圖片是否違禁(在迭代計算中表示為 illegal)等。迭代公式根據第一圖片數據信息和時段劃分的具體情況確定,本例迭代計算 的公式如下:
[0131]
[0132] 其中,X代表24個時段中的某個時段,例如計算2點到3點的約束參數,則是S2,即X = 2,F代表檢測模型中的表F,true表示圖片違禁為真,將用戶檢測模型中標F中所有用戶ID 對應的歷史數據帶入公式進行迭代計算,當圖片操作時間在需要計算的約束參數所在時 段,且體現用戶正確操作數和違規操作數權重關系的數值大于當前迭代過程中的約束參數 值,且屬于違禁圖片,則在該次迭代中約束參數的值加1。對于迭代計算需要設置迭代的終 止條件,例如通過設置各時段約束參數向量之間的距離不再變化為終止條件,所有計算向 量之間不同樣本間相似性度量的方法均適用于此,本例采用經常用于計算向量距離的漢明 距離化amming dis化nee)進行計算,即當St={Si,S2,. . .,S24}t的漢明距離不再變化時迭代 終止,其中t為迭代次數,到迭代終止時的S1~S24即為對應24個時段的約束參數。
[0133] 本領域技術人員應能理解上述迭代計算得出約束參數的方式僅為舉例,其他現有 的或今后可能出現的迭代計算得出約束參數的方式如可適用于本發明,也應包含在本發明 保護范圍w內,并在此w引用方式包含于此。
[0134] 在方法二中,所述第一圖片的操作時間是根據用戶歷史數據中的記錄進行提取的 用戶上傳第一圖片的時間,所述落入的單位時段是指上傳的第一圖片的時間所屬的單位時 段,例如,將一天按24小時劃分為24個時段,在2點到3點上傳的第一圖片就落在第2個單位 時段,所述第一圖片的數量信息是指在某個時段某種類型圖片的上傳數量。因此,在方法二 中首先統計各用戶在不同時段中所上傳圖片的類型,例如,用戶A在2點到3點所上傳的違禁 圖片數量。所述歸一化處理是指將所述第一圖片的數量信息按不同時段進行統計得出各時 段的對應的第一圖片中第一類型的變化趨勢,例如,建立一張 W時間為橫軸W違禁圖片數 量為縱軸的坐標圖,根據不同時段內用戶上傳的違禁圖片數量畫出變化趨勢圖,或得出相 應的趨勢圖所對應的公式,進而即可獲取不同單位時間段下所對應的約束參數,例如,例如 趨勢顯示2點到3點之間某用戶圖片上傳超過10張為違規圖片的概率超過百分之九十五,貝U 設2-3點之間的約束參數為10,當某用戶上傳圖片數量大于或等于本時段的約束參數,則判 定為違禁圖片。
[0135] 本領域技術人員應能理解上述統計和歸一處理后得出約束參數的方式僅為舉例, 其他現有的或今后可能出現的統計和歸一處理后得出約束參數的方式如可適用于本發明, 也應包含在本發明保護范圍W內,并在此W引用方式包含于此。
[0136] 接著,所述步驟S24用于利用所述圖片檢測模型及所述圖片檢測模型在目標單位 時段下對應的約束參數,確定第二圖片的所述圖片類型,其中,所述第二圖片的操作時間所 落入所述目標單位時段。其中,所述目標單位時間是指所述第二圖片也就是用戶新上傳或 需要判斷的圖片的上傳操作時間所對應的單位時段,例如,若根據一天24小時劃分有24個 單位時段,所述第二圖片的上傳操作時間是2點21分,則其目標單位時段即為2點到3點運個 時段,即約束參數S2所對應的時段。所述圖片檢測模型的表中存有各用戶的用戶ID,上傳圖 片的操作時間,體現用戶正確操作數和違規操作數權重關系的數值score,圖片是否違禁等 信息,當需要判斷某用戶的第二圖片類型時:若約束參數的計算采用的前文所述的方法一, 則根據該用戶的ID查詢到所述第二圖片對應的目標單位時段用戶的score,將所查詢到的 score值與目標單位時段的約束參數進行比較,例如根據上文舉例迭代公式,若score值大 于目標單位時段的約束參數,則該第二圖片屬于正常圖片;若約束參數的計算采用的前文 所述的方法二,則統計當前目標單位時段內第二圖片的數量信息,并查詢用戶ID在目標時 間段對應的第一圖片類型的變化趨勢所對應的約束參數,例如接上文舉例,在2點到3點間 上約束參數為10,用戶在運一時段上傳的圖片數量超過10則為違禁圖片。
[0137] 本領域技術人員應能理解上述根據檢測模型和約束參數判斷圖片類型的方式僅 為舉例,其他現有的或今后可能出現的根據檢測模型和約束參數判斷圖片類型的方式如可 適用于本發明,也應包含在本發明保護范圍W內,并在此W引用方式包含于此。
[0138] 對于本領域技術人員而言,顯然本申請不限于上述示范性實施例的細節,而且在 不背離本申請的精神或基本特征的情況下,能夠W其他的具體形式實現本申請。因此,無論 從哪一點來看,均應將實施例看作是示范性的,而且是非限制性的,本申請的范圍由所附權 利要求而不是上述說明限定,因此旨在將落在權利要求的等同要件的含義和范圍內的所有 變化涵括在本申請內。不應將權利要求中的任何附圖標記視為限制所設及的權利要求。此 夕h顯然"包括"一詞不排除其他單元或步驟,單數不排除復數。裝置權利要求中陳述的多個 單元或裝置也可w由一個單元或裝置通過軟件或者硬件來實現。第一,第二等詞語用來表 示名稱,而并不表示任何特定的順序。
【主權項】
1. 一種圖片檢測方法,包括: 獲取已分別標注圖片類型的多個第一圖片,其中,所述圖片類型包括第一類型或第二 類型; 根據所述第一圖片所對應的上傳用戶信息對所述多個第一圖片進行關聯處理; 根據經關聯處理的所述多個第一圖片確定圖片檢測模型,其中,所述圖片檢測模型包 括用戶與所述圖片類型的映射關系; 利用所述圖片檢測模型確定第二圖片的所述圖片類型。2. 根據權利要求1所述的方法,其中,所述多個第一圖片來自不同的應用; 其中,所述根據所述第一圖片所對應的上傳用戶信息對所述多個第一圖片進行關聯處 理包括: 基于相同用戶在不同應用中用戶標識的對應關系,根據所述第一圖片所對應的上傳用 戶信息對所述多個第一圖片進行關聯處理,以使得對應相同用戶的多個所述第一圖片被關 聯。3. 根據權利要求2所述的方法,其中,所述根據所述第一圖片所對應的上傳用戶信息對 所述多個第一圖片進行關聯處理包括: 基于相同用戶在不同應用中用戶標識的對應關系,對所述多個第一圖片所對應的各上 傳用戶信息進行關聯處理,并使對應相同用戶的多個所述上傳用戶信息映射至同一個新創 建的用戶主鍵信息; 根據所述上傳用戶信息與所述用戶主鍵信息的映射關系,對所述多個第一圖片進行關 聯處理,以使得對應同一個所述用戶主鍵信息的多個所述第一圖片被關聯。4. 根據權利要求1至3中任一項所述的方法,其中,所述根據經關聯處理的所述多個第 一圖片確定圖片檢測模型包括: 根據經關聯處理的所述多個第一圖片確定多個用戶的圖片操作記錄信息; 根據每個用戶的圖片操作記錄信息,確定圖片檢測模型,其中,所述圖片檢測模型包括 用戶與所述圖片類型的映射關系。5. 根據權利要求4所述的方法,其中,所述根據每個用戶的圖片操作記錄信息確定圖片 檢測模型包括: 根據每個用戶的圖片操作記錄信息,確定對應的一個或多個圖片檢測子模型,其中,所 述圖片檢測子模型包括用戶與所述圖片類型的映射關系; 根據所述一個或多個圖片檢測子模型中至少一個,確定對應的圖片檢測模型,其中,所 述圖片檢測模型包括用戶與所述圖片類型的映射關系。6. 根據權利要求5所述的方法,其中,所述圖片檢測子模型包括以下至少任一項: 圖片用戶白名單信息; 圖片用戶黑名單信息; 圖片增量模型。7. 根據權利要求5或6所述的方法,其中,所述根據每個用戶的圖片操作記錄信息確定 對應的一個或多個圖片檢測子模型包括: 根據每個用戶的圖片操作記錄信息及對應的操作時段信息,確定對應的一個或多個圖 片檢測子模型,其中,所述圖片檢測子模型包括用戶與所述圖片類型的映射關系。8. 根據權利要求5至7中任一項所述的方法,其中,所述圖片操作記錄信息包括圖片違 規頻次信息; 其中,所述根據所述一個或多個圖片檢測子模型中至少一個確定對應的圖片檢測模型 包括: 根據所述一個或多個圖片檢測子模型中至少一個,以及所述圖片檢測子模型與所述圖 片違規頻次信息的正負相關性,確定對應的圖片檢測模型,其中,所述圖片檢測模型包括用 戶與所述圖片類型的映射關系。9. 根據權利要求4至8中任一項所述的方法,其中,所述根據每個用戶的圖片操作記錄 信息確定圖片檢測模型還包括: 根據已分別標注圖片類型的第三圖片,更新所述圖片檢測子模型; 根據更新后的所述圖片檢測子模型,更新所述圖片檢測模型。10. 根據權利要求1至9中任一項所述的方法,其中,該方法還包括: 根據對所述第二圖片的圖片類型的人工標注信息,修正所述圖片檢測模型。11. 根據權利要求1所述的方法,其中,所述方法還包括: 根據所述多個第一圖片確定所述圖片檢測模型在不同單位時段下對應的約束參數; 所述利用所述圖片檢測模型確定第二圖片的所述圖片類型包括: 利用所述圖片檢測模型及所述圖片檢測模型在目標單位時段下對應的約束參數,確定 第二圖片的所述圖片類型,其中,所述第二圖片的操作時間所落入所述目標單位時段。12. 根據權利要求11所述的方法,其中,所述根據所述多個第一圖片確定所述圖片檢測 模型在不同單位時段下對應的約束參數包括: 根據所述第一圖片的操作時間所落入的單位時段來統計不同單位時段內包含圖片類 型為第一類型的所述第一圖片的圖片數量信息; 對各個單位時段對應的所述圖片數量信息進行歸一化處理,以獲得所述圖片檢測模型 在不同單位時段下對應的約束參數。13. 根據權利要求11所述的方法,其中,所述根據所述多個第一圖片確定所述圖片檢測 模型在不同單位時段下對應的約束參數包括: 初始化所述圖片檢測模型在各單位時段對應的約束參數; 根據所述多個第一圖片迭代計算所述圖片檢測模型在各單位時段對應的約束參數,直 至由所述圖片檢測模型在各單位時段對應的約束參數構成的向量在迭代計算前后的距離 小于預定的距離閾值。14. 一種圖片檢測設備,包括: 第一裝置,用于獲取已分別標注圖片類型的多個第一圖片,其中,所述圖片類型包括第 一類型或第二類型; 第二裝置,用于根據所述第一圖片所對應的上傳用戶信息對所述多個第一圖片進行關 聯處理; 第三裝置,用于根據經關聯處理的所述多個第一圖片確定圖片檢測模型,其中,所述圖 片檢測模型包括用戶與所述圖片類型的映射關系; 第四裝置,用于利用所述圖片檢測模型確定第二圖片的所述圖片類型。15. 根據權利要求14所述的設備,其中,所述多個第一圖片來自不同的應用; 其中,所述第二裝置用于: 基于相同用戶在不同應用中用戶標識的對應關系,根據所述第一圖片所對應的上傳用 戶信息對所述多個第一圖片進行關聯處理,以使得對應相同用戶的多個所述第一圖片被關 聯。16. 根據權利要求15所述的設備,其中,所述第二裝置用于: 基于相同用戶在不同應用中用戶標識的對應關系,對所述多個第一圖片所對應的各上 傳用戶信息進行關聯處理,并使對應相同用戶的多個所述上傳用戶信息映射至同一個新創 建的用戶主鍵信息; 根據所述上傳用戶信息與所述用戶主鍵信息的映射關系,對所述多個第一圖片進行關 聯處理,以使得對應同一個所述用戶主鍵信息的多個所述第一圖片被關聯。17. 根據權利要求14至16中任一項所述的設備,其中,所述第三裝置包括: 第一單元,用于根據經關聯處理的所述多個第一圖片確定多個用戶的圖片操作記錄信 息; 第二單元,用于根據每個用戶的圖片操作記錄信息,確定圖片檢測模型,其中,所述圖 片檢測模型包括用戶與所述圖片類型的映射關系。18. 根據權利要求17所述的設備,其中,所述第二單元包括: 第一子單元,用于根據每個用戶的圖片操作記錄信息,確定對應的一個或多個圖片檢 測子模型,其中,所述圖片檢測子模型包括用戶與所述圖片類型的映射關系; 第二子單元,用于根據所述一個或多個圖片檢測子模型中至少一個,確定對應的圖片 檢測模型,其中,所述圖片檢測模型包括用戶與所述圖片類型的映射關系。19. 根據權利要求18所述的設備,其中,所述圖片檢測子模型包括以下至少任一項: 圖片用戶白名單信息; 圖片用戶黑名單信息; 圖片增量模型。20. 根據權利要求18或19所述的設備,其中,所述第一子單元用于: 根據每個用戶的圖片操作記錄信息及對應的操作時段信息,確定對應的一個或多個圖 片檢測子模型,其中,所述圖片檢測子模型包括用戶與所述圖片類型的映射關系。21. 根據權利要求18至20中任一項所述的設備,其中,所述圖片操作記錄信息包括圖片 違規頻次信息; 其中,所述第二子單元用于: 根據所述一個或多個圖片檢測子模型中至少一個,以及所述圖片檢測子模型與所述圖 片違規頻次信息的正負相關性,確定對應的圖片檢測模型,其中,所述圖片檢測模型包括用 戶與所述圖片類型的映射關系。22. 根據權利要求17至21中任一項所述的設備,其中,所述第二單元還用于: 根據已分別標注圖片類型的第三圖片,更新所述圖片檢測子模型; 根據更新后的所述圖片檢測子模型,更新所述圖片檢測模型。23. 根據權利要求14至22中任一項所述的設備,其中,該設備還包括: 第五裝置,用于根據對所述第二圖片的圖片類型的人工標注信息,修正所述圖片檢測 模型。
【文檔編號】G06F17/30GK105824871SQ201610034656
【公開日】2016年8月3日
【申請日】2016年1月19日
【發明人】金炫
【申請人】阿里巴巴集團控股有限公司