<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

一種類別從屬度計算方法及系統的制作方法

文檔序號:9235614閱讀:362來源:國知局
一種類別從屬度計算方法及系統的制作方法
【技術領域】
[0001] 本發明涉及電子數字處理領域,具體地說是一種衡量某個數據屬于某個分類的程 度的類別從屬度計算方法。
【背景技術】
[0002] 當今社會中數據信息日益鹿大,為了在海量的數據中,更好的獲取所需的數據,需 要對數據進行分類。數據分類是根據一定的規則將某個數據劃分到某個分類中。如有監督 的數據分類方法,依靠小樣本學習后得到的模型,對其他更大范圍的未分類數據進行分類。 根據一定的規則,將某一個數據最終劃到一個類別中。
[0003]但是,在進行分類時,用戶不僅會關注一個數據被分到了某個分類,除了該個分類 信息之外,在所關注的分類中,用戶可能還需要知道數據屬于分類的程度,即類別從屬度。 目前的分類技術,例如1化linear SVM分類技術,可W提供分類信息,但不能提供類別從屬 度信息。例如,一本書籍介紹餐飲娛樂信息,分類體系中有餐飲、娛樂、軍事、政治等分類,基 于該分類體系,該書籍可能會被分到餐飲或娛樂中的一個類別。假設該書籍被分到了餐飲 類,則用戶最終可W獲取該書籍屬于餐飲類該一個信息,但是,對于用戶而言,可能還需要 了解,針對餐飲和娛樂該兩個他所關注的分類,該書籍屬于餐飲類的程度或屬于娛樂類的 程度該一信息。此外,針對某個分類下的數據,如果能更好的提供其屬于其他分類的程度, 也會為用戶提供更多的參考信息,讓用戶獲得數據時具有更好的參考信息。例如,對于被分 到餐飲類的書籍,用戶可能還想獲知其屬于歷史還是屬于娛樂的程度大,如果能夠提供該 餐飲類下的書籍,屬于其他類的程度,也會為用戶提供更多的參考信息。

【發明內容】

[0004] 為此,本發明所要解決的技術問題在于現有技術中僅提供對數據的分類,不能提 供數據屬于分類的程度、不能為用戶提供更多的參考信息,從而提出一種為用戶提供更多 的參考信息的類別從屬度的計算方法。
[0005]為解決上述技術問題,本發明提供一種類別從屬度的計算方法,包括如下步驟:
[0006]確定所有分類;
[0007]確定參考分類,其中,所述參考分類為所有分類中的部分或全部;
[0008]確定待分析數據對應所述參考分類中每個分類的參考值;
[0009]對于每個分類,根據待分析數據在該分類的參考值和待分析數據對應該參考分類 中每個分類的參考值,確定待分析數據對于該分類的類別從屬度。
[0010] 一種類別從屬度的計算系統,包括:
[0011] 所有分類確定模塊:確定所有分類;
[0012] 參考分類確定模塊;確定參考分類,其中,所述參考分類為所有分類中的部分或全 部;
[0013] 參考值計算模塊:確定待分析數據對應所述參考分類中每個分類的參考值;
[0014]類別從屬度計算模塊;對于每個分類,根據待分析數據在該分類的參考值和待分 析數據對應該參考分類中每個分類的參考值,確定待分析數據對于該分類的類別從屬度。
[0015] 本發明的上述技術方案相比現有技術具有W下優點,
[0016] (1)本發明所述的類別從屬度的計算方法,首先確定所有分類W及參考分類,然后 確定待分析數據對應所述參考分類中每個分類的參考值,再根據待分析數據在該分類的參 考值和待分析數據對應該參考分類中每個分類的參考值確定待分析數據對于該分類的類 別從屬度。該方案中,通過選擇適當的參考值,來表示待分析數據對應每個分類的關系大 小,然后再通過待分析數據在該分類的參考值和對每個分類的參考值的關系,最終確定該 待分析數據對于該分類的類別從屬度,通過該種方法來計算類別從屬度,可W很好的表示 出待分析數據與其關注的那些分類之間的從屬關系的大小,從而通過類別從屬度表示出待 分析數據與參考分類中每個分類的從屬度數據,使用戶一目了然的知道了待分析數據與其 關注的分類的關系,為用戶提供更多的分類參考信息,不僅計算簡單,而且非常直觀。
[0017] (2)本發明還提供可實現上述功能的類別從屬度的計算系統,包括所有分類確定 模塊、參考分類確定模塊、參考值計算模塊、類別從屬度計算模塊,實現了類別從屬度的計 算,提供一種基于分類的類別從屬度信息,將類別從屬信息進行了量化,使得用戶可W直觀 的獲取類別從屬程度,為用戶提供更多的分類的參考信息。
【附圖說明】
[0018]為了使本發明的內容更容易被清楚的理解,下面根據本發明的具體實施例并結合 附圖,對本發明作進一步詳細的說明,其中
[0019] 圖1是本發明類別從屬度的計算方法一個實施例的流程圖;
[0020] 圖2是本發明類別從屬度的計算系統的一個實施例的結構框圖。
【具體實施方式】
[0021] 連施例1 :
[0022] 本實施例提供一種類別從屬度的計算方法,流程圖如圖1所示,包括如下步驟:
[0023] (1)確定所有分類,建立分類集合C= {ci,C2,…,C。}。
[0024] (2)確定參考分類,所述參考分類為分類集合中的部分分類或所有分類,從而建立 分類子集C',其中,C'cC。C' = {ci,cv??如…,其中c'iGC'為分類子集C'中的一 個分類,i=l,2,…!!!;!!!為分類子集C'中的分類的個數。
[0025] (3)確定待分析數據X對應分類子集C'中每個分類C'i的參考值,所述參考值為待 分析數據X到C'i與C\c'i的分類超平面的距離值。本實施例中,通過訓練后的liblinear SVM分類器,計算待分析數據X在分類集合C中對應于每個分類C'i的參考值s' 1,其中每個 分類C'i對應于C'i與C\c'i的二分類問題,參考值s'i為待分析數據X到C'i與C\c'i的分 類超平面的距離,i= 1,2,…,n。該距離的計算公式為wx+b,其中W是分類超平面的法向 量,b為偏差。。
[0026]SVM(suppcxrtvectormachine)即支持向量機,是一種機器學習算法,通過訓練計 算分類超平面,利用分類超平面進行分類,利用核函數將低維空間數據映射到高維空間求 解。SVM分類器可W解決二分類問題,使用一條直線巧日果數據只有二維)或一個超平面將 數據分類。通過SVM分類器分類時,首先通過樣本構建一簇超平面,然后獲得原數據與超平 面的距離進行分類。
[0027] SVM分類器是現有技術中較為成熟的技術,liblinearSVM通過SVM技術解決多分 類問題,通過上述過程,可W得到m個距離數據,也就是獲得了待分析數據X對應分類子集 中每個分類的參考值。
[0028](4)對于每個分類C'1,根據待分析數據X在該分類的參考值s'i和待分析數據X 對應該參考分類中每個分類的參考值s'1,s'2,s'3,…,s'm,然后來計算待分析數據對于該 分類的類別從屬度,計算公式如下:
[0029]
[0030] 其中,C'i為所述參考分類中的第i個分類,f(c'1)為待分析數據對于分類C'i的 類別從屬度,s'i為待分析數據對應所述分類C'i的參考值,m為參考分類中分類的個數,s'j. 為待分析數據在參考分類中對應第j個分類的參考值,j=l,2,…,
為待分析數據對 應參考分類中每個分類的參考值之和。
[0031] 上述類別從屬度根據待分析數據在該分類的參考值和待分析數據對應該參考分 類中每個分類的參考值之和的比值來計算,通過該比值可W很好的反映出待分析數據對該 分類的類別從屬程度,體現出其類別從屬度的特征,從而客觀的反應出該類別從屬度信息。
[0032] 通過上述方法來計算類別從屬度,可W很好的表示出待分析數據與其關注的那些 分類之間的從屬關系的大小,從而通過類別從屬度可W表示出待分析數據與參考分類中每 個分類的從屬度數據,使用戶一目了然的知道了待分析數據與其關注的分類的關系,為用 戶提供更多的分類參考信息,不僅計算簡單,而且非常直觀。
[0033] 作為其他可W替換的實施方式,所述參考值為與該分類的相關程度單調性一致的 值,即該值越大表示與該分類的相關程度越大,該值越小則表示與該分類的相關程度越小, 現有技術中在分類計算過程或其他計算過程中產生的滿足該個條件的值都可W選擇為該 參考值。例如,上述實施例中參考值選擇待分析數據X到C'i與C\c'i的分類超平面的距離 值,也可W選擇K-NS分類算法獲得的待分析數據到分類的距離值,分別采用上述兩個值作 為參考值時,如果W該參考值和與該分類的相關程度分別作為X、y變量在二維坐標系顯示 的是單調遞增的曲線,也就是說該些值具備了與該分類的相關程度單調性一致的特性。
[0034] 此外,還可W選擇K-NS算法中產生的一些與該分類的相關程度單調性一致的中 間值,或者采用通過形式變換獲得的與該分類的相關程度單調性一致的中間值。如K-NS算 法中產生的歐幾里德距離?,由于該值越大表示數據樣本與該分類相關度越小,單調 性相反,可通過形式變換如的倒數或者巧中A為一個比d^l^,大的常數), 使得變換后的值與分類相關度單調性一致后,便可W作為本方案中的參考值使用。由于現 有技術中,采用不同的分類方法時,在計算過程中都存在一些特征值和中間值,如果該些值 滿足上述條件,則可W選擇該值作為參考值進行類別從屬度的計算。
[00巧]此外,作為其他的實施方式,在所述步驟(3)中,還需要對獲得的m個距離數據進 行歸一化處理,將歸一化處理后的值作為參考值。所述歸一化處理通過函數變換來實現,使 用函數f(x) = 1/a+e^ix)進行歸一化變換,其中X為歸一化變換前的值,f(x)為歸一化 變換后的值,本實施例中選擇A =2,此時歸一化的效果較好。在其他的實施方式中,可選擇 入> 1的其他值。
[0036] 由于在分類計算中獲取的數值如上述步驟(3)中的距離值,可能存在為負數的問 題,或者存在相差很大的問題。如果存在為負數時,直接計算可能產生錯誤,如待分析數據 對于兩個分類獲得的距離分別為-a和a時,如果直接計算則分
當前第1頁1 2 3 4 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影