<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

特征屬性的構建方法

文檔序號:8905606閱讀:556來源:國知局
特征屬性的構建方法
【技術領域】
[0001] 本發明設及大數據應用技術,特別是設及一種數據對象的特征屬性的構建方法。
【背景技術】
[0002] 在傳統工業時代,消費者與消費者,消費者與企業、產業鏈上下游之間的信息交流 是閉塞的,不對等的。企業在生產商品時,往往根據自己的經驗進行商品生產,確定商品需 要生產的各項屬性,最終進行生產。由于沒有很好的提前對市場進行調研,收集用戶需求, 導致生產出的商品往往不受人們所需要,甚至自認為對用戶有很大幫助的功能用戶都從來 沒有用過,造成企業大多數是在生產用戶不需要的商品。因此如何確定商品的各項屬性是 用戶所需要的,如何確定該商品的各項屬性是當今制造業面臨的巨大挑戰。
[0003] 目前被廣泛應用的特征屬性的確定方案中,是根據特征屬性所屬數據對象(如某 種商品)的歷史市場銷量數據確定的,例如,將歷史銷量中賣的最好的屬性值組合起來,構 成數據對象的屬性集合。
[0004] 例如屏幕尺寸、顏色、電池容量是手機的S個特征屬性,而屏幕尺寸目前有5英 寸、4. 5英寸、4英寸=個可供生產的屬性值。廠商在確定手機屏幕尺寸時通過歷史中各尺 寸的銷售記錄來看哪個尺寸賣的最好,從而最終確定下一代手機的屏幕尺寸大小,同理確 定其他手機屬性如顏色、電池容量等等。
[0005] 由于在實際應用中,單個屬性值歷史銷量最好無法確保它們組合起來后可W獲得 較好的銷量,因此,上述直接選擇銷量數據最大的屬性值,構建數據對象的特征屬性的方 法,無法對未來的用戶真實需要進行預測,進而也不能確保所得到數據對象與實際的市場 需要所匹配。

【發明內容】

[0006] 有鑒于此,本發明的主要目的在于提供一種特征屬性的構建方法,可W使得所得 到數據對象滿足更多用戶的實際需要。
[0007] 為了達到上述目的,本發明提出的技術方案為:
[0008] 一種特征屬性的構建方法,包括:
[0009]a、根據屬性值數量,從數據對象的特征屬性集合中,選擇出候選特征屬性;并根據 屬性值對應的產品銷量占比,對所述候選特征屬性的屬性值進行篩選;
[0010]b、根據所述數據對象所屬類別下已有產品的銷量數據,確定所述候選特征屬性的 每個屬性值的整體效用貢獻系數;
[0011]C、根據所述整體效用貢獻系數和所述數據對象所屬類別下已有產品的用戶評論 數據,確定每個所述候選特征屬性的重要性分值;
[0012]t選擇所述候選特征屬性中重要性分值最大的前M個候選特征屬性作為所述數 據對象的重要特征屬性;其中,M為預設的重要特征屬性的數量口限;
[0013]e、將不同重要特征屬性的不同屬性值進行組合,得到N組屬性值組合,其中,每組 屬性值組合包含M個屬性值且各自所屬的特征屬性不同;
[0014] f、確定每組屬性值組合的可生產性占比;根據所述可生產性占比和屬性值組合中 各屬性值的所述整體效用貢獻系數,確定出所述數據對象的最優屬性值組合。
[0015] 綜上所述,本發明提出的特征屬性的構建方法,根據歷史銷量數據和用戶評論數 據,選擇出重要特征屬性,然后對其屬性值進行組合,最后根據每種組合的可生產性占比W 及組合中各屬性值的整體效用貢獻系數,確定出數據對象的最優屬性值組合。該樣,在確定 重要特征屬性W及選擇相應屬性值組合時,不僅考慮了歷史銷售數據,還考慮了用戶的評 論數據,W及屬性值組合的可生產性,從而可W有效提升最終確定出的特征屬性值組合的 客觀性和準確性,使得對應的數據對象可W滿足更多用戶的實際需要。
【附圖說明】
[0016] 圖1為本發明實施例一的流程示意圖。
【具體實施方式】
[0017] 為使本發明的目的、技術方案和優點更加清楚,下面將結合附圖及具體實施例對 本發明作進一步地詳細描述。
[0018] 本發明的核屯、思想是;通過建模分析數據對象的重要特征屬性及每個屬性值,據 此確定數據對象的最優的特征屬性組合,W提升數據對象的客觀性和準確性。
[0019] 圖1為本發明實施例一的流程示意圖,如圖1所示,該實施例主要包括:
[0020] 步驟101、根據屬性值數量,從數據對象的特征屬性集合中,選擇出候選特征屬性; 并根據屬性值對應的產品銷量占比,對所述候選特征屬性的屬性值進行篩選。
[0021] 本步驟,用于選擇出候選特征屬性并對其屬性值進行篩選。
[0022] 較佳地,可W采用下述方法選擇出候選特征屬性:
[0023] 步驟al、刪除所述特征屬性集合中只有兩種屬性值的特征屬性。
[0024] 該里,考慮到只有兩種屬性值時,如支持和不支持化va功能,用戶的可選擇性較 小,該種屬性對于用戶的選擇性影響不大,因此,其重要性較低,可W剔除。
[0025] 步驟a2、刪除所述特征屬性集合中屬性值數量超過預設的數量闊值a的特征屬 性,a〉9。
[0026] 該里,考慮到特征屬性的屬性值太多的話,用戶不知道選擇哪個,因此,其重要性 較低,可W剔除。
[0027] 步驟a3、將當前得到的所述特征屬性集合中的特征屬性作為所述候選特征屬性。 [002引較佳地,本步驟中可W采用下述方法對候選特征屬性的屬性值進行篩選:
[0029] 對于所述候選特征屬性的每個屬性值,如果該屬性值對應的產品銷量占比小于預 設的占比闊值b,則刪除該屬性值。
[0030] 該里,考慮到如果一個屬性值對應的產品銷量占比很少,則說明該屬性值不重要, 可W剔除。
[0031] 上述篩選過程W屬性值對應的產品銷量占比為依據進行,可W去除候選特征屬性 中對用戶不重要的屬性值,W確保最終構建的特征屬性與用戶的實際需要所匹配。
[0032] 本步驟中,各屬性值對應的產品銷量占比的具體獲知方法為本領域技術人員所掌 握,在此不再寶述。
[0033] 所述占比闊值b可由本領域技術人員根據實際需要設置,較佳地,可W為20%。
[0034] 步驟102、根據所述數據對象所屬類別下已有產品的銷量數據,確定所述候選特征 屬性的每個屬性值的整體效用貢獻系數。
[0035] 本步驟,用于根據與數據對象同類別下的已有產品的銷量數據,確定候選特征屬 性的每個屬性值的整體效用貢獻系數。例如,當數據對象是一種新款手機時,此情況下,需 要分析之前存在的各種手機的銷售數據,根據該些已有手機的候選特征屬性配置W及相應 的銷量,來確定出對銷量大小影響較大的屬性值。由于歷史的銷售數據是由用戶的最終消 費行為所決定的,因此,可W反映出用戶的真實需要。相應地,基于此所得到的屬性值得的 整體效用貢獻系數也可W客觀的反映出其對銷量的影響程度。
[0036] 較佳地,可W通過求解方程注
來確定所述候選特征屬性的每 個屬性值的整體效用貢獻系數。
[0037] 其中,Yj.為所述數據對象所屬類別下第j個產品的銷量,j= 1,…,J,J為所述數 據對象所屬類別下已有產品的總數;\h為第i個所述候選特征屬性的第h個屬性值的整體 效用貢獻系數,Xj.Ah為第j個產品是否具有第i個所述候選特征屬性的第h個屬性值的標 識參數,其中,如果具有,則Xj.Ah= 1,否則,Xj.Ah= 0,I為所述候選特征屬性的總數;Hi為 第i個候選特征屬性的屬性值總數。
[003引該里通過求解上述由J個回歸方程組成的方程組,即可得到每個候選特征屬性的 每個屬性值的整體效用貢獻系數\h。具體求解方法為本領域人員所掌握,在此不再寶述。
[0039] 步驟103、根據所述整體效用貢獻系數和所述數據對象所屬類別下已有產品的用 戶評論數據,確定每個所述候選特征屬性的重要性分值。
[0040] 本步驟,用于對每個所述候選特征屬性的重要性進行評分,即確定其重要性分值。 該里,不僅考慮了根據歷史銷量數據所確定出的整體效用貢獻系數,還將考慮已有同類產 品的用戶評論數據中對特征屬性的關注情況,如此,可W確保特征屬性的重要性評分結果 的客觀、準確性。
[0041] 較佳地,可W采用下述方法來確定每個所述候選特征屬性的重要性分值:
[0042] 步驟bl、對于每個所述候選特征屬性,根據屬性值的所述整體效用貢獻系數,確定 該候選特征屬性的效用重要性系數。
[0043] 較佳地,可W采用下述方法來確定每個所述候選特征屬性的效用重要性系數:
[0044] 步驟bll、對于每個所述候選特征屬性i,根據該屬性的每個屬性值的所述整體效 用貢獻系數,計算該屬性的整體效用貢獻系數標準差stdi。
[0045] 本步驟中,整體效用貢獻系數標準差Stdi的具體計算方法為本域技術人員所掌 握,在此不再寶述。
[0046] 步驟bl2、按照
確定每個所述候選特征屬性i的效用重要性 系數Wi,其中,2Stdi為所有所述候選特征屬性的整體效用貢獻系數標準差總和。
[0047] 步驟bl3、按照
確定每個所述候選特征屬性i的語義重要性系數Zi,其 中,ti為所述用戶評論數據中用戶對候選特征屬性i的評論次數,為所述用戶評論數 據中用戶對所有所述候選特征屬性評論的總次數。
[0048] 步驟b2、根據所述用戶評論數據,確定每個所述候選特征屬性的語義重要性系數。
[0049] 步驟b3、根據每個所述候選特征屬性的效用重要性系數和語義重要性系數,確定 每
當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影