<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

信息搜索方法及裝置的制作方法

文檔序號:6438196閱讀:223來源:國知局
專利名稱:信息搜索方法及裝置的制作方法
技術領域
本發明涉及信息處理技術領域,尤其涉及一種信息搜索方法及裝置。
背景技術
現有技術中,當用戶需要解決某個問題時,可以在搜索引擎中輸入該問題,搜索引擎搜索與該問題相關的問題,然后再查找這些相關的問題的答案,用戶可以通過查找到的這些答案找到解決問題的途徑。在信息搜索技術領域中,將用戶在搜索引擎中輸入的問題稱為當前搜索信息,搜索引擎中存儲有之前各用戶輸入的搜索問題,這些問題稱為歷史搜索信息,每個歷史搜索信息都對應至少一個反饋信息(即歷史搜索信息的答案),搜索引擎接收到用戶輸入的當前搜索信息后,分別計算該當前搜索信息與存儲的各歷史搜索信息之間的相似度,然后選取出相似度較大的一些歷史搜索信息,并將選取出的這些歷史搜索信息提供給用戶。由上可見,現有技術是根據當前搜索信息與歷史搜索信息之間的相似度來選取歷史搜索信息的。用戶輸入的當前搜索信息一般為短文本,而短文本包含的詞量較少,若用戶輸入的當前搜索信息和某個歷史搜索信息的涵義非常接近,那么這個歷史搜索信息的反饋信息很可能會對用戶有幫助,但是如果當前搜索信息和這個歷史搜索信息所共同具有的單詞較少,那么搜索引擎計算出的相似度就較低,搜索引擎可能不會將該歷史搜索信息提供給用戶,例如,用戶輸入的當前搜索信息為“我如何在互聯網上下載音樂”,而搜索引擎中存儲有歷史搜索信息“從網絡獲取MP3歌曲最便捷的途徑”,這兩個搜索信息的涵義非常接近,那么“從網絡獲取MP3歌曲最便捷的途徑”這個歷史搜索信息的反饋信息很可能會對用戶解決問題有幫助,但是這兩個搜索信息共同具有的單詞只有一個“網”字,那么搜索引擎針對這兩個搜索信息計算出的相似度就非常低,從而不會將該歷史搜索信息提供給用戶,用戶也就無法通過該歷史搜索信息的答案找到解決問題的途徑。因此采用現有技術中的信息搜索方法為用戶搜索到的歷史搜索信息不全面,且準確性較低。

發明內容
本發明實施例提供一種信息搜索方法及裝置,用以解決采用現有技術中的信息搜索方法為用戶搜索到的歷史搜索信息不全面,且準確性較低的問題。本發明實施例技術方案如下:—種信息搜索方法,該方法包括步驟:獲得用戶輸入的當前搜索信息;針對預設的每個歷史搜索信息,分別確定所述當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度;根據確定出的關聯度,在各歷史搜索信息中選取出滿足預設條件的歷史搜索信息;并將選取出的歷史搜索信息提供給用戶。一種信息搜索裝置,包括:當前搜索信息獲得單元,用于獲得用戶輸入的當前搜索信息;關聯度確定單元,用于針對預設的每個歷史搜索信息,分別確定所述當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度;歷史搜索信息選取單元,用于根據關聯度確定單元確定出的關聯度,在各歷史搜索信息中選取出滿足預設條件的歷史搜索信息;歷史搜索信息提供單元,用于將歷史搜索信息選取單元選取出的歷史搜索信息提供給用戶。本發明實施例技術方案中,首先獲得用戶輸入的當前搜索信息,然后針對預設的每個歷史搜索信息,分別確定所述當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度,根據確定出的關聯度,在各歷史搜索信息中選取出滿足預設條件的歷史搜索信息,并將選取出的歷史搜索信息提供給用戶。由上可見,本發明實施例技術方案在為用戶搜索信息時,不再根據用戶輸入的當前搜索信息與歷史搜索信息之間的相似度來選取歷史搜索信息,若當用戶輸入的當前搜索信息和某個歷史搜索信息的涵義非常接近,即使共同具有的單詞較少,那么該歷史搜索信息對應的最佳反饋信息和當前搜索信息也是非常關聯的,因此本發明實施例根據當前搜索信息與歷史搜索信息對應的最佳反饋信息之間的關聯度來選取歷史搜索信息,從而能夠全面的為用戶搜索歷史搜索信息,且有效地提高了搜索的準確性。


圖1為本發明實施例一中,信息搜索方法流程示意圖;圖2為本發明實施例一中,信息搜索方法原理示意圖;圖3為本發明實施例三中,信息搜索裝置結構示意圖。
具體實施例方式下面結合各個附圖對本發明實施例技術方案的主要實現原理具體實施方式
及其對應能夠達到的有益效果進行詳細地闡述。實施例一如圖1所示,為本發明實施例一提出的信息搜索方法流程示意圖,其原理如圖2所示,具體處理流程如下:步驟11,獲得用戶輸入的當前搜索信息。用戶輸入的當前搜索信息一般為短文本信息。步驟12,針對預設的每個歷史搜索信息,分別確定所述當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度。本發明實施例一提出,可以預先根據預設的各歷史搜索信息及對應的反饋信息,對物理模型進行訓練,得到該物理模型的模型參數矢量,后續可以直接根據該模型參數矢量,計算當前搜索信息和最佳反饋信息之間的關聯度。其中,搜索引擎中存儲的每個歷史搜索信息均對應至少一個反饋信息,但是只有一個反饋信息是歷史搜索信息的最佳反饋信息,該最佳反饋信息與歷史搜索信息之間的相關度為1,其他反饋信息與該歷史搜索信息之間的相關度為O。歷史搜索信息Qi的反饋信息Ki與該歷史搜索信息Qi之間的相關度為Lu,當Lu = I時,確認反饋信息Ki為該歷史搜索信息Qi的最佳反饋信息,該反饋信息Aj可以記為BAj,當Lij = O時,確認反饋信息Aj不為該歷史搜索信息Qi的最佳反饋信息。在對物理模型進行訓練時,先選取一定數量具有最佳反饋信息的歷史搜索信息以及對應的反饋信息作為訓練信息集,針對每個歷史搜索信息以及該歷史搜索信息對應的每個反饋信息,分別獲取該歷史搜索信息與該反饋信息之間的特征信息,然后根據獲取的各特征信息,確定該歷史搜索信息與該反饋信息之間的特征向量,根據確定出的各特征向量,對預設的物理模型進行訓練。本發明實施例一中,上述物理模型可以但不限于為貝葉斯邏輯回歸模型。下面以貝葉斯邏輯回歸模型為例,來介紹根據預設的各歷史搜索信息及對應的反饋信息對物理模型進行訓練的過程。將選取的歷史搜索信息記為Qi,對應的反饋信息記為Ap歷史搜索信息Qi與其對應的反饋信息 之間的特征信息包含文本特征信息和非文本特征信息,其中,文本特征信息如表I所示,非文本特征信息如表2所示。表1:
權利要求
1.一種信息搜索方法,其特征在于,包括: 獲得用戶輸入的當前搜索信息; 針對預設的每個歷史搜索信息,分別確定所述當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度; 根據確定出的關聯度,在各歷史搜索信息中選取出滿足預設條件的歷史搜索信息;并 將選取出的歷史搜索信息提供給用戶。
2.如權利要求1所述的方法,其特征在于,針對預設的每個歷史搜索信息,分別確定所述當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度,具體包括: 獲得根據預設的各歷史搜索信息及對應的反饋信息對物理模型進行訓練得到的模型參數矢量; 針對每個歷史搜索信息,分別根據獲得的模型參數矢量,計算所述當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度。
3.如權利要求2所述的方法,其特征在于,根據預設的各歷史搜索信息及對應的反饋信息對物理模型進行訓練,具體包括: 針對預設的每個歷史搜索 信息以及該歷史搜索信息的每個反饋信息,分別執行: 獲取該歷史搜索信息與該反饋信息之間的特征信息;并 根據獲取的各特征信息,確定該歷史搜索信息與該反饋信息之間的特征向量; 根據確定出的各特征向量,對預設的物理模型進行訓練。
4.如權利要求2所述的方法,其特征在于,所述物理模型為貝葉斯邏輯回歸模型。
5.如權利要求2所述的方法,其特征在于,通過下述方式確定所述當前搜索信息與歷史搜索信息對應的最佳反饋信息之間的關聯度:
6.如權利要求1所述的方法,其特征在于,根據確定出的關聯度,在各歷史搜索信息中選取出滿足預設條件的歷史搜索信息,具體包括: 在各最佳反饋信息中,選取關聯度大于規定閾值的最佳反饋信息; 將選取出的最佳反饋信息對應的歷史搜索信息,確認為滿足預設條件的歷史搜索信
7.如權利要求1所述的方法,其特征在于,將選取出的歷史搜索信息提供給用戶,具體包括: 按照對應的最佳反饋信息的關聯度由大到小的順序,將選取出的歷史搜索信息進行排序;并 將排序后的結果提供給用戶。
8.如權利要求1所述的方法,其特征在于,將選取出的歷史搜索信息提供給用戶,具體包括: 針對選取出的每個歷史搜索信息,分別確定該歷史搜索信息與對應的最佳反饋信息之間的關聯度,并根據該歷史搜索信息與對應的最佳反饋信息之間的關聯度以及當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度,確定當前搜索信息與該歷史搜索信息之間的相似度; 按照相似度由大到小的順序,將選取出的歷史搜索信息進行排序;并 將排序后的結果提供給用戶。
9.如權利要求8所述的方法,其特征在于,通過下述方式確定當前搜索信息與歷史搜索信息之間的相似度:
10.一種信息搜索裝置,其特征在于,包括: 當前搜索信息獲得單元,用于獲得用戶輸入的當前搜索信息; 關聯度確定單元,用于針對預設的每個歷史搜索信息,分別確定所述當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度; 歷史搜索信息選取單元,用于根據關聯度確定單元確定出的關聯度,在各歷史搜索信息中選取出滿足預設條件的歷史搜索信息; 歷史搜索信息提供單元,用于將歷史搜索信息選取單元選取出的歷史搜索信息提供給用戶。
11.如權利要求10所述的裝置,其特征在于,還包括: 模型訓練單元,用于預先根據預設的各歷史搜索信息及對應的各反饋信息,對物理模型進行訓練,得到模型參數矢量; 關聯度確定單元具體包括: 參數矢量獲得子單元,用于獲得模型訓練單元得到的模型參數矢量; 關聯度計算子單元,用于針對每個歷史搜索信息,分別根據參數矢量獲得子單元獲得的模型參數矢量,計算所述當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度。
12.如權利要求11所述的裝置,其特征在于,模型訓練單元具體包括: 特征信息獲取子單元,用于針對預設的每個歷史搜索信息以及該歷史搜索信息對應的每個反饋信息,分別獲取該歷史搜索信息與該反饋信息之間的特征信息; 特征向量確定子單元,用于針對預設的每個歷史搜索信息以及該歷史搜索信息對應的每個反饋信息,分別根據特征信息獲取子單元獲取的各特征信息,確定該歷史搜索信息與該反饋信息之間的特征向量; 模型訓練子單元,用于針對預設的每個歷史搜索信息以及該歷史搜索信息對應的每個反饋信息,分別根據特征向量確定子單元確定出的各特征向量,對預設的物理模型進行訓練。
13.如權利要求10所述的裝置,其特征在于,歷史搜索信息選取單元具體包括:反饋信息選取子單元,用于在各最佳反饋信息中,選取關聯度大于規定閾值的最佳反饋信息; 歷史搜索信息確認子單元,用于將反饋信息選取子單元選取出的最佳反饋信息對應的歷史搜索信息,確認為滿足預設條件的歷史搜索信息。
14.如權利要求10所述的裝置,其特征在于,歷史搜索信息提供單元具體包括: 第一排序子單元,用于按照對應的最佳反饋信息的關聯度由大到小的順序,將歷史搜索信息選取單元選取出的歷史搜索信息進行排序; 第一提供子單元,用于將第一排序子單元排序后的結果提供給用戶。
15.如權利要求10所述的裝置,其特征在于,歷史搜索信息提供單元具體包括: 關聯度確定子單元,用于針對歷史搜索信息選取單元選取出的每個歷史搜索信息,分別確定該歷史搜索信息與對應的最佳反饋信息之間的關聯度; 相似度確定子單元,用于針對每個歷史搜索信息,分別根據該歷史搜索信息與對應的最佳反饋信息之間的關聯度以及當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度,確定當前搜索信息與該歷史搜索信息之間的相似度; 第二排序子單元,用于按照相似度由大到小的順序,將歷史搜索信息選取單元選取出的歷史搜索信息進行排序; 第二提供子單元,用于 將第二排序子單元排序后的結果提供給用戶。
全文摘要
本發明公開了一種信息搜索方法及裝置,該信息搜索方法包括步驟獲得用戶輸入的當前搜索信息;針對預設的每個歷史搜索信息,分別確定所述當前搜索信息與該歷史搜索信息對應的最佳反饋信息之間的關聯度;根據確定出的關聯度,在各歷史搜索信息中選取出滿足預設條件的歷史搜索信息;并將選取出的歷史搜索信息提供給用戶。采用本發明技術方案,解決了采用現有技術中的信息搜索方法為用戶搜索到的歷史搜索信息不全面,且準確性較低的問題。
文檔編號G06F17/30GK103106212SQ20111035956
公開日2013年5月15日 申請日期2011年11月14日 優先權日2011年11月14日
發明者凌俊民, 劉曉峰, 梁耿, 陳陽, 徐俊 申請人:中國移動通信集團廣西有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影