1.一種推廣關鍵詞的觸發方法,其特征在于,所述方法包括:
獲取用戶輸入的query;
將所述獲取的query對應的輸入序列輸入到翻譯模型,得到輸出序列;
利用所述輸出序列確定所述query觸發的推廣關鍵詞;
其中,所述翻譯模型是采用如下方式預先訓練得到的:
從用戶點擊行為日志中獲取query及其對應的被點擊標題作為訓練數據;
利用訓練數據中的query得到輸入序列,利用query對應的被點擊標題得到目標序列,訓練神經網絡模型,得到翻譯模型。
2.根據權利要求1所述的方法,其特征在于,將所述獲取的query對應的輸入序列輸入到翻譯模型包括:
對所述獲取的query進行分詞處理,將分詞處理后得到的詞語序列作為輸入序列輸入到翻譯模型;
所述利用訓練數據中的query得到輸入序列包括:將訓練數據中的query進行分詞處理,將分詞處理后得到的詞語序列作為輸入序列。
3.根據權利要求1所述的方法,其特征在于,所述翻譯模型利用beam-search技術以及預設的推廣關鍵詞庫,對所述獲取的query對應的輸入序列進行翻譯,得到輸出序列。
4.根據權利要求3所述的方法,其特征在于,所述翻譯模型對所述獲取的query對應的輸入序列翻譯得到的各輸出序列滿足以下條件:
輸出序列的數量在beam-size以內,且各輸出序列的概率大于或等于預設的概率閾值Q,且在所述推廣關鍵詞庫中存在與所述輸出序列一致的推廣關鍵詞或者存在以所述輸出序列為前綴的推廣關鍵詞。
5.根據權利要求4所述的方法,其特征在于,所述翻譯模型在對所述輸入序列進行翻譯的過程中,在各層均進行如下處理:
在推廣關鍵詞庫中查詢各層翻譯得到的候選詞語;
若推廣關鍵詞庫中不存在以之前各層已確定的詞語與該候選詞語構成的序列為前綴的詞語,則將該候選詞語剪枝掉;
將剩余的候選詞語依據概率值進行排序,將排在beam-size個之后的詞語剪枝掉;
對排在beam-size個以內的詞語中,概率值小于所述Q的詞語剪枝掉。
6.根據權利要求1所述的方法,其特征在于,所述神經網絡模型為:循環神經網絡模型RNN。
7.根據權利要求1所述的方法,其特征在于,利用所述輸出序列確定所述query觸發的推廣關鍵詞包括:
判斷推廣關鍵詞庫中是否存在與所述輸出序列一致的推廣關鍵詞,如果是,則將與所述輸出序列一致的推廣關鍵詞作為所述query觸發的推廣關鍵詞。
8.根據權利要求1至7任一權項所述的方法,其特征在于,該方法還包括:
在所述query對應的搜索結果頁中包括所述query觸發的推廣關鍵詞對應的推廣結果。
9.一種推廣關鍵詞的觸發裝置,其特征在于,所述裝置包括:
獲取單元,用于獲取用戶輸入的query;
翻譯單元,用于將所述獲取的query對應的輸入序列輸入到翻譯模型,得到輸出序列;
確定單元,用于利用所述輸出序列確定所述query觸發的推廣關鍵詞;
訓練單元,用于采用如下方式預先訓練得到所述翻譯模型:
從用戶點擊行為日志中獲取query及其對應的被點擊標題作為訓練數據;
利用訓練數據中的query得到輸入序列,利用query對應的被點擊標題得到目標序列,訓練神經網絡模型,得到翻譯模型。
10.根據權利要求9所述的裝置,其特征在于,所述翻譯單元將所述獲取的query對應的輸入序列輸入到翻譯模型時,具體執行:
對所述獲取的query進行分詞處理,將分詞處理后得到的詞語序列作為輸入序列輸入到翻譯模型;
所述訓練單元在利用訓練數據中的query得到輸入序列時,具體執行:翻譯單元將訓練數據中的query進行分詞處理,將分詞處理后得到的詞語序列作為輸入序列。
11.根據權利要求9所述的裝置,其特征在于,所述翻譯單元的翻譯模型利用beam-search技術以及預設的推廣關鍵詞庫,對所述獲取的query對應的輸入序列進行翻譯,得到輸出序列。
12.根據權利要求11所述的裝置,其特征在于,所述翻譯單元中的翻譯模型對所述獲取的query對應的輸入序列翻譯得到的各輸出序列滿足以下條件:
輸出序列的數量在beam-size以內,且各輸出序列的概率大于或等于預設的概率閾值Q,且在所述推廣關鍵詞庫中存在與所述輸出序列一致的推廣關鍵詞或者存在以所述輸出序列為前綴的推廣關鍵詞。
13.根據權利要求12所述的裝置,其特征在于,所述翻譯單元中的翻譯模型在對所述輸入序列進行翻譯的過程中,在各層均進行如下處理:
在推廣關鍵詞庫中查詢各層翻譯得到的候選詞語;
若推廣關鍵詞庫中不存在以之前各層已確定的詞語與該候選詞語構成的序列為前綴的詞語,則將該候選詞語剪枝掉;
將剩余的候選詞語依據概率值進行排序,將排在beam-size個之后的詞語剪枝掉;
對排在beam-size個以內的詞語中,概率值小于所述Q的詞語剪枝掉。
14.根據權利要求9所述的裝置,其特征在于,所述翻譯單元中翻譯模型使用的神經網絡模型為:循環神經網絡模型RNN。
15.根據權利要求9至14任一權項所述的裝置,其特征在于,所述確定單元在利用輸出序列確定所述query觸發的推廣關鍵詞包括:
判斷推廣關鍵詞庫中是否存在與所述輸出序列一致的推廣關鍵詞,如果是,則將與所述輸出序列一致的推廣關鍵詞作為所述query觸發的推廣關鍵詞。
16.根據權利要求9~15任一權項所述的裝置,該裝置還包括:
觸發單元,用于在所述query對應的搜索結果頁中包括所述query觸發的推廣關鍵詞對應的推廣結果。