本發明涉及計算機技術領域,尤其是涉及一種移動端用戶購買路徑計算方法及系統。
背景技術:
移動電子商務業務中,經常需要分析計算用戶的購買路徑來優化用戶購買體驗、對比多個活動模塊的優劣、精準化定義用戶標簽,從而提升整體購買轉化率,提高用戶滿意度等。
現有的計算用戶購買路徑的方式通常是借鑒傳統PC端經驗,通過用戶在首頁、CMS頁、商詳頁、購物袋頁、支付頁、成單頁的訪問量,以及埋點可以計算上一級頁面的特性,籠統的計算各個頁面間的轉化率。
但是這種計算方式只有二級的轉化可以確定是準確的,超過二級的轉化都會存在大量的誤差,例如在多個CMS頁同時包含同一個商品時,用戶通過多個CMS頁面進入商詳頁,然后再點擊加入購物車這個行為,在數據上我們無法知道用戶是從哪個CMS頁面進入商詳后,才會點擊加入購物車。
本技術方案利用用戶在移動APP上的瀏覽具有線性、單頁面的屬性(PC端用戶可以開啟多個標簽頁同時進行瀏覽),通過數據埋點的發生時間進行排序后,準確計算用戶購買路徑。
MapReduce:一種編程模型,用于大規模數據集(大于1TB)的并行運算。概念"Map(映射)"和"Reduce(歸約)",指定一個Map(映射)函數,用來把一組鍵值對映射成一組新的鍵值對,指定并發的Reduce(歸約)函數,用來保證所有映射的鍵值對中的每一個共享相同的鍵組。
技術實現要素:
本發明的目的在于克服上述技術不足,提出一種移動端用戶購買路徑計算方法及系統,解決現有技術中計算購買路徑存在大量誤差的技術問題。
為達到上述技術目的,本發明的技術方案提供一種移動端用戶購買路徑計算方法,包括:
S1、對APP的頁面進行劃分,劃分成不同的頁面層級,第一個頁面層級定義為級數最高的頁面層級,頁面層級劃分完成后,在每一個頁面層級都只能轉向下一個頁面層級,或者返回上一個頁面層級;
S2、在APP里進行數據埋點,埋點記錄用戶在APP上的所有點擊行為和瀏覽行為,以及記錄用戶行為的時間戳、頁面層級ID、設備ID,通過消息中間控件將埋點記錄的所有數據寫入大數據集群hdfs;
S3、對大數據集群hdfs中埋點記錄的所有數據進行map reduce排序;
S4、遍歷埋點的每一條記錄,計算用戶訪問路徑,以用戶訪問路徑字段保存用戶訪問路徑,用戶訪問路徑字段以頁面層級ID的有序組合表示。
本發明還提供一種移動端用戶購買路徑計算系統,包括:
層級劃分模塊:對APP的頁面進行劃分,劃分成不同的頁面層級,第一個頁面層級定義為級數最高的頁面層級,頁面層級劃分完成后,在每一個頁面層級都只能轉向下一個頁面層級,或者返回上一個頁面層級;
埋點記錄模塊:在APP里進行數據埋點,埋點記錄用戶在APP上的所有點擊行為和瀏覽行為,以及記錄用戶行為的時間戳、頁面層級ID、設備ID,通過消息中間控件將埋點記錄的所有數據寫入大數據集群hdfs;
分析排序模塊:對大數據集群hdfs中埋點記錄的所有數據進行map reduce排序;
獲取路徑模塊:遍歷埋點的每一條記錄,計算用戶訪問路徑,以用戶訪問路徑字段保存用戶訪問路徑,用戶訪問路徑字段以頁面層級ID的有序組合表示。
與現有技術相比,本發明的有益效果包括:通過劃分APP的頁面層級,在APP里進行數據埋點,埋點記錄用戶在APP上的所有點擊行為和瀏覽行為,對埋點記錄的所有數據進行map reduce排序,遍歷埋點的每一條記錄,可準確計算用戶的購買路徑。
附圖說明
圖1是本發明提供的一種移動端用戶購買路徑計算方法流程圖;
圖2是本發明提供的一種移動端用戶購買路徑計算系統結構框圖。
附圖中:1、移動端用戶購買路徑計算系統,11、層級劃分模塊,12、埋點記錄模塊,13、分析排序模塊,14、獲取路徑模塊。
具體實施方式
為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。
本發明提供了一種移動端用戶購買路徑計算方法,其中,包括:
S1、對APP的頁面進行劃分,劃分成不同的頁面層級,第一個頁面層級定義為級數最高的頁面層級,頁面層級劃分完成后,在每一個頁面層級都只能轉向下一個頁面層級,或者返回上一個頁面層級;
S2、在APP里進行數據埋點,埋點記錄用戶在APP上的所有點擊行為和瀏覽行為,以及記錄用戶行為的時間戳、頁面層級ID、設備ID,通過消息中間kafka控件將埋點記錄的所有數據寫入大數據集群hdfs;
S3、根據設備ID、瀏覽時間戳對大數據集群hdfs中埋點記錄的所有數據進行map reduce排序,減少遍歷埋點記錄進行計算訪問路徑的計算量。
S4、遍歷埋點的每一條記錄,計算用戶訪問路徑,以用戶訪問路徑字段保存用戶訪問路徑,用戶訪問路徑字段以頁面層級ID的有序組合表示。
本發明所述的移動端用戶購買路徑計算方法,步驟S1中:
根據對APP進行準確細致的分析,將所有頁面劃分成入口、導航、前站、商詳、購物車、支付6個層級(頁面層級ID分別為ID1、ID2、ID3、ID4、ID5、ID6)。
本發明所述的移動端用戶購買路徑計算方法,步驟S2中:
由于在APP上用戶訪問是單線性,不會同時訪問多個頁面,所以在用戶瀏覽商品、下單的過程中,存在著互斥步驟,例如,用戶在訪問了活動頁A時,想要訪問和活動頁A同層級的活動頁B,則必須先退回到入口頁(例如首頁),然后才能再次選擇進入活動頁B,這種需要重新選擇入口頁才能進入同級頁面的關系,定義為互斥頁面,在用戶瀏覽過程中,存在互斥關系的頁面,埋點僅記錄互斥頁面中的用戶瀏覽時間軸上最后一個瀏覽頁面。
本發明所述的移動端用戶購買路徑計算方法,步驟S4中計算訪問路徑的方法:
比較當前頁面的頁面層級ID與上一條記錄的頁面層級ID,若上一條記錄的頁面層級ID高于當前頁面的頁面層級ID,則繼承上一條記錄的訪問路徑,在用戶訪問路徑字段中添加上一條記錄的頁面層級ID,若上一條記錄的頁面層級ID低于當前頁面的頁面層級ID,則將上一條記錄的訪問路徑置空,在用戶訪問路徑字段中添加本頁面層級的ID,若沒有上一條記錄,當前頁面為用戶第一個訪問頁面,則在用戶訪問路徑字段中添加第一個訪問頁面的層級ID;
例如,上一條記錄的頁面層級ID為ID2導航頁,本條記錄的頁面層級ID為ID3前站頁,上一條記錄頁面層級ID高于本條記錄頁面層級ID,上一條記錄訪問路徑為:ID1-ID2,繼承上一條記錄的訪問路徑后,本條記錄的訪問路徑為:ID1-ID2-ID3;
上一條記錄的頁面層級ID為ID3前站頁,本條記錄的頁面層級ID為ID2導航頁,上一條記錄頁面層級ID低于本條記錄頁面層級ID,將上一條記錄的訪問路徑ID1-ID2-ID3置空后,本條記錄的訪問路徑為:ID2;
若是第一條記錄,沒有上一條記錄,例如訪問首頁,那么,第一條記錄的訪問路徑為ID1。
根據設備I D、瀏覽時間戳對大數據集群hdfs中埋點記錄的所有數據進行map reduce排序,減少遍歷埋點記錄進行計算訪問路徑的計算量,如果不對埋點記錄的數據進行map reduce排序,那么需要將當前記錄的頁面層級ID與之前的所有的記錄的頁面層級ID進行比較,以計算訪問路徑,這樣計算量巨大,而依據設備ID、瀏覽時間戳對埋點記錄的用戶行為數據進行map reduce排序后,只需要將當前記錄的頁面層級ID與排序中上一條記錄的頁面層級ID進行比較就可以了,大大減少了計算量。
遍歷所有埋點記錄,所有記錄的用戶訪問路徑計算完成后,可以進行全站的流量路徑轉化分析,甚至是銷售路徑轉化分析。
本發明還提供移動端用戶購買路徑計算系統1,其中,包括:
層級劃分模塊11:對APP的頁面進行劃分,劃分成不同的頁面層級,第一個頁面層級定義為級數最高的頁面層級,頁面層級劃分完成后,在每一個頁面層級都只能轉向下一個頁面層級,或者返回上一個頁面層級;
埋點記錄模塊12:在APP里進行數據埋點,埋點記錄用戶在APP上的所有點擊行為和瀏覽行為,以及記錄用戶行為的時間戳、頁面層級ID、設備ID,通過消息中間控件將埋點記錄的所有數據寫入大數據集群hdfs;
分析排序模塊13:對大數據集群hdfs中埋點記錄的所有數據進行map reduce排序;
獲取路徑模塊14:遍歷埋點的每一條記錄,計算用戶訪問路徑,以用戶訪問路徑字段保存用戶訪問路徑,用戶訪問路徑字段以頁面層級ID的有序組合表示。
本發明所述的移動端用戶購買路徑計算系統1,埋點記錄模塊12中:
消息中間件為kafka。
本發明所述的移動端用戶購買路徑計算系統1,分析排序模塊13中:
根據設備ID、瀏覽時間戳將埋點記錄的用戶行為數據進行map reduce排序,減少遍歷埋點記錄進行計算訪問路徑的計算量。
本發明所述的移動端用戶購買路徑計算系統1,獲取路徑模塊14中計算訪問路徑:
比較當前頁面的頁面層級ID與上一條記錄的頁面層級ID,若上一條記錄的頁面層級ID高于當前頁面的頁面層級ID,則繼承上一條記錄的訪問路徑,在用戶訪問路徑字段中添加上一條記錄的頁面層級ID,若上一條記錄的頁面層級ID低于當前頁面的頁面層級ID,則將上一條記錄的訪問路徑置空,在用戶訪問路徑字段中添加本頁面層級的ID,若沒有上一條記錄,當前頁面為用戶第一個訪問頁面,則在用戶訪問路徑字段中添加第一個訪問頁面的層級ID。
與現有技術相比,本發明的有益效果包括:通過劃分APP的頁面層級,在APP里進行數據埋點,埋點記錄用戶在APP上的所有點擊行為和瀏覽行為,對埋點記錄的所有數據進行map reduce排序,遍歷埋點的每一條記錄,可準確計算用戶的購買路徑。
以上所述本發明的具體實施方式,并不構成對本發明保護范圍的限定。任何根據本發明的技術構思所做出的各種其他相應的改變與變形,均應包含在本發明權利要求的保護范圍內。