技術特征:
技術總結
本發明公開了一種基于強化學習的多路徑傳輸協議擁塞控制方法,通過建立馬爾可夫決策過程,將擁塞控制形式化表示。用發送端的各個子流的擁塞窗口大小以及各個子流的RTT來表示各個子流當前的網絡狀態,定義發送端調整擁塞窗口和發送間隔的動作,建立目標方程,以獲得最大平均吞吐量和最小平均時延為目的。通過建立網絡模型,模擬產生多種網絡環境。在不同的網絡環境中,通過不斷地試錯,對當前網絡環境做所有的動作,然后從環境給出的反饋中學習并優化動作。經過大量的線下學習,使得發送端可以在某一個狀態區域做出相應的調整擁塞窗口大小和發送間隔的動作,以使得目標方程的值最大。
技術研發人員:薛超婧;李文中;陸桑璐
受保護的技術使用者:南京大學
技術研發日:2017.05.22
技術公布日:2017.09.15