<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

基于強化學習的天線抗風擾調控方法、系統、設備及存儲介質與流程

文檔序號:37126345發布日期:2024-02-22 21:38閱讀:33來源:國知局
基于強化學習的天線抗風擾調控方法、系統、設備及存儲介質與流程

本發明屬于大口徑天線變形調控領域,具體涉及一種基于強化學習的天線抗風擾調控方法、系統、設備及存儲介質。


背景技術:

1、良好的主副面伺服控制系統是解決大型反射面天線在復雜環境下提升天線電性能的關鍵技術。現如今高性能大型反射面天線控制系統往往包括方位俯仰伺服、主動副反射面和主動主反射面三個子控制系統。然而當前三個子控制系統工作往往是分離的,未考慮大型天線主副面伺服系統在天線調控時的可調可控性問題,未合理有效分配不同狀態下各個系統之間如何調整。而風載荷相較于重力、溫度載荷具有時變性和隨機性,很難像緩變載荷一樣建立查表法進行補償,風擾是大型反射面天線環境載荷中最復雜、最難以補償的問題。

2、反射面天線調控發展到現今,一直是工業界、學術界研究的重要話題,已經是個多學科交叉的技術,對此,相關學者提出了許多方法。最傳統的控制方法是pid控制,但是pid控制器已不能滿足大型反射面天線高精度控制的需求。gawronski針對nasa-dsn深空網絡天線x波段和ka波段進行了pi、lqg、h∞三種控制器實驗,研究證明了pi算法雖然簡單可靠,但其性能已無法滿足高頻段的要求,lqg和h∞雖然能夠提高天線伺服系統的傳動性能,但由于硬件制約,其控制效果不是很理想。

3、雖然各種控制方法試圖降低算法對模型精度的依賴程度,但基于模型的控制方法不可避免的受到模型誤差的影響,不可能建立準確的模型。近年來隨著人工智能的快速發展,結合人工智能和自動控制的新型算法是控制領域的發展趨勢。


技術實現思路

1、本發明的目的在于提供一種基于強化學習的天線抗風擾調控方法、系統、設備及存儲介質,以克服現有技術反射面天線控制系統抗風擾建模困難,精度低的問題。

2、為達到上述目的,本發明采用如下技術方案:

3、一種基于強化學習的天線抗風擾調控方法,包括以下步驟:

4、獲得天線變形后反射面、反射副面關鍵節點的位置信息,建立天線最佳吻合拋物面方程;

5、根據天線最佳吻合拋物面方程與反射面關鍵節點位置信息,得到反射面促動器調整量及天線俯仰角調整量;

6、根據反射副面關鍵節點位置信息與天線最佳吻合拋物面方程,得到反射副面平臺調整量;

7、將天線俯仰角調整量輸入至已訓練好的天線俯仰角控制模型中,輸出天線俯仰角調整信號,將反射面促動器調整量輸入至已訓練好的天線反射面促動器控制模型中,輸出天線反射面促動器調整信號;

8、根據得到的反射副面調整量、天線俯仰角調整信號及天線反射面促動器調整信號對天線進行調整。

9、進一步的,所述預先訓練好的天線反射面促動器控制模型及天線俯仰角控制模型為通過仿真訓練獲得的天線反射面促動器控制模型及天線俯仰角控制模型,所述天線反射面促動器控制模型及天線俯仰角控制模型均采用ddpg模型。

10、進一步的,所述天線變形后反射面、反射副面關鍵節點的位置信息通過布置在天線上的位移傳感器獲得。

11、進一步的,所述天線最佳吻合拋物面通過反射面關鍵節點位置信息擬合得到,天線最佳吻合拋物面方程為:

12、

13、式中,x、y為最佳吻合拋物面橫、縱坐標,δx、δy、δz分別為天線最佳吻合拋物面頂點與理想拋物面頂點之間的相對位移量,φx、φy分別為最佳吻合拋物面相對于理想拋物面方位、俯仰軸的轉動量,δf為焦距的變化。

14、進一步的,所述反射面促動器調整量公式為:

15、

16、其中,p1(x0,y0,z0)為變形后節點的真實坐標,p0(x0′,y0′,z0′)為最佳吻合拋物面上與之相對應的關鍵節點的坐標。

17、進一步的,所述天線俯仰角的調整量為:

18、δφy=-φy+δθ

19、其中,θ指的是俯仰角調整前角度,θ′指的是俯仰角調整后角度。

20、進一步的,所述根據反射副面調整量通過stewart平臺將反射副面調整至最佳匹配位置處,所述最佳匹配位置處反射主面與反射副面焦點重合且焦軸重合,反射副面可以通過平移、旋轉操作移動到最佳匹配位置。

21、一種基于強化學習的天線抗風擾調控系統,包括:

22、獲取模塊:用于獲得天線變形后反射面、反射副面關鍵節點的位置信息,建立天線最佳吻合拋物面方程;

23、計算模塊:用于根據天線最佳吻合拋物面方程與反射面關鍵節點位置信息,得到反射面促動器調整量及天線俯仰角調整量,根據反射副面關鍵節點位置信息與天線最佳吻合拋物面方程,得到反射副面平臺調整量;

24、調整信號輸出模塊:用于將天線俯仰角調整量輸入至已訓練好的天線俯仰角控制模型中,輸出天線俯仰角調整信號,將反射面促動器調整量輸入至已訓練好的天線反射面促動器控制模型中,輸出天線反射面促動器調整信號;

25、調整模塊:用于根據得到的反射副面調整量、天線俯仰角調整信號及天線反射面促動器調整信號對天線進行調整。

26、一種終端設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現基于強化學習反射面天線抗風擾調控方法的步驟。

27、一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現基于強化學習反射面天線抗風擾調控方法的步驟。

28、與現有技術相比,本發明具有以下有益的技術效果:

29、本發明一種基于強化學習的天線抗風擾調控方法,通過獲取天線受到風擾后的天線變形后反射面、反射副面關鍵節點的位置信息并建立天線最佳吻合拋物面方程,并根據天線反射面、反射副面關鍵節點的位置信息及天線最佳吻合拋物面方程分別求出反射面促動器調整量、天線俯仰角調整量及反射副面平臺調整量,并將天線俯仰角調整量輸入至已訓練好的天線俯仰角控制模型中,輸出天線俯仰角調整信號,將反射面促動器調整量輸入至已訓練好的天線反射面促動器控制模型中,輸出天線反射面促動器調整信號,利用已訓練好的天線俯仰角控制模型及已訓練好的天線反射面促動器控制模型分別實現對天線俯仰角控制系統及天線反射面促動器控制系統的調整,通過多系統調控策略能應對各種復雜的環境工況,具有良好的抗干擾能力,確保天線在受到風擾時仍能保持良好的指向和增益性能。

30、進一步的,強化學習通過動態的環境數據集,經過大量的訓練來探索環境、從環境中學習,從而確定生成最優結果的最佳調整策略。實時分配各子系統的調整量,實現對天線形面變形直接補償及對高頻指向誤差的快速補償,以達到快速綜合補償大型反射面天線電性能的目的。



技術特征:

1.一種基于強化學習的天線抗風擾調控方法,其特征在于,包括以下步驟:

2.根據權利要求1所述的基于強化學習的天線抗風擾調控方法,其特征在于,所述預先訓練好的天線反射面促動器控制模型及天線俯仰角控制模型為通過仿真訓練獲得的天線反射面促動器控制模型及天線俯仰角控制模型,所述天線反射面促動器控制模型及天線俯仰角控制模型均采用ddpg模型。

3.根據權利要求1所述的基于強化學習的天線抗風擾調控方法,其特征在于,所述天線變形后反射面、反射副面關鍵節點的位置信息通過布置在天線上的位移傳感器獲得。

4.根據權利要求1所述的基于強化學習的天線抗風擾調控方法,其特征在于,所述天線最佳吻合拋物面通過反射面關鍵節點位置信息擬合得到,天線最佳吻合拋物面方程為:

5.根據權利要求1所述的基于強化學習的天線抗風擾調控方法,其特征在于,所述反射面促動器調整量公式為:

6.根據權利要求1所述的基于強化學習的天線抗風擾調控方法,其特征在于,所述天線俯仰角的調整量為:

7.根據權利要求1所述的基于強化學習的天線抗風擾調控方法,其特征在于,所述根據反射副面調整量通過stewart平臺將反射副面調整至最佳匹配位置處,所述最佳匹配位置處反射主面與反射副面焦點重合且焦軸重合,反射副面可以通過平移、旋轉操作移動到最佳匹配位置。

8.一種基于強化學習的天線抗風擾調控系統,其特征在于,包括:

9.一種終端設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1-7任一項所述基于強化學習反射面天線抗風擾調控方法的步驟。

10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1-7任一項所述基于強化學習反射面天線抗風擾調控方法的步驟。


技術總結
本發明公開了一種基于強化學習的天線抗風擾調控方法、系統、設備及存儲介質,通過天線反射面、反射副面關鍵節點的位置信息及天線最佳吻合拋物面方程分別求出反射面促動器調整量、天線俯仰角調整量及反射副面平臺調整量,并將天線俯仰角調整量輸入至已訓練好的天線俯仰角控制模型中,輸出天線俯仰角調整信號,將反射面促動器調整量輸入至已訓練好的天線反射面促動器控制模型中,輸出天線反射面促動器調整信號,利用已訓練好的天線俯仰角控制模型及已訓練好的天線反射面促動器控制模型分別實現對天線俯仰角控制系統及天線反射面促動器控制系統的調整,具有良好的抗干擾能力,確保天線在受到風擾時仍能保持良好的指向和增益性能。

技術研發人員:李寧,王曉潔,彭海波,馬元元,程杰,張坤,楊佩,李桐,李凱勝
受保護的技術使用者:西安微電子技術研究所
技術研發日:
技術公布日:2024/2/21
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影