
本發明涉及一種大規模小負荷控制領域的方法,具體講涉及一種基于Netlogo與Matlab的負荷分布式控制方法。
背景技術:
目前,我國正在深化電力市場改革,更合理地配置資源,提高資源的利用率,促進電力工業與社會、經濟、環境的協調發展。大用戶直購電交易無疑是此次改革的突破口,對我國的電力市場建設具有重要意義。大用戶直購電交易打破電網企業獨家買賣電力的格局,在發電和售電側引入競爭機制;同時促進電網輸配分開,使終端用戶進入電力市場。終端用戶的加入意味著市場允許負荷在競價模式下參與整個電網的功率平衡調整。在競爭性電力市場中,負荷的需求響應(DR)成為了需求側管理的重點,即負荷根據價格信號或相應的激勵機制,調節自身需求量從而保證系統安全可靠和經濟運行。
市場未開放前,負荷無法參與系統功率平衡調節,故目前對于負荷控制方法研究較少,且現有的仿真平臺仿真過程不直觀可見,計算速度較慢,收斂性不強等缺點。負荷自身的多變性和不確定性使控制變得尤為困難,本發明基于多智能體的方法能夠有效應對,因此本發明提出分布式控制方法對負荷進行控制。本發明提供的分布式控制方法中每個電力系統元件組成的模塊具有一定的智能性,能夠應對外界擾動,做出積極反應,同時通過自身與周邊模塊的溝通來實現自我調整以達到一定程度的自治,實現實時調度以及分布式調度,從而提高電網運行的可靠性和經濟性。
技術實現要素:
為克服上述現有技術的不足,本發明提供一種基于Netlogo與Matlab的負荷分布式控制方法,對負荷進行分布式協調控制。通過負荷-電價響應特性模型的建立,結合負荷所對應目標的目標傾向度構成負荷的策略集,采用強化學習算法獲得負荷對應其最大總目標函數值的策略,并結合Matlab中的最優潮流計算,實現對電力系統中負荷多智能體優化控制。
實現上述目的所采用的解決方案為:
一種基于Netlogo與Matlab的負荷分布式控制方法,該控制方法基于強化學習算法,對每個負荷多智能體通用模塊構造策略集,在策略集中選擇對應總目標函數值最大的策略,包括如下步驟:
步驟1:建立基于Matlab與Netlogo的聯合仿真平臺及數據交互接口模塊:Matlab用于電力系統的各項運算;Netlogo用于電力系統智能元件建模、負荷分布式控制和負荷代理的建立;
步驟2:分別根據負荷基準量、電價、經濟性傾向度和舒適度傾向度,建立負荷-電價響應特性模型;
步驟3:根據所述負荷-電價響應特性模型,得到各個負荷的總目標函數;
步驟4:設定負荷各個目標傾向度大小在0-1之間,所有目標的目標傾向度構成的集合稱為負荷動作策略。將0-1等距離離散化m份,每個目標的目標傾向度均有m個選擇,假設某個負荷共有N個目標,則負荷可選動作策略共有個,構成負荷的可選策略集;
步驟5:定義并初始化負荷的每個策略的傾向系數和概率系數。按概率選擇各負荷的動作策略,將動作策略以Netlogo中的坐標形式表示出來,各個負荷 分別運動到Netlogo三維層面中相應的位置上,不同的位置對應不同的策略;
設定網絡節點初始電價,根據對應的負荷-電價響應特性模型,獲得此時各個負荷的功率,并且結合負荷代理針對對應負荷的管轄,分別獲得各個負荷代理的總功率;
步驟6:將所述各個負荷代理的總功率通過Matlab與Netlogo之間的數據交換接口模塊,由Netlogo發送至Matlab中,在Matlab中分別針對各個負荷代理的總功率進行市場出清,獲得對應各個網絡節點的電價從而更新Netlogo中每個負荷節點的電價,再由每個負荷代理將節點電價下發給其所管轄的負荷;
步驟7:每個負荷對所選的策略進行計算以獲得各負荷策略的學習效用,按照修正參數修改策略集合中各策略的被選概率,在系數調配合適的情況下,系統達到收斂狀態,即某個動作策略被選擇的概率趨近于1,則滿足了強化學習過程中的終止條件,在未滿足終止條件情況下,循環執行步驟5、6、7。
優選的,所述多智能體通用模塊包括通信屬性子模塊、智能屬性子模塊和物理屬性子模塊;
所述通信屬性子模塊用于模擬電力系統元件之間的信息交換過程;
所述智能屬性子模塊用于描述電力系統元件制定決策的過程;
所述物理屬性子模塊用于定義電力系統元件的運行狀態。
優選的,所述步驟1中,所述負荷代理管轄對應負荷節點下的所有負荷,并用于其管轄的各個負荷節點和Matlab之間的信息傳輸;
所述數據交互接口模塊用于Matlab與Netlogo之間的數據交換。
優選的,所述步驟2中,所述負荷-電價響應特性模型是將電價信號與負荷 自身目標融合考慮的負荷模型,如下式:
其中Qi為負荷需求量,Qi0為負荷基準量,由負荷代理i對供電專營區內終端用戶的負荷預測取得;μi為經濟性傾向度,為舒適度傾向度,ρi為供電公司i向終端用戶售電的電價;
所述負荷自身目標包括經濟性和舒適度。
優選的,所述步驟3中,所述總目標函數Ri由各個目標函數乘以其相對應的目標傾向度后疊加而得,如下式:
Bi為負荷利潤,Ci為負荷舒適度。
優選的,所述步驟6中,所述負荷根據初始電價以及當前策略,由負荷-電價響應特性模型得到此時每個負荷的功率,從而獲得電網中負荷節點的負荷需求量;
采用Matlab中的最優潮流計算工具,根據此時電網的負荷需求,計算得到每個節點的電價及每臺發電機出力情況。
優選的,控制過程中策略按照設定方法更新。
與現有技術相比,本發明具有以下有益效果:
本發明提出的控制方法具有計算速度快,收斂性強等優點,能夠針對智能體的多變性進行控制,應對外界的擾動,做出積極的反應。
本發明相較以往的電力系統仿真系統具有仿真過程直觀可見的特點,整個過程中可以在Netlogo中很清楚地看到每個智能元件模塊的狀態變化情況。
附圖說明
圖1:本發明提供的電力系統負荷多智能體控制方法流程圖;
圖2:本發明實施算例的三機九節點系統圖;
圖3:本發明進行的三機九節點網絡仿真界面圖。
具體實施方式
下面結合附圖對本發明的具體實施方式做進一步的詳細說明。
本發明提供的技術方案是一種電力系統負荷多分布式控制方法,所述的方法具體步驟如下:
步驟一:根據電力系統網絡結構,建立基于Matlab與Netlogo的聯合仿真平臺,其中,Matlab負責電力系統的各項運算,Netlogo承擔電力系統智能元件建模以及負荷分布式控制的工作,并且根據Netlogo三維層面中的負荷節點,建立負荷代理,負荷代理的數量與負荷節點的數量一致,負荷代理與負荷節點一一對應,各個負荷代理管轄對應負荷,并且各個負荷代理分別用于其管轄的各個負荷和Matlab之間的信息傳輸;同時,搭建Matlab和Netlogo之間的數據交換接口模塊實現信息交互;
步驟二:設定每個負荷都有兩個自身所要追求的目標:經濟性和舒適度。從而確定四種負荷的初始模型:輸入量為電價ρi,以及經濟性傾向度μi和舒適度傾向度輸出量為功率值。負荷建模如下:其中Qi0由負荷代理i對供電專營區內終端用戶的負荷預測取得;μi反映了終端用戶負荷需求對銷售電價ρi的響應,不同類型的用戶對應的μi系數不同,由對采集的數據分析而得;反映了終端用戶負荷需求對舒適度的響應,不同類型的用戶對應的系數不同,由對采集的數據分析而得;ρi為供電公司i向終端用戶售電的電價。
步驟三:針對搭建的負荷模型,確定負荷每個目標的目標函數及總目標函數。負荷利潤:負荷舒適度:其中μi∈[0,1],從而得到總目標函數:
步驟四:將負荷i的策略等距離離散化(m+1)×(m+1)份處理,故負荷i的策略集為其中序號為x×y的策略含義為:x∈[0,m],y∈[0,m]。
步驟五:負荷的每個策略行為都標志有傾向系數qi和概率系數pi,初始化負荷的每個策略傾向系數為1,概率系數為按概率(如輪盤賭)選擇各負荷的動作策略將各個負荷分別運動到Netlogo三維層面中相應的位置上。設定網絡節點初始電價,然后根據對應的負荷-電價響應特性模型,獲得此時各個負荷的功率,并且結合負荷代理針對對應負荷的管轄,分別獲得各個負荷代理的總功率;
步驟六:將各個負荷代理的總功率PL1、PL2、PL3...通過Matlab與Netlogo之間的數據交換接口模塊,由Netlogo發送至Matlab中,在Matlab中分別針對各個負荷代理的總功率進行市場出清,獲得對應各個網絡節點的電價C1、C2、C3...。Netlogo通過Matlab與Netlogo之間的數據交換接口調用Matlab中計算得到的節點電價,更新Netlogo中每個負荷代理的電價,由每個負荷代理將節點電價下發給其所管轄的負荷;
步驟七:每個負荷根據所選的策略,計算負荷的Ri值即為策略更新中的profiti(x,y)(D),其中D為重復博弈的輪次,同時采用如下公式:qi(i,j)(D+1)=[1-r]qi(i,j)(D)+Ri(i,j)(D)、更新傾向系數qi和 概率系數pi。其中響應函數:當i=x,j=y時:Ri(i,j)(D)=(1-e)profiti(x,y)(D);當i≠x或j≠y時:Ri(i,j)(D)=e·qi(i,j)(D)/[(m+1)×(m+1)-1]。若滿足終止條件,則負荷停止運動,否則循環執行步驟五、六、七。
控制過程中策略更新方法如下:假設負荷i的可選策略集合為若在重復博弈第D輪策略被選中,且計算負荷i此輪的目標值為profiti(x,y)(D),則在第D+1輪,對于策略的傾向更新公式如下:qi(i,j)(D+1)=[1-r]qi(i,j)(D)+Ri(i,j)(D),其中響應函數:當i=x,j=y時:Ri(i,j)(D)=(1-e)profiti(x,y)(D);當i≠x或j≠y時:Ri(i,j)(D)=e·qi(i,j)(D)/[(m+1)×(m+1)-1],式中r為遺忘因子,其對于各行為傾向隨時間的增加起抑制作用,減小了以前的經驗的重要性,而使得新的策略的影響增強。e為一個經驗參數,對于負荷在重復博弈早期學習階段生成各種不同的報價策略起到鼓勵作用;
此時策略的選擇概率公式如下:負荷i根據新的選擇概率,按照輪盤賭方式選擇下一輪的策略行為,對于每個行為動作,負荷都標志有傾向系數qi和概率系數pi,每輪策略都根據總目標值更新。
最后應當說明的是:以上實施例僅用于說明本申請的技術方案而非對其保護范圍的限制,盡管參照上述實施例對本申請進行了詳細的說明,所屬領域的普通技術人員應當理解:本領域技術人員閱讀本申請后依然可對申請的具體實施方式進行種種變更、修改或者等同替換,但這些變更、修改或者等同替換,均在申請待批的權利要求保護范圍之內。