一種基于深度學習神經網絡模型的圖像目標識別方法與流程

文檔序號：41222703發布日期：2025-03-11 14:00閱讀：42來源：國知局

本發明屬于圖像識別，特別涉及一種基于深度學習神經網絡模型的圖像目標識別方法。

背景技術：

1、深度學習網絡模型中包含大量的參數與計算。在服務器端(如地面端)訓練時，為保證深度學習網絡模型精度，各級卷積層的初始卷積核、各級卷積層的初始偏置矩陣、全連接層的初始權重矩陣和全連接層的初始偏置向量，通常使用32位浮點的數據格式。在邊緣端(如飛行器端)使用訓練好的深度學習網絡模型時，受存儲空間及計算資源的嚴格限制，在保持精度的同時，為降低計算消耗，需要使用低位寬定點數據格式進行推理計算。將深度學習網絡模型中高位寬的數據轉化為低位寬的數據的方法稱為量化。

2、在深度學習神經網絡中，激活函數在激發隱藏節點以產生更理想的輸出方面起著重要作用。修正線性單元(rectified?linear?unit,relu)在神經網絡中經常被用于隱層神經元輸出。特別是在邊緣端部署網絡中，relu計算實現簡單，可以高效適配硬件，且稀疏激活性質可以幫助減少神經網絡中的冗余性，使網絡更加高效，因此，relu經常常被用于在邊緣端部署的神經網絡算法中。

3、傳統的邊緣端深度學習神經網絡中，如圖1所示，relu函數與量化模塊是分離的兩步，且每個卷積層后均需部署relu與量化模塊，造成神經網絡結構復雜，運算步驟增多，導致計算效率低。深度學習神經網絡在圖像(如紅外圖像、sar圖像)目標識別領域應用廣泛，圖像處理數據量大，需要更多的算力才能滿足目標識別實時性要求，有必要提供高效的圖像目標識別方法。

技術實現思路

1、為了克服現有技術中的不足，本發明人進行了銳意研究，提供了一種基于深度學習神經網絡模型的圖像目標識別方法，通過對浮點數深度學習神經網絡模型轉換為定點數神經網絡模型，在保證圖像目標識別效率的同時，兼具圖像目標識別高準確性。

2、本發明提供的技術方案如下：

3、第一方面，一種圖像目標識別方法，包括：

4、將圖像集中的圖像輸入訓練后的浮點數深度神經網絡模型，獲取浮點數深度神經網絡模型各隱藏層輸出浮點數的取值范圍；所述浮點數深度神經網絡模型為模型參數使用浮點數格式的深度神經網絡模型，其輸出的數據為浮點數格式；

5、根據浮點數深度神經網絡模型各隱藏層輸出浮點數的取值范圍，結合量化后定點數的目標位寬值，確定每個隱藏層的輸出浮點數與定點數非對稱量化關系式中的參數；

6、

7、z＝-2b-1

8、其中，s表示量化步長，z表示量化零點，b表示量化后定點數的目標位寬值，rmax表示隱藏層輸出的最大浮點數；

9、確定每個隱藏層的輸出浮點數與定點數非對稱量化關系式為：xfloat為浮點數，xint為定點數；

10、在浮點數深度神經網絡模型的各隱藏層后，分別采用各隱藏層對應的輸出浮點數與定點數非對稱量化關系式取代relu函數，獲得定點數神經網絡模型；

11、向定點數神經網絡模型中輸入待測圖像，定點數神經網絡模型中各隱藏層輸出的浮點數轉化為定點數，并完成圖像目標識別。

12、結合第一方面，所述將圖像集中的圖像輸入訓練后的浮點數深度神經網絡模型的步驟中，圖像集中的圖像與待測圖像為同類型圖像。

13、結合第一方面，所述向定點數神經網絡模型中輸入待測圖像，定點數神經網絡模型中各隱藏層輸出的浮點數轉化為定點數的步驟中，包括：

14、仿射變換：

15、取整：x2＝round(x1)，round表示為取整函數

16、截斷：

17、其中x1和x2為中間過程變量。

18、第二方面，一種飛行器端圖像目標識別方法，包括：

19、將圖像集中的圖像輸入服務器端訓練后的浮點數深度神經網絡模型，獲取浮點數深度神經網絡模型各隱藏層輸出浮點數的取值范圍；所述浮點數深度神經網絡模型為模型參數使用浮點數格式的深度神經網絡模型，其輸出的數據為浮點數格式；

20、根據浮點數深度神經網絡模型各隱藏層輸出浮點數的取值范圍，結合量化后定點數的目標位寬值，確定每個隱藏層的輸出浮點數與定點數非對稱量化關系式中的參數；

21、

22、z＝-2b-1

23、其中，s表示量化步長，z表示量化零點，b表示量化后定點數的目標位寬值，rmax表示隱藏層輸出的最大浮點數；

24、確定每個隱藏層的輸出浮點數與定點數非對稱量化關系式為：xfloat為浮點數，xint為定點數；

25、在浮點數深度神經網絡模型的各隱藏層后，分別采用各隱藏層對應的輸出浮點數與定點數非對稱量化關系式取代relu函數，獲得定點數神經網絡模型；

26、在飛行器端配置定點數神經網絡模型，飛行器端將待測圖像輸入定點數神經網絡模型中，定點數神經網絡模型中各隱藏層輸出的浮點數轉化為定點數，并完成圖像目標識別。

27、結合第二方面，所述將圖像集中的圖像輸入服務器端訓練后的浮點數深度神經網絡模型的步驟中，圖像集中的圖像與待測圖像為同類型圖像。

28、結合第二方面，所述飛行器端將待測圖像輸入定點數神經網絡模型中，定點數神經網絡模型中各隱藏層輸出的浮點數轉化為定點數的步驟中，包括：

29、仿射變換：

30、取整：x2＝round(x1)，round表示為取整函數

31、截斷：

32、其中x1和x2為中間過程變量。

33、根據本發明提供的一種基于深度學習神經網絡模型的圖像目標識別方法，具有以下有益效果：

34、(1)本發明提供的一種基于深度學習神經網絡模型的圖像目標識別方法，考慮到深度神經網絡模型各隱藏層后的relu激活函數與量化中截斷公式中下邊界的截斷相似，將浮點數最小值0經過量化的“仿射變換-取整-截斷”步驟后取值為qmin，獲得特定的量化步長和量化零點，進而得到更新后的浮點數與定點數非對稱量化關系式；將更新后的浮點數與定點數非對稱量化關系式取代relu函數，兼具激活函數及量化模塊作用，能夠有效提高傳輸及后續計算的效率；

35、(2)本發明提供的一種基于深度學習神經網絡模型的圖像目標識別方法，本發明通過更新后的浮點數與定點數非對稱量化關系式取代relu函數，將浮點數深度神經網絡模型轉換為定點數神經網絡模型，該定點數神經網絡模型遺傳浮點數深度神經網絡模型的高準確度，在提高圖像目標識別效率的同時，兼具圖像目標識別高準確性。

技術特征：

1.一種圖像目標識別方法，其特征在于，包括：

2.根據權利要求1所述的圖像目標識別方法，其特征在于，所述將圖像集中的圖像輸入訓練后的浮點數深度神經網絡模型的步驟中，圖像集中的圖像與待測圖像為同類型圖像。

3.根據權利要求1所述的圖像目標識別方法，其特征在于，所述向定點數神經網絡模型中輸入待測圖像，定點數神經網絡模型中各隱藏層輸出的浮點數轉化為定點數的步驟中，包括：

4.一種飛行器端圖像目標識別方法，其特征在于，包括：

5.根據權利要求4所述的飛行器端圖像目標識別方法，其特征在于，所述將圖像集中的圖像輸入服務器端訓練后的浮點數深度神經網絡模型的步驟中，圖像集中的圖像與待測圖像為同類型圖像。

6.根據權利要求4所述的飛行器端圖像目標識別方法，其特征在于，所述飛行器端將待測圖像輸入定點數神經網絡模型中，定點數神經網絡模型中各隱藏層輸出的浮點數轉化為定點數的步驟中，包括：

技術總結
本發明提供了一種圖像目標識別方法，包括：將圖像集中的圖像輸入訓練后的浮點數深度神經網絡模型，獲取浮點數深度神經網絡模型各隱藏層輸出浮點數的取值范圍；根據浮點數深度神經網絡模型各隱藏層輸出浮點數的取值范圍，結合量化后定點數的目標位寬值，確定每個隱藏層的輸出浮點數與定點數非對稱量化關系式中的參數；確定每個隱藏層的輸出浮點數與定點數非對稱量化關系式為：在浮點數深度神經網絡模型的各隱藏層后，分別采用各隱藏層對應的輸出浮點數與定點數非對稱量化關系式取代ReLU函數，獲得定點數神經網絡模型；向定點數神經網絡模型中輸入待測圖像，定點數神經網絡模型中各隱藏層輸出的浮點數轉化為定點數，并完成圖像目標識別。

技術研發人員：謝宇嘉,周輝,王曉峰,蓋一帆,趙雄波,李超然,吳松齡,董文杰,弭寒光,王云龍,李然,路坤鋒,李曉敏,靳蕊溪,楊立波,高琪,康旭冰
受保護的技術使用者：北京航天自動控制研究所
技術研發日：
技術公布日：2025/3/10

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：謝宇嘉,周輝,王曉峰,蓋一帆,趙雄波,李超然,吳松齡,董文杰,弭寒光,王云龍,李然,路坤鋒,李曉敏,靳蕊溪,楊立波,高琪,康旭冰
技術所有人：北京航天自動控制研究所
我是此專利的發明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯網安全、大數據安全 2.安全態勢感知、輿情分析和控制 3.區塊鏈及應用
如您是高校老師，可以點此聯系我們加入專家庫。

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！