本公開涉及醫療大數據,具體而言,涉及一種基于分布式的多中心數據處理方法、基于分布式的多中心數據處理裝置、計算機可讀存儲介質以及電子設備。
背景技術:
1、在醫療領域,針對一些疾病需要進行跨醫院的多中心科研合作,從而利用不同醫院的患者,進行某一科研項目,從而避免單家醫院患者數量不足,無法達到可研究水平的問題。
2、相關技術中,可以通過集中式架構或者是分布式架構來獲取醫療數據。集中式架構指的是將所有醫院的數據從醫院中拉出,集中到一個服務器集群中進行科研使用;分布式架構指的是利用聯邦學習和隱私計算技術,在數據不出醫院的前提下,獲取到研究分析結果。
3、上述方式中,集中式架構會存在較高的數據安全風險,分布式架構可能存在數據缺失,具有一定的局限性,覆蓋范圍不全面,準確性較低。
4、需要說明的是,在上述背景技術部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
技術實現思路
1、本公開的目的在于提供一種基于分布式的多中心數據處理方法及裝置、存儲介質、電子設備,進而至少在一定程度上克服由于相關技術的限制和缺陷而導致的數據處理準確性較差的問題。
2、本公開的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本公開的實踐而習得。
3、根據本公開的第一方面,提供一種基于分布式的多中心數據處理方法,包括:通過第一類型中心確定待處理項目的指標參數,生成數據合約并對所述數據合約添加數字簽名,將數據合約以及所述數字簽名同步到至少一個第二類型中心;響應于各第二類型中心將所述數據合約的審核結果同步至第一類型中心,第一類型中心生成針對于所述指標參數的項目抽取任務,并將所述項目抽取任務下發至各所述第二類型中心;各第二類型中心根據所述項目抽取任務,抽取各第二類型中心對應的數據,并將所述各第二類型中心對應的數據加密傳輸至所述第一類型中心;通過第一類型中心對各第二類型中心對應的數據進行分析,以得到待處理項目的項目結果。
4、在本公開的一種示例性實施例中,所述對所述數據合約添加數字簽名,包括:通過所述第一類型中心持有的非對稱密鑰,對所述數據合約對應的摘要進行加密得到所述數字簽名,并將所述數字簽名添加至所述數據合約。
5、在本公開的一種示例性實施例中,所述各第二類型中心將對所述數據合約的審核結果同步至第一類型中心,包括:各第二類型中心響應于合約通知審核請求,通過各所述第二類型中心持有的公鑰,對所述數據合約的內容進行校驗,以確定校驗結果;在所述校驗結果為校驗通過的情況下,響應于操作者在交互頁面上的確認操作確定審核結果,并將所述審核結果同步至所述第一類型中心。
6、在本公開的一種示例性實施例中,所述通過各所述第二類型中心持有的公鑰,對所述數據合約的內容進行校驗,以確定校驗結果,包括:各第二類型中心使用哈希函數基于所述數據合約生成摘要,并根據公鑰對所述數字簽名進行解密得到摘要;對基于數據合約得到的摘要以及根據數字簽名解密得到的摘要進行對比,并根據對比結果確定所述數據合約的內容是否被篡改,以確定校驗結果。
7、在本公開的一種示例性實施例中,所述各第二類型中心根據所述項目抽取任務,抽取各第二類型中心對應的數據,包括:各所述第二類型中心,從各第二類型中心對應的數據庫中,確定目標對象;對所述目標對象按照所述項目抽取任務中的指標參數進行數據抽取,得到各第二類型中心對應的數據。
8、在本公開的一種示例性實施例中,所述將所述各第二類型中心對應的數據加密傳輸至所述第一類型中心,包括:將所述第二類型中心對應的數據進行脫敏處理,并對脫敏后的數據,通過使用公鑰加密的密鑰對脫敏數據進行加密傳輸,以上報至所述第一類型中心。
9、在本公開的一種示例性實施例中,在將所述各第二類型中心對應的數據加密傳輸至所述第一類型中心之后,所述方法還包括:根據所述第一類型中心持有的私鑰對使用公鑰加密的密鑰進行解密,得到對所述脫敏數據進行加密的密鑰;基于所述密鑰對所述脫敏數據進行解密,以得到各第二類型中心對應的數據。
10、根據本公開的第二方面,提供一種基于分布式的多中心數據處理裝置,包括:數據合約同步模塊,用于通過第一類型中心確定待處理項目的指標參數,生成數據合約并對所述數據合約添加數字簽名,將數據合約以及所述數字簽名同步到至少一個第二類型中心;任務生成模塊,用于各第二類型中心將所述數據合約的審核結果同步至第一類型中心,第一類型中心生成針對于所述指標參數的項目抽取任務,并將所述項目抽取任務下發至各所述第二類型中心;數據抽取模塊,用于各第二類型中心根據所述項目抽取任務,抽取各第二類型中心對應的數據,并將所述各第二類型中心對應的數據加密傳輸至所述第一類型中心;項目處理模塊,用于通過第一類型中心對各第二類型中心對應的數據進行分析,以得到待處理項目的項目結果。
11、根據本公開的第三方面,提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現上述任意一項所述的基于分布式的多中心數據處理方法。
12、根據本公開的第四方面,提供一種電子設備,包括:處理器;以及存儲器,用于存儲所述處理器的可執行指令;其中,所述處理器被配置為經由執行所述可執行指令來執行上述任意一項所述的基于分布式的多中心數據處理方法。
13、本公開實施例中提供的基于分布式的多中心數據處理方法、基于分布式的多中心數據處理裝置、計算機可讀存儲介質以及電子設備中,一方面,通過第一類型中心將數據合約添加數字簽名保證數據合約的安全性,并將數據合約同步到至少一個第二類型中心,進而在審核結果的基礎上,從每個第二類型中心中獲取指標參數對應的數據,由于只需要將第二類型中心中滿足待處理項目的指標參數的部分參數加密抽取至第一類型中心,避免相關技術中對第二類型中心的所有數據進行抽取時存在的數據安全風險較大的問題,提高了數據安全性,增加了可操作性。另一方面,由于能夠將各個第二類型中心的數據加密傳輸至第一類型中心,實現了多個第二類型中心的數據之間的互通,避免了相關技術中只能根據每個第二類型中心內部的數據進行處理的局限性以及存在原始數據缺失的問題,能夠避免影響對分析結果進行驗證,提高了醫療數據的完整性,增加了應用范圍,且提高了待處理項目的分析結果的準確率,能夠保證待處理項目的推進。
14、應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本公開。
1.一種基于分布式的多中心數據處理方法,其特征在于,包括:
2.根據權利要求1所述的基于分布式的多中心數據處理方法,其特征在于,所述對所述數據合約添加數字簽名,包括:
3.根據權利要求1所述的基于分布式的多中心數據處理方法,其特征在于,所述各第二類型中心將對所述數據合約的審核結果同步至第一類型中心,包括:
4.根據權利要求3所述的基于分布式的多中心數據處理方法,其特征在于,所述通過各所述第二類型中心持有的公鑰,對所述數據合約的內容進行校驗,以確定校驗結果,包括:
5.根據權利要求1所述的基于分布式的多中心數據處理方法,其特征在于,所述各第二類型中心根據所述項目抽取任務,抽取各第二類型中心對應的數據,包括:
6.根據權利要求1所述的基于分布式的多中心數據處理方法,其特征在于,所述將所述各第二類型中心對應的數據加密傳輸至所述第一類型中心,包括:
7.根據權利要求6所述的基于分布式的多中心數據處理方法,其特征在于,在將所述各第二類型中心對應的數據加密傳輸至所述第一類型中心之后,所述方法還包括:
8.一種基于分布式的多中心數據處理裝置,其特征在于,包括:
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1-7任意一項所述的基于分布式的多中心數據處理方法。
10.一種電子設備,其特征在于,包括: