摘要:本發明提供了一種大規模異構并行計算的容錯方法,包括:對每個時間步的每個核心計算模塊,進行以下處理:將計算課題的計算數組的內容賦值給備份數組;完成核心計算模塊的計算;其中,完成核心計算模塊的計算包括:統計可用處理器核數,以獲得第一處理器核數;可用處理器核并行運算核心計算模塊;再次統計可用處理器核數,以獲得第二處理器核數;比較第一處理器核數和第二處理器核數,若第二處理器核數小于第一處理器核數,則將備份數組的內容賦值給計算數組,并重新完成核心計算模塊的計算,直至第一處理器核數與第二處理器核數一致。本發明的大規模異構并行計算容錯方法能充分利用計算資源,減少故障恢復時間,提高并行計算的可靠性。
- 專利類型發明專利
- 申請人無錫江南計算技術研究所;
- 發明人陳德訓;劉鑫;李芳;徐金秀;
- 地址214083 江蘇省無錫市濱湖區軍東新村030號
- 申請號CN201210442295.9
- 申請時間2012年11月06日
- 申請公布號CN102929738A
- 申請公布時間2013年02月13日
- 分類號G06F11/07(2006.01)I;