近日,第九屆國際權威聲學場景和事件檢測及分類競賽(Detection and Classification of Acoustic Scenes and Events, DCASE 2023)在其官方網站上公布了比賽結果。西北工業大學航海學院-迅聲環境聲音感知聯合實驗室(JLESS)算法團隊在競賽任務4B(基于軟標簽的聲音事件檢測)中獲得國際第一名的好成績!這也是學校首次獲得該比賽項目第一名。
團隊在任務4B中獲第一名
本次比賽由西工大航海學院-迅聲環境聲音感知聯合實驗室主任陳建峰教授指導,博士研究生白吉生、賈亞飛、張董哲,碩士研究生尹涵、黃思維、杜雨桐參與。此外,團隊還在任務2(無監督機器異常聲音檢測)中獲得國際第五名的成績;在任務3(聲音事件檢測和定位)中獲得國際第六名的成績。
DCASE競賽由電氣和電子工程師協會(IEEE)聲學信號處理技術委員會(AASP)組織,該比賽是音頻場景和事件識別領域的權威競賽。本次競賽涵蓋了智能音頻信號處理領域內七項任務,包括聲音場景分類、異常聲音檢測、聲音事件檢測及定位、聲音事件檢測、生物事件檢測、音頻字幕及檢索以及擬音合成。
此次競賽吸引了來自世界各地眾多頂尖聲學研究機構和企業共123支隊伍積極參與。涵蓋了清華大學、中國科學技術大學、中國科學院大學、新加坡南洋理工大學、英國薩里大學、美國佐治亞理工學院、卡內基·梅隆大學等多所頂尖高校,同時還包括了業界的佼佼者,如谷歌、META、三星、騰訊、科大訊飛等大型企業。
接下來,讓我們一起了解下本次獲獎的三項任務。
任務4B:基于軟標簽的聲音事件檢測
聲音事件檢測是指從復雜的聲學環境中自動識別和分類特定的聲音事件,并給出這些事件實例的時間定位。團隊成員提出使用帶有注意力和信息交互機制的掩碼雙分支模型結構,在不使用任何外部數據和預訓練模型的情況下,團隊提交的4個系統取得了前四名的優異成績,并在主要指標F1MO分數上遠超第五名8.71%。
任務4B示意圖
任務2:無監督機器異常聲音檢測
機器異常聲音檢測是人工智能領域的重要發展方向。本次任務的難點是訓練和測試的機器類型完全不同。針對這一問題,團隊成員提出基于機器工作條件的數據生成技術進行無監督異常聲音檢測,在不使用模型集成和預訓練模型的情況下,取得了國際第五名的好成績。
任務2示意圖
任務3:聲音事件檢測和定位
聲音事件檢測和定位任務的難點是需要對重疊率較高的聲音事件及聲源來波方向進行估計,繁雜的任務目標對模型參數量和帶標記數據量提出了更高要求。針對上述難點,團隊使用了基于CNN和Conformer的網絡結構,結合空間數據增強方法,最終獲得了國際第六名的好成績。
任務3示意圖
據悉,西工大航海學院-迅聲環境聲音感知聯合實驗室(JLESS)成立于2021年9月。實驗室算法團隊成員已連續6年參與DCASE挑戰賽,在歷屆比賽中多次斬獲前三甲,用實力彰顯了團隊在智能音頻技術領域的巨大優勢。團隊還致力于促進智能音頻算法在實際場景中的落地應用,研發的相關空氣聲吶產品已成功應用于違法鳴笛抓拍、工業設備異常聲音診斷等安防、電力、石化及煤炭多個領域。此前,在第七屆中國國際“互聯網+”大學生創新創業大賽中,團隊的“機器聽覺——智能空氣聲吶系統”獲得總決賽金獎;在2023年中俄工業創新大賽中國賽區決賽中,團隊的“智能空氣聲吶聲音監測系統”獲得中國賽區決賽一等獎。(白吉生 尹涵 白婧熠)