摘要:語音竊聽技術一直受到國內外學者的廣泛關注,尤其是在安全、情報和隱私領域。近年來許多研究表明,利用無線通信技術,我們可以竊聽到目標區域內的聲音,而不需要直接接觸目標設備。本文將重點介紹利用Wi-Fi、RFID、UWB以及毫米波技術實現語音竊聽的原理和應用。
一
無線信號實現語音竊聽的原理
眾所周知,聲音和振動之間存在著密切的聯系。當物體振動時,物體周圍的空氣也隨之振動,從而產生聲音。例如,傳統的傳感器,如麥克風、揚聲器等,通過振膜振動實現聲音和電信號之間的轉換。現有的研究已經證實,通過感知聲源或聲源附近物體的振動也可以從中恢復聲音。例如,激光竊聽[1]通過激光器發射一束激光照射在目標物體(如窗戶玻璃)上,能夠實現非接觸式、遠距離、高靈敏度的監聽。激光竊聽技術通常受視距條件限制,且一次只能監測一個目標。無線信號因其在自由空間的傳播特性,能夠很好地避免這種缺陷。無線信號感知聲音的原理其實就是感知這種聲振動。當聲源發聲時,聲源及其附近的物體會產生微小振動,無線信號在接觸這些物體表面時會發生反射,反射回的信號中攜帶聲振動特征,通過使用信號處理算法和機器學習技術能夠從無線信號中恢復高質量語音信息。
二
實際應用技術案例
2.1 Wi-Fi實現語音竊聽Wi-Fi技術廣泛應用于無線網絡通信,Wi-Fi路由器發射的信號可以穿透墻壁,覆蓋較大的區域。利用Wi-Fi信號的微小變化,我們可以通過分析信號的強度(RSSI)和相位來還原目標區域內的聲音。威斯康星大學麥迪遜分校研究團隊提出了一種新的無線振動監測技術,它可以利用Wi-Fi信號來偵聽揚聲器產生的聲音,甚至能夠穿透隔音墻這類障礙物[2]。傳統的聲音采集方法需要將收音設備,如麥克風,放置在聲源附近,而此類技術則不需要,其工作原理是:聲音驅動揚聲器產生微小振動,這會引起射頻信號強度(RSSI)和相位發生輕微變化;該團隊提出一種音頻-射頻轉換(Acoustic-Radio Transformation,ART)算法,能夠從這些變化中提取并還原出原始的音頻信號。為了提高監測效率和質量,論文提出采用空間信號多樣性技術,例如多天線盲定向和頻率選擇,來提高算法的檢測效率。論文通過理論模型和測試結果,對語音監聽各個方面進行深入研究。例如,它區分了利用Wi-Fi信號發射和反射兩種不同的監聽模式,后者產生的威脅更為嚴重。論文通過系列實驗檢驗了不同影響因素,結果表明該技術可以在5米以外,甚至通過隔音墻成功恢復高質量語音信息。這種技術的突破性應用為非法監聽活動提供了新的攻擊面,極大威脅私人通信的安全性。
圖1 利用Wi-Fi信號突破隔音墻實現語音竊聽
2.2 RFID實現語音竊聽隨著無線傳感技術在物聯網時代的廣泛應用,RFID技術作為一種重要的無線傳感方式,也得到了長足發展。現有研究顯示,RFID技術具有體積小、成本低和易于部署等優點,已經在語音感知方向取得重大突破。TagMic[3]首次提出利用RFID技術實現隱蔽監聽的新概念。當聲波撞擊物體引起的振動,會對附著在物體表面上的標簽的反向散射信號造成影響,進而可以恢復聲音。盡管RFID讀寫器的采樣率較低,標簽上的振動幅度也很微小,通過MFCC、STFT等信號處理算法以及機器學習方法能夠克服環境噪聲和低采樣率的影響,從RFID測量數據中提取有效特征。初步實驗結果表明,TagMic能夠實現93.1%的單詞識別準確率,說明RFID技術在安全方面可能存在隱患。
圖2 TagMic首次揭示使用RFID能夠實現語音竊聽
上海交通大學俞嘉地等人提出了一種名為RF-Mic的實時語音監聽系統[4]。該系統通過在常見眼鏡鏡框上粘貼RFID標簽來感知用戶說話時的細微面部語音動態,從而推斷可能的語音內容。論文首先提出了RFID信號感知人臉語音動態的傳播模型。然后通過實驗發現RFID信號可以感知三種類型的語音動態特征,及面部運動特征、骨傳導振動特征以及空氣傳導振動特征。并提出利用不同深度學習模型分別提取這三種語音動態特征,并使用自注意力機制進行特征融合。此外,他們還提出了條件去噪自動編碼網絡去除人體運動干擾,以及對抗學習網絡去除用戶相關特征,實現魯棒的語音監聽。實驗結果表明,在不同環境下,該系統可以實現88%以上的單詞識別準確率和句子識別準確率。
圖3 RF-Mic系統實現
南京大學王楚豫等人利用RFID標簽實現了穿墻竊聽[5]。他們使用諸如包裹、水瓶以及衣服等日常物品上粘貼的RFID標簽對揚聲器播放的聲音進行感知。攻擊者可以暗置標簽在揚聲器附近,并使用商用讀寫器對標簽進行信號讀取。他們分析了RFID信號在傳輸過程中的變化規律。在音波的影響下,標簽或附近的物體會產生及其微小的振動,這會導致標簽反向散射信號的相位發生變化。研究團隊提出利用這一特點,設計了一種新的信號變化特征——調制信號差(Modulated Signal Difference,MSD),來放大振動信息并提取聲音特征。為了解決RFID系統中由于讀寫器發送周期性命令的干擾,提出了隨機化標簽響應的方法。同時,為了提升從射頻信號中提取的人聲質量,利用條件生成對抗網絡對低頻帶人聲進行擴充,重建全頻帶聲譜。實驗結果表明,在1-4米距離下,利用提出的方法可以成功提取單音聲音,信噪比達4dB以上。對數字和字母進行識別,在視距條件下實現竊聽準確率分別為95.3%和87%;在非視距條件下(20毫米厚磚墻或29毫米厚隔聲玻璃)也能實現85%以上識別準確率。
圖4 RFID實現穿墻竊聽
2.3 UWB實現語音竊聽UWHear[6]利用射頻信號和超寬帶脈沖雷達技術直接從聲源振動中提取音頻信息,實現了室內多聲源同時監測功能。這與傳統使用麥克風的方法不同,如圖5所示,后者獲得的聲音信號呈混合狀態,難以清晰地區分各聲源。UWHear使用脈沖射頻超寬帶(IR-UWB)技術。IR-UWB具有脈沖短、帶寬窄的特點,能提供很高的距離分辨率。系統每發射出一個脈沖都會獲得回波,從而構成一個二維框圖,其中快時間軸代表目標距離,慢時間軸代表采樣時序。研究人員通過理論推導證明,當聲源產生振動時,其會造成IR-UWB信號和聲源之間傳播時間的細微變化。這會反映在I/O數據實部或虛部振幅的變化上,系統能根據這一依據來恢復聲音信號。通過大量實驗證明,系統能在8米范圍內清晰監測聲源,也可實現隔墻監聽,不同聲源之間的距離最短間隔為25厘米。總的來說,該項工作首次提出從UWB信號中獲取聲音的新方式,通過嚴謹的理論支持和實驗驗證了系統在復雜條件下多聲源監測的潛力,為聲事件檢測及其應用帶來了新的思路,值得進一步優化和開拓應用前景。
圖5 利用UWB實現語音竊聽
2.4 MM-Wave實現語音竊聽當人說話時,發聲器官會帶動周圍空氣振動,產生聲音脈沖。此外,其他組織,如舌頭、顎骨等還會加工這些聲音脈沖,形成豐富的語音信息。毫米波因其工作頻段高,可以感知微米級振動幅度。WaveEar[7]是一種利用毫米波進行噪音消除的語音識別系統。通過采集近喉部振動信號,提取其中的語音信息。利用深度學習技術實現噪音環境下的語音識別。這為語音用戶交互應用在復雜場景下提供了一種新的解決方案。羅格斯大學研究團隊研究了一種新的通過毫米波輻射來竊聽人聲的遠程手段[8]。研究指出,人聲產生的振動可以通過周圍物體表面產生微小的位移,這些位移可以被毫米波傳感器捕獲。研究人員設計了一種軟件定義的相位陣列毫米波雷達來增強人聲產生的微小振動的信號強度,使得從遠距離和墻壁后面也可以成功捕獲這類振動信息。
圖6 利用毫米波實現語音竊聽
三
總結
本文從理論和實踐兩個層面研究了利用各種無線通信技術實現語音竊聽的原理和方法。從物理原理上介紹,聲音產生的振動可以通過無線信號在空間中的傳播帶來細微變化,這為語音信息的還原和提取提供了可能。而實際案例則給出了利用Wi-Fi、RFID、UWB以及毫米波技術實際實現語音竊聽的多種技術方案,詳細說明了系統設置、信號處理算法設計及實驗效果。這些研究充分驗證了無線信號在流動的屬性,可以獲取遠距離和隱蔽的語音信息,給用戶隱私和信息安全帶來新的威脅。但同時也為聲識別、人機交互等應用開拓了新思路。
作者:白廣軒 ;來源:中國保密協會科學技術分會微信號
1、本文只代表作者個人觀點,不代表本站觀點,僅供大家學習參考;
2、本站屬于非營利性網站,如涉及版權和名譽問題,請及時與本站聯系,我們將及時做相應處理;
3、歡迎各位網友光臨閱覽,文明上網,依法守規,IP可查。
作者 相關信息
內容 相關信息
? 昆侖專題 ?
? 高端精神 ?
? 新征程 新任務 新前景 ?
? 習近平治國理政 理論與實踐 ?
? 國策建言 ?
? 國資國企改革 ?
? 雄安新區建設 ?
? 黨要管黨 從嚴治黨 ?