游戲不僅僅是游戲,更是對未來戰爭的演練,大型戰爭游戲由于具有安全、經濟和可定制等特點,適合作為自主作戰決策技術發展的孵化器。《星際爭霸》游戲對于研究未來作戰自主決策技術有重要參考價值,本文分析了《星際爭霸》戰略、戰術決策算法中面臨的規劃、學習以及不確定性等熱點問題。
討論了未來作戰自主決策技術面臨的瓶頸問題,并提出以打造大型戰爭游戲為手段,從關鍵技術出發,試圖指出未來作戰自主決策技術發展著力點,為自主決策系統的智能化技術開發和研究提供研究思路和理論基礎。
人工智能技術的發展給未來軍事戰爭樣式帶來了革命性影響,無人化、智能化平臺的大量使用,給傳統作戰決策理念帶來了方式創新。
未來作戰自主決策技術是關鍵,“知識”的較量已成為戰爭主角,其本質就是決策算法之間的較量。
在當前階段,各類游戲依然是訓練和驗證智能決策技術的絕佳平臺。不僅因為其對未來戰爭模擬程度非常之高,更重要的是蘊含了當下人工智能在認知決策層面還沒有很好解決的問題,對于未來群體智能研究將具有重要意義。
《星際爭霸》分析
《星際爭霸》是暴風雪游戲公司在1998年開發的一款即時策略性大型戰爭游戲,主要通過在不同的地圖條件下,由多名人類玩家控制3種角色,利用裝備、資源以及士兵數量,以摧毀敵方大量戰爭資源為目的的高強度博弈對抗行為。
《星際爭霸》決策算法
戰略和戰術決策是實時戰略游戲的兩個關鍵方面,優秀的戰略決策能幫助我方部隊采集更多的資源、建立更多的戰斗單位,而良好的戰術決策能幫助我方部隊在小規模戰斗中贏得主動。
1、戰略決策算法
1)基于案例的決策算法
基于案例的決策算法是將當前狀態與歷史案例數據進行比對,找到適合于當前狀態的最優規劃結果,如何降低計算空間的復雜性是主要的研究熱點問題之一。
2)分層規劃決策算法
分層規劃決策方法可以在不同抽象程度下單獨處理子狀態空間的規劃問題,子目標的規劃結果可以從宏觀目標到微觀動作規劃,并能很好地映射到全局規劃結果中,通常與其他方法結合使用,分層任務網絡結構構建是當前研究熱點之一。
3)目標驅動決策算法
目標驅動決策算法是根據智能體的任務目標及周圍環境變化,構建定量變化關系模型,只能通過手動賦值完成系統初始化。發生意外情況時,系統不但可以記錄異常狀態,還能做出反饋調整。
將基于案例規劃法與強化學習結合,可以實現系統目標和領域知識的動態變化,如果領域知識發生變化,系統也會自動適應,但若領域知識過于簡單,該方法的準確性不如目標驅動決策算法。
2、戰術決策算法
1)典型戰術決策算法
典型的戰術決策算法研究對象可以分為己方和敵方兩方面。其中敵方研究較少,僅以經濟狀況建模方法以及對手策略預測為主,而己方研究成果較為豐富,涵蓋了協同編隊控制、協同攻擊決策、整體對抗策略生成以及智能體快速運動控制等方面。
編隊控制結構示意
當前對敵方的研究較少,主要集中在對敵方經濟狀況預測以及敵方策略預測兩方面。
對于時間維度,研究重點逐步從己方的決策控制問題向敵方策略預測過渡;從研究對象上,小規模同構智能體向大規模異構智能體過渡。對于混合異構智能體、大規模場景,特別是對不完全信息條件下的自主決策研究較少。
2)建造順序預測算法
建造順序是決定戰爭成敗的核心因素,與己方經濟發展速度、應對敵方戰術襲擾密切相關,包括建筑物種類、建造數量以及建造位置三個方面,從研究方法上可以分為利用比賽錄像和算法開發。
可以使用比賽錄像來預測對手,并決定實際比賽中的我方建造順序,結果顯示該方法能夠準確預測對手策略。
3)反應控制決策算法
反應控制是指利用不同算法對作戰單元實現移動、攻擊、偵察、撤退功能,在算法層面,主要有基因算法、蒙特卡羅算法、勢流法、貝葉斯法和強化學習。
在作戰單元移動方面,根據敵方目標的數量和類型,可使用勢流法實現對作戰單元的編隊控制。
在作戰單元攻擊方面,可簡化為多目標連續優化問題,構建仿真作戰單元環境,使用基因算法控制作戰單元實現最大化攻擊和最小化傷害,依據環境條件選擇合適的動作行為。
強化學習技術可使作戰單元能夠根據敵方的行為做出相應決策,研究發現作戰單元能夠在不同的游戲階段做出最佳決策,但該方法僅適合特定場景下的決策。
在偵察方面,根據敵方目標的數量和類型,使用勢流法對作戰單元進行編隊控制。
未來戰爭制智權的奪取,決策算法是關鍵。《星際爭霸》與實際作戰過程比較接近,是未來戰爭決策算法的孵化器。
通過分析對《星際爭霸》算法研究,對于搞清多智能體博弈對抗決策機理,以及未來作戰自主決策具有重要意義。然而,除去算法本身之外,未來作戰自主決策技術的落地應用,仍然面臨一些挑戰。
未來作戰自主決策技術面臨的挑戰
未來作戰自主決策技術AI 復雜度分析
AI算法模型對樣本數量和復雜度具有強烈的依賴性,學習對象越復雜,對樣本數量要求也越高,如果要考慮攻擊類型、能源以及科技研發等因素,那么復雜度會更高。
與《星際爭霸》相比,真實戰場的復雜度要高出多個數量級:作戰單元種類和數量更多;作戰單元行為控制更加復雜,作戰單元往往需要設定大量的控制參數完成;作戰域更加復雜,真實作戰域已擴展為海、陸、空、天、網、電磁以及意識域;評價標準更為復雜。
未來作戰自主決策技術可以嘗試“分布式解決”模式,分解為具體的子問題,針對每個子問題運用對抗網絡、模仿學習以及元學習等手段進行策略求解,最后將各個子策略進行集成。
未來作戰自主決策技術瓶頸問題
1)缺乏足夠的領域知識和樣本數據
戰場樣本數據通常是指在實際作戰、演習訓練以及仿真過程中,產生的情報、通信以及作業數據等,需要清洗加工和標注標簽等工序才能夠用在學習模型中。樣本質量包括數據本身的好壞及數據標簽的準確性。
當前自動化標注方法面對戰場紛繁復雜的態勢信息靈活性不強,且數據的產生主要依靠演習訓練和仿真試驗,戰術對抗激烈程度和靈活程度以及裝備使用程度均不如實戰。
2)缺乏科學的驗證評價技術手段
模型通常需要使用大量的數據,但現階段無法實現將模型放在實際戰場中去測試。目前針對未來作戰自主決策技術的效果驗證,缺乏統一的量化指標和標準,即便面對實際場景,也很難有統一的量化衡量標準。
3)缺少多學科融合人才
在未來作戰自主決策技術場景下,精通軍事作戰理論、熟悉裝備性能、明確交戰規則的領域專家,與掌握機器學習模型算法、強化學習訓練技巧、深度學習網絡構建經驗的AI技術專家相結合,才能找到切入點和發力點,真正發揮未來作戰自主決策技術效能。
基于大型戰爭游戲的
未來作戰自主決策技術發展著力點
本質上,未來作戰自主決策技術的瓶頸問題是“人”和“物”的矛盾關系。缺乏軍事決策技術領域與人工智能算法跨領域專家,這個“人”,以及可以有效訓練學習模型數據,這個“物”。
未來作戰自主決策技術智能系統架構
未來作戰自主決策技術智能系統架構主要由未來作戰自主決策技術智能系統和作戰單元兩部分構成,兩者相互配合、相互協同,前者發出決策指令,后者執行并將執行效果進行反饋。
未來作戰自主決策技術架構
未來作戰自主決策系統基本運行原理是通過對復雜戰場環境進行建模,將戰場資源虛擬化,構建虛擬-現實的實時映射關系。
根據戰場實際態勢,并基于構建的虛擬化戰場模型,得到適合于當前戰場情況下有利于我方的作戰決策行為,其中虛擬資源構建的真實程度直接決定了智能AI模型的計算準確程度。
未來作戰自主決策技術大型戰爭游戲AI虛擬建模技術
當前諸多大型戰爭游戲建模技術已較為成熟,具備精細化建模的能力,但與實戰應用還有相當距離:缺乏包含作戰規則、裁決模型等決定實際戰爭效果的軍事應用規則模型的嵌入;缺乏仿真模型與實際戰場環境的交互能力。
從擔負的任務和規模看,可將未來作戰自主決策技術分為戰術級、戰區級、戰略級3個層次。
可從戰術級入手,在當前游戲建模技術基礎上,從作戰概念模型和推演模型體系兩方面搭建適合于仿真推演的虛擬模型。
未來作戰自主決策技術大型戰爭游戲推演引擎技術
對于戰爭游戲引擎而言,更重要的是應從設計理念、引擎模式、應用方式3方面進行技術研發。
設計理念是指一款戰爭游戲涵蓋不了戰爭的方方面面,要求以聚焦作戰概念為核心,針對當前引擎架構設計基本方法,突出顯示需要修改開發的地方,支持作戰概念,設計開發戰爭游戲引擎。
引擎模式可以分為人在回路和人不在回路兩種,前者是指作戰人員可以指揮各個單元以及戰場態勢,在線實時修改游戲模型,后者指整個游戲推演過程完全由AI模型自主完成。
應用方式是指戰爭游戲引擎可以支持調試運行模式,根據指戰員訓練、推演以及實戰需要,根據戰場全局的某個片段、某個子任務進行重復調用、重復訓練指揮。
未來作戰自主決策技術大型戰爭游戲推演引擎技術邏輯框架
結論
《星際爭霸》游戲是決策技術應用的一個重要領域,是算法開發、模型驗證的重要平臺,與真實戰場的復雜性和多變性相比,《星際爭霸》直接應用于作戰自主決策仍然有較大差距。但其具有高實時性、戰爭迷霧、狀態和動作空間巨大等特點,在戰場數據生成機理、戰略戰術算法開發和驗證方面,能夠為作戰自主決策提供理論指導和技術支撐。
并且博弈論將作為未來作戰自主決策技術的理論牽引,模仿學習、遷移學習以及增量學習的探索,都會給該領域帶來新的研究思路。
本文作者:黃彬城,陳思,高放,葛建軍,吳雪玲
作者簡介:黃彬城,中國電子科技集團公司認知與智能技術重點實驗室、中國電子科技集團公司信息科學研究院,工程師,研究方向為群體智能、多智能體決策。
論文全文發表于《科技導報》2021年第5期,題目為《星際爭霸視角的未來作戰自主決策技術》,本文有刪減
1、本文只代表作者個人觀點,不代表本站觀點,僅供大家學習參考;
2、本站屬于非營利性網站,如涉及版權和名譽問題,請及時與本站聯系,我們將及時做相應處理;
3、歡迎各位網友光臨閱覽,文明上網,依法守規,IP可查。
作者 相關信息
內容 相關信息
是游戲更是對未來戰爭的演練,從《星際爭霸》看未來自主作戰決策技術
2021-05-15? 昆侖專題 ?
? 高端精神 ?
? 新征程 新任務 新前景 ?
? 習近平治國理政 理論與實踐 ?
? 我為中國夢獻一策 ?
? 國資國企改革 ?
? 雄安新區建設 ?
? 黨要管黨 從嚴治黨 ?
圖片新聞