久久99国产精品尤物-国产高清色播视频免费看-男生肌肌往女人桶爽视频-精品国产-91PORNY九色|www.jqdstudio.net

|  站內(nèi)搜索:
是游戲更是對未來戰(zhàn)爭的演練,從《星際爭霸》看未來自主作戰(zhàn)決策技術(shù)
點(diǎn)擊:  作者:黃彬城,陳思等    來源:科技導(dǎo)報 微信號  發(fā)布時間:2021-05-15 11:27:22

 

 

游戲不僅僅是游戲,更是對未來戰(zhàn)爭的演練,大型戰(zhàn)爭游戲由于具有安全、經(jīng)濟(jì)和可定制等特點(diǎn),適合作為自主作戰(zhàn)決策技術(shù)發(fā)展的孵化器?!缎请H爭霸》游戲?qū)τ谘芯课磥碜鲬?zhàn)自主決策技術(shù)有重要參考價值,本文分析了《星際爭霸》戰(zhàn)略、戰(zhàn)術(shù)決策算法中面臨的規(guī)劃、學(xué)習(xí)以及不確定性等熱點(diǎn)問題。

 

討論了未來作戰(zhàn)自主決策技術(shù)面臨的瓶頸問題,并提出以打造大型戰(zhàn)爭游戲?yàn)槭侄?,從關(guān)鍵技術(shù)出發(fā),試圖指出未來作戰(zhàn)自主決策技術(shù)發(fā)展著力點(diǎn),為自主決策系統(tǒng)的智能化技術(shù)開發(fā)和研究提供研究思路和理論基礎(chǔ)。

 

人工智能技術(shù)的發(fā)展給未來軍事戰(zhàn)爭樣式帶來了革命性影響,無人化、智能化平臺的大量使用,給傳統(tǒng)作戰(zhàn)決策理念帶來了方式創(chuàng)新。

 

未來作戰(zhàn)自主決策技術(shù)是關(guān)鍵,知識的較量已成為戰(zhàn)爭主角,其本質(zhì)就是決策算法之間的較量。

 

在當(dāng)前階段,各類游戲依然是訓(xùn)練和驗(yàn)證智能決策技術(shù)的絕佳平臺。不僅因?yàn)槠鋵ξ磥響?zhàn)爭模擬程度非常之高,更重要的是蘊(yùn)含了當(dāng)下人工智能在認(rèn)知決策層面還沒有很好解決的問題,對于未來群體智能研究將具有重要意義。

 

《星際爭霸》分析

 

《星際爭霸》是暴風(fēng)雪游戲公司在1998年開發(fā)的一款即時策略性大型戰(zhàn)爭游戲,主要通過在不同的地圖條件下,由多名人類玩家控制3種角色,利用裝備、資源以及士兵數(shù)量,以摧毀敵方大量戰(zhàn)爭資源為目的的高強(qiáng)度博弈對抗行為。

 

《星際爭霸》決策算法

 

戰(zhàn)略戰(zhàn)術(shù)決策是實(shí)時戰(zhàn)略游戲的兩個關(guān)鍵方面,優(yōu)秀的戰(zhàn)略決策能幫助我方部隊(duì)采集更多的資源、建立更多的戰(zhàn)斗單位,而良好的戰(zhàn)術(shù)決策能幫助我方部隊(duì)在小規(guī)模戰(zhàn)斗中贏得主動。

 

1、戰(zhàn)略決策算法

 

1)基于案例的決策算法

 

基于案例的決策算法將當(dāng)前狀態(tài)與歷史案例數(shù)據(jù)進(jìn)行比對,找到適合于當(dāng)前狀態(tài)的最優(yōu)規(guī)劃結(jié)果,如何降低計算空間的復(fù)雜性是主要的研究熱點(diǎn)問題之一。

 

2)分層規(guī)劃決策算法

 

分層規(guī)劃決策方法可以在不同抽象程度下單獨(dú)處理子狀態(tài)空間的規(guī)劃問題,子目標(biāo)的規(guī)劃結(jié)果可以從宏觀目標(biāo)到微觀動作規(guī)劃,并能很好地映射到全局規(guī)劃結(jié)果中,通常與其他方法結(jié)合使用,分層任務(wù)網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建是當(dāng)前研究熱點(diǎn)之一。

 

3)目標(biāo)驅(qū)動決策算法

 

目標(biāo)驅(qū)動決策算法是根據(jù)智能體的任務(wù)目標(biāo)及周圍環(huán)境變化,構(gòu)建定量變化關(guān)系模型,只能通過手動賦值完成系統(tǒng)初始化。發(fā)生意外情況時,系統(tǒng)不但可以記錄異常狀態(tài),還能做出反饋調(diào)整。

 

將基于案例規(guī)劃法與強(qiáng)化學(xué)習(xí)結(jié)合,可以實(shí)現(xiàn)系統(tǒng)目標(biāo)和領(lǐng)域知識的動態(tài)變化,如果領(lǐng)域知識發(fā)生變化,系統(tǒng)也會自動適應(yīng),但若領(lǐng)域知識過于簡單,該方法的準(zhǔn)確性不如目標(biāo)驅(qū)動決策算法

 

2、戰(zhàn)術(shù)決策算法

 

1)典型戰(zhàn)術(shù)決策算法

 

典型的戰(zhàn)術(shù)決策算法研究對象可以分為己方和敵方兩方面。其中敵方研究較少,僅以經(jīng)濟(jì)狀況建模方法以及對手策略預(yù)測為主,而己方研究成果較為豐富,涵蓋了協(xié)同編隊(duì)控制、協(xié)同攻擊決策、整體對抗策略生成以及智能體快速運(yùn)動控制等方面。

 

 

編隊(duì)控制結(jié)構(gòu)示意

 

當(dāng)前對敵方的研究較少,主要集中在對敵方經(jīng)濟(jì)狀況預(yù)測以及敵方策略預(yù)測兩方面

 

對于時間維度,研究重點(diǎn)逐步從己方的決策控制問題向敵方策略預(yù)測過渡;從研究對象上,小規(guī)模同構(gòu)智能體向大規(guī)模異構(gòu)智能體過渡。對于混合異構(gòu)智能體、大規(guī)模場景,特別是對不完全信息條件下的自主決策研究較少。

 

2)建造順序預(yù)測算法

 

建造順序是決定戰(zhàn)爭成敗的核心因素,與己方經(jīng)濟(jì)發(fā)展速度、應(yīng)對敵方戰(zhàn)術(shù)襲擾密切相關(guān),包括建筑物種類、建造數(shù)量以及建造位置三個方面,從研究方法上可以分為利用比賽錄像和算法開發(fā)

 

可以使用比賽錄像來預(yù)測對手,并決定實(shí)際比賽中的我方建造順序,結(jié)果顯示該方法能夠準(zhǔn)確預(yù)測對手策略。

 

3)反應(yīng)控制決策算法

 

反應(yīng)控制是指利用不同算法對作戰(zhàn)單元實(shí)現(xiàn)移動、攻擊、偵察、撤退功能,在算法層面,主要有基因算法、蒙特卡羅算法、勢流法、貝葉斯法和強(qiáng)化學(xué)習(xí)。

 

作戰(zhàn)單元移動方面,根據(jù)敵方目標(biāo)的數(shù)量和類型,可使用勢流法實(shí)現(xiàn)對作戰(zhàn)單元的編隊(duì)控制。

 

作戰(zhàn)單元攻擊方面,可簡化為多目標(biāo)連續(xù)優(yōu)化問題,構(gòu)建仿真作戰(zhàn)單元環(huán)境,使用基因算法控制作戰(zhàn)單元實(shí)現(xiàn)最大化攻擊和最小化傷害,依據(jù)環(huán)境條件選擇合適的動作行為。

 

強(qiáng)化學(xué)習(xí)技術(shù)可使作戰(zhàn)單元能夠根據(jù)敵方的行為做出相應(yīng)決策,研究發(fā)現(xiàn)作戰(zhàn)單元能夠在不同的游戲階段做出最佳決策,但該方法僅適合特定場景下的決策。

 

偵察方面,根據(jù)敵方目標(biāo)的數(shù)量和類型,使用勢流法對作戰(zhàn)單元進(jìn)行編隊(duì)控制。

 

未來戰(zhàn)爭制智權(quán)的奪取,決策算法是關(guān)鍵?!缎请H爭霸》與實(shí)際作戰(zhàn)過程比較接近,是未來戰(zhàn)爭決策算法的孵化器。

 

通過分析對《星際爭霸》算法研究,對于搞清多智能體博弈對抗決策機(jī)理,以及未來作戰(zhàn)自主決策具有重要意義。然而,除去算法本身之外,未來作戰(zhàn)自主決策技術(shù)的落地應(yīng)用,仍然面臨一些挑戰(zhàn)。

 

未來作戰(zhàn)自主決策技術(shù)面臨的挑戰(zhàn)

 

未來作戰(zhàn)自主決策技術(shù)AI 復(fù)雜度分析

 

AI算法模型對樣本數(shù)量和復(fù)雜度具有強(qiáng)烈的依賴性,學(xué)習(xí)對象越復(fù)雜,對樣本數(shù)量要求也越高,如果要考慮攻擊類型、能源以及科技研發(fā)等因素,那么復(fù)雜度會更高。

 

與《星際爭霸》相比,真實(shí)戰(zhàn)場的復(fù)雜度要高出多個數(shù)量級:作戰(zhàn)單元種類和數(shù)量更多;作戰(zhàn)單元行為控制更加復(fù)雜,作戰(zhàn)單元往往需要設(shè)定大量的控制參數(shù)完成;作戰(zhàn)域更加復(fù)雜,真實(shí)作戰(zhàn)域已擴(kuò)展為海、陸、空、天、網(wǎng)、電磁以及意識域;評價標(biāo)準(zhǔn)更為復(fù)雜。

 

未來作戰(zhàn)自主決策技術(shù)可以嘗試分布式解決模式,分解為具體的子問題,針對每個子問題運(yùn)用對抗網(wǎng)絡(luò)、模仿學(xué)習(xí)以及元學(xué)習(xí)等手段進(jìn)行策略求解,最后將各個子策略進(jìn)行集成。

 

未來作戰(zhàn)自主決策技術(shù)瓶頸問題

 

1)缺乏足夠的領(lǐng)域知識和樣本數(shù)據(jù)

 

戰(zhàn)場樣本數(shù)據(jù)通常是指在實(shí)際作戰(zhàn)、演習(xí)訓(xùn)練以及仿真過程中,產(chǎn)生的情報、通信以及作業(yè)數(shù)據(jù)等,需要清洗加工和標(biāo)注標(biāo)簽等工序才能夠用在學(xué)習(xí)模型中。樣本質(zhì)量包括數(shù)據(jù)本身的好壞及數(shù)據(jù)標(biāo)簽的準(zhǔn)確性。

 

當(dāng)前自動化標(biāo)注方法面對戰(zhàn)場紛繁復(fù)雜的態(tài)勢信息靈活性不強(qiáng),且數(shù)據(jù)的產(chǎn)生主要依靠演習(xí)訓(xùn)練和仿真試驗(yàn),戰(zhàn)術(shù)對抗激烈程度和靈活程度以及裝備使用程度均不如實(shí)戰(zhàn)。

 

2)缺乏科學(xué)的驗(yàn)證評價技術(shù)手段

 

模型通常需要使用大量的數(shù)據(jù),但現(xiàn)階段無法實(shí)現(xiàn)將模型放在實(shí)際戰(zhàn)場中去測試。目前針對未來作戰(zhàn)自主決策技術(shù)的效果驗(yàn)證,缺乏統(tǒng)一的量化指標(biāo)和標(biāo)準(zhǔn),即便面對實(shí)際場景,也很難有統(tǒng)一的量化衡量標(biāo)準(zhǔn)。

 

3)缺少多學(xué)科融合人才

 

在未來作戰(zhàn)自主決策技術(shù)場景下,精通軍事作戰(zhàn)理論、熟悉裝備性能、明確交戰(zhàn)規(guī)則的領(lǐng)域?qū)<?/span>,與掌握機(jī)器學(xué)習(xí)模型算法、強(qiáng)化學(xué)習(xí)訓(xùn)練技巧、深度學(xué)習(xí)網(wǎng)絡(luò)構(gòu)建經(jīng)驗(yàn)的AI技術(shù)專家相結(jié)合,才能找到切入點(diǎn)和發(fā)力點(diǎn),真正發(fā)揮未來作戰(zhàn)自主決策技術(shù)效能。

 

基于大型戰(zhàn)爭游戲的

未來作戰(zhàn)自主決策技術(shù)發(fā)展著力點(diǎn)

 

本質(zhì)上,未來作戰(zhàn)自主決策技術(shù)的瓶頸問題是的矛盾關(guān)系。缺乏軍事決策技術(shù)領(lǐng)域與人工智能算法跨領(lǐng)域?qū)<遥@個,以及可以有效訓(xùn)練學(xué)習(xí)模型數(shù)據(jù),這個

 

未來作戰(zhàn)自主決策技術(shù)智能系統(tǒng)架構(gòu)

 

未來作戰(zhàn)自主決策技術(shù)智能系統(tǒng)架構(gòu)主要由未來作戰(zhàn)自主決策技術(shù)智能系統(tǒng)作戰(zhàn)單元兩部分構(gòu)成,兩者相互配合、相互協(xié)同,前者發(fā)出決策指令,后者執(zhí)行并將執(zhí)行效果進(jìn)行反饋。

 

 

未來作戰(zhàn)自主決策技術(shù)架構(gòu)

 

未來作戰(zhàn)自主決策系統(tǒng)基本運(yùn)行原理是通過對復(fù)雜戰(zhàn)場環(huán)境進(jìn)行建模,將戰(zhàn)場資源虛擬化,構(gòu)建虛擬-現(xiàn)實(shí)的實(shí)時映射關(guān)系。

 

根據(jù)戰(zhàn)場實(shí)際態(tài)勢,并基于構(gòu)建的虛擬化戰(zhàn)場模型,得到適合于當(dāng)前戰(zhàn)場情況下有利于我方的作戰(zhàn)決策行為,其中虛擬資源構(gòu)建的真實(shí)程度直接決定了智能AI模型的計算準(zhǔn)確程度。

 

未來作戰(zhàn)自主決策技術(shù)大型戰(zhàn)爭游戲AI虛擬建模技術(shù)

 

當(dāng)前諸多大型戰(zhàn)爭游戲建模技術(shù)已較為成熟,具備精細(xì)化建模的能力,但與實(shí)戰(zhàn)應(yīng)用還有相當(dāng)距離:缺乏包含作戰(zhàn)規(guī)則、裁決模型等決定實(shí)際戰(zhàn)爭效果的軍事應(yīng)用規(guī)則模型的嵌入;缺乏仿真模型與實(shí)際戰(zhàn)場環(huán)境的交互能力。

 

從擔(dān)負(fù)的任務(wù)和規(guī)??矗蓪⑽磥碜鲬?zhàn)自主決策技術(shù)分為戰(zhàn)術(shù)級、戰(zhàn)區(qū)級、戰(zhàn)略級3個層次

 

可從戰(zhàn)術(shù)級入手,在當(dāng)前游戲建模技術(shù)基礎(chǔ)上,從作戰(zhàn)概念模型和推演模型體系兩方面搭建適合于仿真推演的虛擬模型。

 

未來作戰(zhàn)自主決策技術(shù)大型戰(zhàn)爭游戲推演引擎技術(shù)

 

對于戰(zhàn)爭游戲引擎而言,更重要的是應(yīng)從設(shè)計理念、引擎模式、應(yīng)用方式3方面進(jìn)行技術(shù)研發(fā)。

 

設(shè)計理念是指一款戰(zhàn)爭游戲涵蓋不了戰(zhàn)爭的方方面面,要求以聚焦作戰(zhàn)概念為核心,針對當(dāng)前引擎架構(gòu)設(shè)計基本方法,突出顯示需要修改開發(fā)的地方,支持作戰(zhàn)概念,設(shè)計開發(fā)戰(zhàn)爭游戲引擎。

 

引擎模式可以分為人在回路和人不在回路兩種,前者是指作戰(zhàn)人員可以指揮各個單元以及戰(zhàn)場態(tài)勢,在線實(shí)時修改游戲模型,后者指整個游戲推演過程完全由AI模型自主完成。

 

應(yīng)用方式是指戰(zhàn)爭游戲引擎可以支持調(diào)試運(yùn)行模式,根據(jù)指戰(zhàn)員訓(xùn)練、推演以及實(shí)戰(zhàn)需要,根據(jù)戰(zhàn)場全局的某個片段、某個子任務(wù)進(jìn)行重復(fù)調(diào)用、重復(fù)訓(xùn)練指揮。

 

 

未來作戰(zhàn)自主決策技術(shù)大型戰(zhàn)爭游戲推演引擎技術(shù)邏輯框架

 

結(jié)論

 

《星際爭霸》游戲是決策技術(shù)應(yīng)用的一個重要領(lǐng)域,是算法開發(fā)、模型驗(yàn)證的重要平臺,與真實(shí)戰(zhàn)場的復(fù)雜性和多變性相比,《星際爭霸》直接應(yīng)用于作戰(zhàn)自主決策仍然有較大差距。但其具有高實(shí)時性、戰(zhàn)爭迷霧、狀態(tài)和動作空間巨大等特點(diǎn),在戰(zhàn)場數(shù)據(jù)生成機(jī)理、戰(zhàn)略戰(zhàn)術(shù)算法開發(fā)和驗(yàn)證方面,能夠?yàn)樽鲬?zhàn)自主決策提供理論指導(dǎo)和技術(shù)支撐。

 

并且博弈論將作為未來作戰(zhàn)自主決策技術(shù)的理論牽引,模仿學(xué)習(xí)、遷移學(xué)習(xí)以及增量學(xué)習(xí)的探索,都會給該領(lǐng)域帶來新的研究思路。

 

本文作者:黃彬城,陳思,高放,葛建軍,吳雪玲

作者簡介:黃彬城,中國電子科技集團(tuán)公司認(rèn)知與智能技術(shù)重點(diǎn)實(shí)驗(yàn)室、中國電子科技集團(tuán)公司信息科學(xué)研究院,工程師,研究方向?yàn)槿后w智能、多智能體決策。

 

論文全文發(fā)表于《科技導(dǎo)報》2021年第5期,題目為《星際爭霸視角的未來作戰(zhàn)自主決策技術(shù)》,本文有刪減

責(zé)任編輯:向太陽
特別申明:

1、本文只代表作者個人觀點(diǎn),不代表本站觀點(diǎn),僅供大家學(xué)習(xí)參考;

2、本站屬于非營利性網(wǎng)站,如涉及版權(quán)和名譽(yù)問題,請及時與本站聯(lián)系,我們將及時做相應(yīng)處理;

3、歡迎各位網(wǎng)友光臨閱覽,文明上網(wǎng),依法守規(guī),IP可查。

熱點(diǎn)排行
  • 一周
  • 一月
  • 半年
  • 建言點(diǎn)贊
  • 一周
  • 一月
  • 半年
  • 圖片新聞

    友情鏈接
  • 186導(dǎo)航
  • 紅旗文稿
  • 人大經(jīng)濟(jì)論壇
  • 光明網(wǎng)
  • 宣講家網(wǎng)
  • 三沙新聞網(wǎng)
  • 西征網(wǎng)
  • 四月網(wǎng)
  • 法律知識大全
  • 法律法規(guī)文庫
  • 最高人民法院
  • 最高人民檢察院
  • 中央紀(jì)委監(jiān)察部
  • 共產(chǎn)黨新聞網(wǎng)
  • 新華網(wǎng)
  • 央視網(wǎng)
  • 中國政府網(wǎng)
  • 中國新聞網(wǎng)
  • 全國政協(xié)網(wǎng)
  • 全國社科辦
  • 全國人大網(wǎng)
  • 中國軍網(wǎng)
  • 中國社會科學(xué)網(wǎng)
  • 人民日報
  • 求是理論網(wǎng)
  • 人民網(wǎng)
  • 備案/許可證編號:京ICP備15015626號-1 昆侖策研究院 版權(quán)所有 舉報郵箱:kunlunce@yeah.net
    攜趣HTTP代理服務(wù)器