ケーススタディー
国防科学技術研究所(DSTL)から、難しい課題が提示されました。それは軍用システムに対するサイバーセキュリティ攻撃に自律的に対処する次世代システムの開発です。ケンブリッジコンサルタンツの横断型のチームは、これに対応して最先端のAIソリューションを適用し、難度が高いアプリケーションでの概念実証モデルのデモを実施しました。

サイバー攻撃への自律対応という課題
DSTLは英国国防省(MOD)傘下の部門です。Autonomous Resilient Cyber Defence(ARCD:強靭な自律サイバー防衛)プロジェクトの一部として、サイバー攻撃への自律的な対応によって、軍が受ける影響を軽減するという目標への対応が、業界への課題として設定されました。最重要課題は、攻撃の可能性がある異常を人工知能の使用によって検出する技術を超えることです。検出だけでなく、実際に最適な対応を判断するソリューションが要求されました。

マルチエージェント強化学習
3年間にわたるARCDのプロジェクトでは、軍用のプラットフォームにおける自己防衛と自己修復のコンセプトの研究開発を目的とし、軍における代表的な環境での攻撃を対象としてテストと評価を行いました。当社の取り組みとしては、協調型マルチエージェント強化学習(MARL)エージェントを使用した概念実証モデルを開発しました。これは、現時点では学術的な色彩が強い研究テーマです。
「ケンブリッジコンサルタンツとの協業は、自律サイバー防衛というきわめて困難な課題への対応を支援いただき、満足が行くものでした。今後3年にわたって取り組む最新鋭の対応修復コンセプトを含む提示があり、MODのサイバー攻撃耐性を刷新できる可能性があります」

自律的な対応の実現
サイバー攻撃への対応には多様な方法があります。選択すべき最適な対応は、攻撃と状況の両方により変わり、この組み合わせは一般的なAIアプローチには適合しません。協調型MARLを利用すれば、最適な対応を決定するという複雑な問題を、いくつかの個別の判断に分解できます。複数の学習エージェントのそれぞれが、特定の状況においてアクションが適切であるかどうかどうかを提案します。そしてエージェント間での協調により最適な行動が決定され、攻撃への自律的な対応が可能となります。

状況に応じた正しいアクションの判断
ここで検討の対象とするアプリケーションは車両の防御であり、状況が問題の中で重要な要素となります。単純なシナリオを考えてみると、この課題がよくわかります。たとえば、サイバー攻撃を受けたときに車両を停止すべきでしょうか、それとも走り続けるべきでしょうか。正解は状況によって変わります。交通量が多い交差点の真ん中でブレーキを踏み込むことはあまりないでしょう。他にもっと安全な選択肢があると考えられるからです。これは防衛に関する状況でも同様で、周囲の状況によって取るべきアクションに何らかの変化が生じます。
「サイバー攻撃に対して自律的に対処する判断能力があるシステムの開発は、複雑な問題であり、最先端のテクノロジーの適用が必要です」

安全なシミュレーション環境での学習
概念実証モデルでは、多数のAIエージェントのトレーニングにシミュレーション環境を使用しました。安全な環境の中で、失敗から学ぶことができるということを意味します。シミュレーションを使用すると、過去に例がないサイバーセキュリティ攻撃など、実世界でデータを得ることが難しい状況についてもテストが可能です。シミュレーションの動作は実世界よりも高速なため、AIのトレーニング処理を高速化できます。

より広範な脅威からの防御
今後の展開はどうなるでしょうか。システムの研究開発については引き続きDSTLとの協力を継続します。並列に動作する複数のエージェントをトレーニングする方法の改善や、より広範の脅威に対応して防御できるようなシステムのロバスト性の改善を計画しています。今後3年間の目標は、代表的な状況下でのデモを実施できるようにすることです。