MBSD® MBSD®

Topological Data Analysis トポロジーデータ分析(TDA、Topological Data Analysis)

トポロジーデータ分析
(TDA、Topological Data Analysis)

サイバー攻撃 vs. AYASDI

サイバー攻撃は年々巧妙になっており、日々新たな攻撃手法が誕生しています。攻撃から守るための対策も進化を遂げていますが、攻撃者は対策の「抜け穴」を執拗に攻めたり、全く別の方向から攻撃を仕掛けたりと、防御側と常にいたちごっこを続けており、完全な防御策を講じることは事実上不可能と言えます。そのため、まったく新しい攻撃手法に対しては、攻撃の予測・発見・対処は極めて困難であり、多くの場合、攻撃に気付かなかったり、被害報告を受けて初めて攻撃に気付いたりという状況に陥っています。

AIやビッグデータ分析を活用してこの課題の解決を試みている企業は多数ありますが、当社はAYASDI社が提供する、位相幾何学の応用であるトポロジーデータ分析(TDA: Topological Data Analysis)を用いて、極めてユニークなアプローチで未知のサイバー攻撃に取り組んでいます。当社はこの分野に2015年から取り組んでおり、様々な実際のユースケースに応用しています。

MBSDには「IoT・ビッグデータ事業部」があり、この事業部にはデータサイエンティストやThreat Hunterが多数在籍しています。企業でのIoT活用が進む中、膨大な数のIoT機器から絶え間なく出力される挙動データを収集し、攻撃や脅威が無いかどうかをリアルタイムにモニタリングする必要性が増す中、同事業部では、TDAを活用したAI分析を行っています。TDAは、巧妙に偽装された攻撃パターンを暴き出すことを可能とし、監視対象システムを未知の攻撃から守ります。

AYASDI社は (チェロキー語で「探す」ことを意味します)、スタンフォード大学数学科のGunnar Carlsson教授の10年以上の研究成果を元に、同教授を中心とするメンバーによって2008年に設立されました。現在は、米国シリコンバレーにオフィスを構え、様々なAIソリューション企業を傘下に有するSymphony AIグループの中核企業として活動しており、ディープラーニングを超えるソリューションを提供する企業として、今もっとも期待されているビッグデータ分析の会社です。

トポロジーデータ分析(TDA: Topological Data Analysis)とは?

TDAは、複雑なデータや高次元のデータに内在する骨組み構造を明らかにすることができる分析手法です。高次元のデータを「高次元空間に存在するカタチ」と捉えることで、データ集合のどの部分が部分集合としてまとめることができ、部分集合同士がどのように繋がっているかを明らかにします。通常、こうした分析を行う際には、データサイエンティストが仮説を立て、仮説に基づいて試行錯誤を繰り返す必要がありますが、TDAでは、「データのカタチ」を先に明らかにしてから仮説を立てます。これにより、従来多くの時間を費やしていた仮説・検証プロセスを大幅に短縮することができる上、仮説を立てる人間の「思い込み」を排除することができます。よって、攻撃者が通常のサイバー対策の裏をかいてゼロデイ攻撃を仕掛けてきても、データの構造、パターンのわずかな違いから攻撃を発見できるのです。発見したパターンをAYASDIソフトウェアで自動検知することもできますが、他のAIエンジンやルールエンジンに組み込むことで、未知の攻撃のリアルタイムな自動検知を拡張することが可能となります。

そもそもトポロジー(位相幾何学)とは何でしょう? 簡単に言えば、複雑なカタチを「ざっくり同じ」レベルで把握する幾何学の分野です。皆さんも、中学校の数学で、「合同」や「相似」を学ばれたことと思います。これらは「全く同じカタチ」「似ているカタチ」を捉える初歩的な幾何学ですが、トポロジーではこれを発展させて「ざっくり同じカタチ」を捉えます。詳細な説明は専門書に任せますが、「穴の数が何個あるか」で判断するので、例えば「A」と「O」は「ざっくり同じ」という判断になります。未知の攻撃の例に戻ると、IoT機器のデータや、認証システムのログをトポロジー的に捉えると、通常のIoT機器のパターンや人間の認証パターンは「ざっくり同じ」なのですが、やはり攻撃のパターンは「ざっくり同じ」になりません。これにより、大量で複雑なデータの中から、攻撃を見つけることができるのです。

このように、AYASDI社の提供するトポロジーデータ分析は、データの集まりをカタチとして理解し、そこに意味を見出し、価値を創造するという全く新しいアプローチです。数学モデルや機械学習と組み合わせることで、企業で蓄積している膨大なデータから、攻撃予兆検知や不正検知が可能です。さらには、サイバーセキュリティに留まらず、マーケティングや市場予測、自動判断等、デジタルトランスフォーメーションに応用することも可能なのです。

図