OVERVIEW

プロジェクト概要

  • プロジェクトの概要
  • 数理基盤紹介
  • POC1 循環器医学の革新
  • POC2 臨床治験デザインの最適化
  • 数理共通基盤の強化

流線トポロジカルデータ解析(Topological Flow Data Analysis=TFDA)

TFDA解析のねらい

現代の計測技術や数値シミュレーション技術の高度化・高精度化により,複雑な流れの可視化データや計測データが多数得られるようになっています.しかし,そこから有効な情報を抽出するためにはいくつかの問題点があります.どんなに高度な計測装置であっても,実際に得られるデータにはノイズや誤差の混入が本質的に避けられません.また,比較的精度が制御しやすい数値シミュレーションデータでも,十分な精度の数値結果を得るには,非常に多くの計算機資源が必要になり,それほど実施が簡単ではありません.つまり,流れに関わるデータ解析の現場では,かけられるコストと得られる利益にはトレードオフの関係があるのです.このような背景の中で,私達はどのような情報に注目して有効な情報を計測や数値データから得ればよいのでしょうか?その一つの選択肢が,計測データやシミュレーションデータの中から,ノイズや誤差があっても崩れないような性質を抽出することにあると私達は考えています.

TFDA解析を支える“数理”=トポロジーと力学系理論

数理科学の幾何学の分野に「トポロジー」と呼ばれるものがあります.これは,与えられた図形に対して,そこにわずかな連続変形(摂動)を加えても変わらないような図形の性質を調べる分野です.この「トポロジー」は高校までに習う初等幾何学とは少し趣が異なります.例えば,輪ゴムを引っ張って三角形と円を作ったとしましょう.このとき,初等的な幾何学であれば,これらは違う形として識別しますが,トポロジーの世界では,これらの形は同じゴムを変形して作ることができる形であるため「同じ形」と見なすのです.つまり,変形を通して互いに写りあえない図形のみを「異なる形」と区別して考える幾何学といえます.例えば,ビーチボールと浮き輪は互いに連続的に変形させても互いに写り合うことができないため,トポロジーでは違う形と見なすわけです.

もう一つのは柱になる数学理論が「力学系理論」です.この分野では変化する量の幾何学的性質を扱います.例えば,流れの運動を記述する微分方程式に初期状態を一つ与えて,その解(これを”軌道”といいます)を作ったとき,その一本一本の解の性質を調べるのではなく,初期値の集合を考えて,そこから得られる軌道の集まり(軌道群)が作る図形の幾何学な構造を力学系理論では調べます.これに基づいて将来に軌道群がどのように変化するかといったことも記述することができ,変化する量の未来予測も可能にします.

流線トポロジー解析(TFDA)の考え方

私達は数理科学の視点に基づいて,与えられた流れに従って動く(微)粒子が作る軌道群の全体の作る図形のトポロジカルな構造に着目し,その流れの性質を記述し分類する数学理論を完成させました.さらに,それに基づいて,与えられた計測や数値シミュレーションなどで得られたデータから,それによって流される粒子の軌道(流線)を空間全体に描いたとき,その中で互いに連続変形で写りあえないものを異なるトポロジー構造とみなして,その分類を行う数理技術=流線トポロジカルデータ解析(Topological Flow Data Analysis = TFDA)の開発を実現しました.この解析技術は,トポロジーの基本的な考え方からもわかるように,データの中にノイズや誤差といった摂動があっても堅牢に残る幾何学的構造を抽出し,計測や数値シミュレーションデータから解析対象となる流れの中にある普遍的な性質を理解できるようになります.さらに,それらの統計処理や最新の機械学習などへの応用を通して,単なる画像認識を超える画像識別や時間変化の予測の実現も期待できるものです.

TFDAの概要と特徴

(1) TFDAの出力

TFDAでは,与えられた流れによって作られる粒子の軌道群の中からトポロジカルにことなるものだけを認識して抽出し,それらの位置関係を木(ツリー)構造として対応させます.さらに,その木構造を文字列として表現します.TFDAは流れの作る軌道群パターンを離散的な木(グラフ)構造とその言語表現へ変換し,曖昧さのない表現を可能にします.

(a)流れデータ (b)トポロジー構造とそのCOT表現例 (c)木構造(COT)(d)COT表現
(a)は日本列島まわりの海流の作る軌道群のパターンです.これに対してTFDAを適用すると,(c)のような木表現(COT=partially Cyclically Ordered rooted Tree)と(d)のような文字列表現(COT 表現)が得られます.木構造はトポロジカルに異なる軌道群どうしの隣接関係や包含関係が表現されます.さらに,この木構造は曖昧さなくCOT表現なる文字列として表現できるので,この文字列を使ってパターンを分類・識別することが可能です.さらにCOTのノードにあるラベルやCOT表現に示された文字列は(b)に示すような流れ軌道の中でトポロジカルな特徴を持つ軌道を表現しているので,これを見るだけで流れの形状を言葉として区別できることになります
(2) TFDAの適用範囲

TFDAが適用できるデータは「二次元空間の流れ(ベクトル)場」です.また,現実の流れである三次元空間の流れに対して直接適用はできませんが,二次元断面の上に何らかの意味で射影(スライス)することで,その二次元スライス面での軌道群の集まりとして適用できます.また単なる二次元イメージ画像に対しても適用できます.

(3) TFDAのソフトウェア(psiclone)の開発

TFDAの数学的詳細がわからなくても与えられたデータから解析が可能なソフトウェアpsiclone(サイクロン)を開発し,大量のデータにTFDA解析が実施できるようになっています.

与えられた二次元非圧縮流れ場からTFDAを実行するソフトウェア ■「適合性」と「安定性」を兼ね備えた数値計算手法 ■格子点上の高さ関数(ハミルトン関数)のデータだけで変換可能 ■トポロジカルな構造だけでなく、構造の影響領域(定量情報)を抽出
(4) TFDAの数学的品質保証

特に,二次元空間の流れ(水,空気,油のような流体の流れ)に対しては,この木表現と文字列表現によってすべて曖昧さなく表現可能であることが厳密に数学的に証明されています.数学の言葉で言えば,流線軌道群の作るパターンと木構造(と文字列表現)は一対一に対応していることが示されています.このようなデータ解析結果に厳密数学的保証が担保されていることも私達の技術の強みです.

簡単な適用例

(a) 一様流れに置かれた平板
(b) 数値シミュレーションにより得られる揚抗比(赤線)
(c)揚抗比が最大になる時(t=5.5, t=12.6)と最小になる時(t=11.4)の流れ画像.

(a)のような平面翼の断面に左側から一様な流れがやってくるような例を考えてみましょう.これを数値シミュレーションして翼に加わる揚力や抗力が(b)のように変動しているとします.私達はこの揚力と抗力の費比が大きくなるところが効率のよい翼なので,そのような状況を達成する流れパターンを理解し,その形状を設計したいわけです.これに対して揚力が最大になるところと最小になるところの流れのパターンを(c)のようになっていたとします.しかし,このパターンをみただけでどの流れが理想的かどうかは全く分かりません.そこで私達のTFDAが活躍します.

t=5.5のときICCB0 a∅(a2(λ+,c-(b--{σ-,σ-},c+(σ+,λ-))))。t=11.4のときIA0A0CC a∅(a2(c+(σ+,λ-)·c+(σ+,λ-),λ-)·a-(σ-)·a-(σ-)))。t=12.6のときIA0A0CCCB0 a∅(a+(σ+)·a+(σ+)·a2(λ+,c-(b--{σ-,σ-},c+(σ+,λ-)·c+(σ+,λ-))))
揚抗比が最大になる時(t=5.5, t=12.6)と最小になる時(t=11.4)の流れ画像にTFDAで割り当てたCOT表現と語表現
上図はTFDAの結果です.三つのパターンにCOT表現の文字列が与えられていますが,この文字列の中にc+という文字列で表現されている構造が揚力を増加させる「閉じ込め渦領域」の存在を示しており,このような文字列が現れるパターンを「よい流れ」として捉えることができるようになりました.

JST-MIRAI Project Four-Dimensional Topological Data Analysis for Future Medical Care