研究内容
研究分野は機械学習およびデータマイニングであり、幅広いモデルとアルゴリズムを対象としています。その中でも特に、グラフを基盤とする技術に重点を置いています。
グラフ(ネットワークとも呼ばれる)は、複雑なシステムを「実体とその相互関係」として表現する強力な手法です。ノードは人、組織、都市、デバイスなどの実体を示し、エッジはそれらの間の関係──たとえばコミュニケーション、協調、取引、地理的近接など──を表します。この柔軟な表現により、ソーシャルコミュニティ、交通ネットワーク、ウェブ、生物学的経路といった複雑なシステムを統一的な枠組みでモデル化し、分析することが可能になります。グラフデータの分析を通じて、社会や産業における現象の構造を明らかにし、現実社会の多様な課題に対してデータ駆動型の解決策を導き出すことを目指しています。
図1に示すように、研究は五つの相互に関連する方向性に沿って展開しており、「理論・アルゴリズム・システム・応用」を統合する一貫した研究体系を形成しています。
① 伝統的なグラフ解析
伝統的なグラフ理論と統計物理に基づくネットワーク科学の基本手法(次数分布、次数相関、中心性、スペクトル解析、ランダムネットワークモデル、最短経路、到達可能性解析、ランダムウォーク、ネットワーク分割、ネットワーク上の同期現象など)を用いて、グラフの構造的特性を体系的に分析します。
② グラフ機械学習
この研究では、機械学習および深層学習の手法を応用し、グラフデータに対する表現学習や予測を行っています。これまでの研究では、主に次の四つの課題に取り組んでいます。 (a)予測精度の向上、 (b)ノードランキングやコミュニティ検出など、新たなグラフ分析タスクに対応する学習手法の開発、 (c)二部グラフ、動的グラフ、異種グラフなど、多様なグラフタイプに対応するモデルの開発、 (d)不完全グラフに対してロバストに学習する枠組みを構築し、実用性を高めること。
③ グラフデータベースシステムおよび大規模グラフ処理
大規模グラフを対象として、効率的な格納、索引、近似検索、アクセス制御、可視化分析の技術を研究し、分散・並列学習の枠組みを通じて「億単位ノード・エッジ」規模の処理効率を確保します。
④ グラフを活用した多様データの処理
グラフ処理の手法を3D点群、テキスト、時系列、画像、地理空間データ、表形式データなどに展開し、クロスモーダル/マルチモーダルを含む多様で先進的な解析モデルを提案します。
⑤ 実応用
開発した理論・モデル・アルゴリズムを実データの応用場面に適用し、幅広い分野における現実的課題の解決に取り組んでいます。研究成果には、YouTube Liveにおける寄付予測、Wikipediaにおける欠落伝記の補完、脳疾患の診断、救急医療サービスの需要予測、商品推薦、引用推薦、ソーシャルメディアにおける人気トレンド予測、抗菌薬選択支援、さらに疾患サブタイプごとの遺伝子ネットワーク推定などが含まれます。