【発表のポイント】
⚫ 大脳皮質厚データに主成分分析(PCA)(注1)を行った場合、100人未満のサンプルでは主成分が極めて不安定になることを定量的に証明しました。サンプル間の安定性の94〜97%がサンプルサイズで説明されました。
⚫ 大規模データの「主成分ベクトル」(注2)をデータが重複しない小規模サンプルに転用すると、認知能力・性格特性の予測精度が有意に向上しました。
⚫ 採用する主成分数を検討した結果、最適なピーク値があることが示されました。

【概要】
 脳MRI研究では、少ない被験者で解析すると結果が再現されないという「再現性危機」が深刻な問題です。特に16万4千次元に及ぶ脳画像データへの主成分分析(PCA)は、サンプルが少ないと主成分ベクトル(固有ベクトル)が安定せず、後続の解析全体の信頼性を損ないます。
 東北大学大学院情報科学研究科(兼:加齢医学研究所)の細田千尋准教授らの研究グループは、この問題を解決する実践的な戦略として「大規模データの固有ベクトルを小規模データに転用する」手法を提案・実証しました。
 1,113名分の脳画像データ(Human Connectome Project)(注3)を用いた体系的実験の結果、たった100人のデータでも、500人規模データの固有ベクトルを利用するだけで、認知能力・性格特性の脳行動予測精度が大幅に向上することが明らかになりました。
 本成果は、限られたリソースしか持たない多くの研究機関に対して、公開大規模データを基盤として活用するという新たな研究設計の指針を提供する可能性を示唆しました。本研究は5月25日に科学誌Scientific Reports(Nature Portfolio)に掲載されました。


プレスリリース図

図1. 新手法の模式図。大規模データから抽出した統計的に安定した成分を、統計的に不安定な小規模データに適用することによって、小規模データの解析の統計的安定性を高めることができる。

【用語説明】
注1.主成分分析(PCA)高次元データの次元を削減し、データの分散を最大化する方向(主成分)を求める統計手法。脳画像では16万4千次元のデータを圧縮するために用いる。次元の削減とは、たくさんの情報を、特徴を失わないように少数の指標にまとめること。
注2.主成分ベクトル(固有ベクトル) PCAで算出される「主成分の方向」を定義するベクトル。大規模データから算出したものは安定しており、他のデータへの転用が可能。
注3.HCP(Human Connectome Project)ワシントン大学等が主導する脳神経回路地図作成プロジェクト。22〜35歳の健常成人1,206名の高解像度脳画像・行動データを無償公開。

詳細(プレスリリース本文)

【問い合わせ先】
(研究に関すること)
東北大学大学院情報科学研究科
准教授 細田 千尋
TEL: 022-795-5813
Email: chihiro.hosoda.d8*tohoku.ac.jp
(*を@に置き換えてください)

(報道に関すること)
東北大学大学院情報科学研究科
広報室 小野寺 祐美子
TEL:022-795-4529
Email: koho_is*grp.tohoku.ac.jp
(*を@に置き換えてください)