教授(兼) 博士(理学)  木下 賢吾



私たちの研究室では、ゲノムの配列情報に代表される「生命情報」を情報科学的に扱い、生命システムの理解を目指しています。

従来の生物学は個別の議論を蓄積し、どんどん教科書を分厚くする枚挙の学問でした。もちろん個別論を見る楽しさは生物学の醍醐味ですが、生命情報ビックバンとも言える急激な生命情報の増加(図1)により、生物学は大きく様変わりつつあります。例えば、ヒトゲノムに代表される生物の設計図情報や各ゲノム上にある遺伝子がどれぐらい利用されているかという情報(=遺伝子発現量)など、一昔前には考えられなかった程、詳細かつ膨大な生命情報が手に入る時代がこようとしています。その結果、膨大な生命情報を解析する事で、生命システムの一般原理に迫ることが出来る可能性が出てきています。

データが増えることはもちろん良い事ですが、データが増えれば増えるほどその処理は大変になってきます。特に、せっかく情報が増えてもちゃんと処理しないと貴重な情報を失いかねません。例えば、それぞれの遺伝子の発現量データから計算できる共発現指標という指標があります。従来は単純に遺伝子ペアの発現量の相関係数を用いていましたが、相関係数には、少数のハズレ値の影響が大きいなど様々な問題があります。そこで我々は、最初に主成分解析を行って発現量を主成分空間に射影し、主な主成分を順に抜くことで、少数のデータの影響を除いた多次元共発現度指標を考案し、この指標が従来指標に比べて遺伝子の機能的関連を上手く表現していることを示しました(図2)。

このように、我々の研究室では生命情報ビックバンの時代における新しい情報生物学を目指して、生命情報を上手に解析するアルゴズムの研究開発を行っています。

図1
図1(図をクリックすると大きくなります)

図2
図2(図をクリックすると大きくなります)