【投稿日】2016.12.08
日時: | 2016年12月8日㈭ 16:30–17:30 |
---|---|
場所: | 青葉山キャンパス 情報科学研究科棟 2階大講義室 |
備考: | 情報科学研究科研究科重点プロジェクト「数学と諸分野の協働推進による学際的・総合的な新領域研究の開拓」第1回講演会を兼ねています。 |
16:30–17:30
池村 淑道 氏 (長浜バイオ大学客員・名誉教授, 国立遺伝学研究所・総合研究大学院大学名誉教授)
ゲノムビッグデータからの教師なし学習による想定外知識発見と社会的重要課題への応用
ゲノム配列を代表例とする、生命科学分野の多様な測定データはビッグデータ化しており、そこにどの様な興味深い新知識が潜んでいるのかは想像することすら困難と思える。この様な状況下では、モデルや仮説や予備知識なしにビッグデータを研究できる「教師なし機械学習」が威力を発揮する。ゲノム配列はATGCの4種類の文字で構成される長文と言えるが、その文章中の連続文字列(例えば5連や6連、あるいは20連続文字)についての「ワードカウントに着目した機械学習」を行ってきた。ワードカウントのような理解しやすい解析を行うことでも、想定外の多様な知識発見が可能になる。20連文字を対象にした場合、約一兆一千億(=420)次元のデータ解析となり、スパースな大量データ解析となる。「コンピュータでエボラやインフルエンザウイルスの弱みを探る」等の社会的に重要な課題への応用も可能になっている。