リバネス研究費:エディテージ受賞者インタビュー(1)大槻明先生
今回リバネス研究費エディテージ賞で大賞を受賞された大槻明先生(お茶の水女子大学 専任講師)にご研究についてインタビューしました。
エディテージ賞を受賞した大槻明先生、受賞、おめでとうございます。先生の研究内容について教えてください。
今回は名誉ある賞を頂き、誠にありがとうございます。私の研究内容ですが、広義でいうとビッグデータの分析の研究をしています。
ビッグデータとは?
ビッグデータとは、単に量が多いというだけではなく、SNSのように、リアルタイム性が高く、様々な形式が含まれる非構造なデータのことをいいます。これまでは、リアルタイム性が高く、量も多く、構造化がされていないデータであるため管理が難しいなどの理由により敬遠されがちでしたが、ビッグデータを分析することで、これまでにない新たな知見を得られる可能性が高まるといわれています。マーケティングの世界でもSNSの情報による顧客動向や顧客予測等の分析に用いることができ、ビッグデータの分析は非常に重要視されてきています。
ビックデータに関する技術
ビッグデータに関する主な技術として、現状では主に次の4つが存在しています。下記の中で、私の研究はデータマイニングに属します。
- 分散処理技術
代表的なものとしてHadoopがあります。Hadoopは、大規模データの分散処理を支えるJavaソフトウェアフレームワークです。数千ノードおよびペタバイト級のデータを処理するこが可能です。
- データ管理・検索技術
リレーショナルDBを管理する定番技術であるSQLに対し、NoSQLは非構造データを対象にしたデータ管理・検索技術です。イメージとして例えるなら、前者は行の概念でデータを管理・検索し、後者は列の概念で管理・検索する技術です。
- データ分析
データマイニングなどの技法を大量のデータに網羅的に適用することで知識を取り出す技術が主流です。これまでの統計手法とは違った、新たな見え方や解釈が行える事が期待されています。
- 可視化
代表的なものとしてLGLがあります。LGLは、ノードを表示せず、エッジのみを表示することにより、ビッグデータを効果的に可視化することができます。
大槻先生の研究について教えてください
私の研究では、データマイニングの中でも、特に引用分析やクラスタリングを用いたビッグデータ分析を行っています。クラスタリングとは、簡単に言うとグループ化のことであり、論文、特許及びSNSなどの膨大なデータを対象として、それらのつながり度合いを分析し、そのつながり度合いに応じてダイナミックにビッグデータをクラスタ化します。そして、ページランクアルゴリズムを応用した独自の手法により、クラスタリングにより同定された領域から、主要なノードをダイナミックに抽出する手法について研究・開発しています。今後は,さらにその主要なノードが一つのクラスタ内の結合をどれだけ結合しているか、他のクラスタ内のノードとどのくらい結合しているのかを算出し、それらをXY平面上にプロットすることにより,主要ノードの動きについて分析していきたいと考えます。この分析により、例えば、技術の論文を分析した場合,将来的に2つのクラスタ(技術)が融合して新しい技術が生まれる、といった流れを予測する事が支援できると期待されます。
研究助成金の使用用途は?
IEEEの国際会議にアクセプトされ、2012年10月に海外で発表する予定ですので、その関係の費用で使用させていただきたいと思っております。また、今後新たな研究を行っていくうえでの必要経費にも使用させていただきたいと思っております。
エディテージに期待されていることはありますか?
今,大学ではクローバル化が求められていて、お茶の水女子大学でも,学生の海外留学や、英語力強化にも取り組んでいます。英語のプレゼン、論文の書き方、ディスカッションの訓練等、英語教育が非常に重要になってきますので、ご支援を頂きたいと思います。また、今回の賞は若手研究者の方にスポットを当てて、研究助成をしている賞であり、しかも、民間が行っているということに意味があると感じています。 内閣府の調査や2012年3月のネイチャーの記事でも紹介されましたが、日本の若手研究者の減少が顕著になってきています。この原因には様々な要因がありますが、今後、若手研究者のおかれる環境や立場はますます厳しくなっていくものと思われます。こういった状況の中で、特に民間企業が若手研究者にスポットを当てた研究助成を行っているところに魅力や意義を感じました。ゆえに、今後もこのような若手研究者支援を継続的に発展していただければありがたいです。
コメントを見る