2023年はGoogleの新しいAIソリューションであるGeminiの登場で大いに盛り上がりました。GoogleのGeminiは、テキスト、画像、音声、動画、コードなど、さまざまな種類の情報を一般化してシームレスに理解し、操作し、組み合わせることができる、マルチモーダル生成AIモデルです。まだ開発中のモデルですが、今後さまざまなGoogle製品に活用される予定となっています。
▶最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに(Google Japan Blog)
Google DeepMindは、32の標準テストのうち30で、GeminiがGPT-4を上回ったと発表しており、動画では、Geminiの信じられないほど人間的な多様性と「マルチモダリティ」が示されています。私たちは最近、言語にとらわれないAIの能力が、津波のようなスピードで国際的な障壁を打ち破り、新たなイノベーションや進歩への道を加速させているのを目撃しています。研究者の仕事をより効率的で生産的なものにするために、Geminiは何ができるでしょうか? どのような新しい機能を提供できるのでしょうか?
無限の可能性と注目すべき特徴
・学際的な研究:専門知識やリソースを待つことなく研究を進めることができます。基礎研究の本質である、台本のない自由な会話は、新たな発見につながり、知識のギャップを埋めるのに役立ちます。
・組織的かつ系統的なアプローチ:世界中で利用可能なデータを収集し、研究者に提示することで、関連性や信頼性を高め、結果として研究に役立てることができます。
・研究を読み解く:Geminiは論文に目を通し、研究者の指示に基づいて、どの論文に関連性があるかを判断することができます。
・大規模なデータセットの処理: 数分から数時間でデータをスキャンし、図やグラフを作成することができるため、特にゲノムなどの分野の科学論文や、法律や金融などの大規模なデータセットに依存する非科学的な分野の論文を解明するのに適しています。
・マルチモダリティ:あらゆる種類の入力を使用してあらゆる種類の出力を生成する能力は、Geminiの大きな特徴です。様々な入力からコードを生成し、テキストや画像を生成することができます。
Geminiはこの分野における、まさに「革命児」といえます。
研究者の世界におけるAIについてもっと知るなら、以下の記事もご覧ください。
この記事はEditage Insights 英語版に掲載されていた記事の翻訳です。Editage Insights ではこの他にも学術研究と学術出版に関する膨大な無料リソースを提供していますのでこちらもぜひご覧ください。