人々の学習に役立つツールを目指して、
Paperpalを常に進化させ続けます!
Nishchay Shah
新製品開発責任者・最高技術責任者 (CTO)
研究者のためのAI英文校正・翻訳ツールとして注目度が高まりつつある「Paperpal」。その開発に携わった新製品開発責任者・最高技術責任者 (CTO) のNishchay Shahに、Paperpalを開発するうえでの課題や、Paperpalの特徴をふまえたうえでのおすすめの利用法、Paperpalのさらなる進化の予定などについて聞きました。ぜひご覧ください。
Paperpalを開発するうえで、どのような課題がありましたか?
Nishchay:Paperpalの開発にあたっては、以下のような課題がありました。
1. 関連性の高い学術データをキュレーションし、大量の非公式なデータセットからノイズを取り除くこと
これにより、当ツールでは基本的な文法チェックよりも、アカデミック・ライティングに焦点を当てた提案を行います。
2. スピードと正確さの両立を重視したディープラーニングの言語モデルを活用し、リアルタイムで予測を行うこと
大規模ディープラーニングモデルでリアルタイムの推論を実現するうえで技術的な制約となるのは、機械学習とは関係のない、基礎的なソフトウェアエンジニアリングに関わるものです。完璧なエクスペリエンスを提供するには、あらゆる側面から製品の使用体験を最適化する必要があります。当社のローレイテンシー(低遅延)エンジニアリングチームは、最新のディープラーニングモデルを用いて、常に最高のエクスペリエンスを提供できるよう取り組んでいます。
3. 通常の文法チェックツールと差別化を図ること
一般の人々が文法校正ツールのマーケットをざっと見ると、一番人気の製品にのみ注目するかもしれませんが、その製品がフォーマルかつアカデミックな文章を得意とするとは限りません。私たちは、Paperpalがいかに違うのか(そして優れているのか)という意識を醸成する必要があります。また、競合他社に追いつくためにその製品を真似ることがないよう、社内でも確認しなければなりません。
GrammarlyやChat GPTなど他のツールと比べて、Paperpalは何が違うのでしょうか?
Nishchay:AI文法チェッカーが飽和状態にあるマーケットのなかで 、Paperpalは、その核となる基礎技術、学術文章への特化、実用的な価値とツール性能という3点で独自性を発揮しています。
1. Paperpalは、何百万もの学術研究論文の原文及び校正を基にトレーニングされた、最先端の機械学習モデルを用いています。他の自動文法チェッカーと異なり、Paperpalはプロの学術編集者の専門知識を基にした言語提案を行います。これは、CACTUSの20年にわたる学術編集事業から生まれた技術で、大きな差別化要因となっています。
2. Paperpalはデータサイエンティストが学術編集の専門家と共同で開発したソリューションであるため、学術文書の種類や構造、詳細な言語要素を検知する機能に富んでいます。その結果、当ツールは文法、スペル、明瞭さを正しく修正することができるのです。略語や数字、数式、引用などのデータも適切に扱い、学術的な文章のトーンやスタイルの一貫性について提案を行います。
3. 業界のベンチマークテストでは、常に、Paperpalの提案の精度が人間の編集に匹敵するとの結果が出ています。ケンブリッジ大学の報告によると、Paperpalは他の6ツールに比べ、より正確な提案をより多く出したとのことです。
また、社内ではChatGPTの学術編集の性能もテストしました。ChatGPTの出力は一見素晴らしく思えるかもしれませんが、そのような生成系モデルには事実関係の正確性にまだ課題があり、実用するにはリスクが伴うと考えています。
PaperpalのAIは何百万もの編集前・編集後の原稿を学習しているとのことですが、AIは今後も成長していきますか?
Nishchay:すでに実験のロードマップに着手しており、文法校正の領域で、最先端の研究開発に基づいて基礎技術とアーキテクチャを進化させるために取り組んでいます。また、トレーニング用のデータセットを拡張し、パフォーマンスをさらに向上させる代替データセットを使うことも計画しています。
とはいえそれは、 AIにもっとたくさん学習させることが目的なのではなく、根本的な学習アルゴリズムを改良することが目的です。Paperpalに搭載されている現行モデルは、まだ学習が必要です。新たなデータの取り込みとともに、モデルそのものの改良がAI学習戦略において非常に重要です。当社が視野に入れているのは、文法修正だけでなく、なぜそのような修正を行うのか、説明可能性(explainability)を追求することで、人々の学習に役立つことです。現在の説明可能性の枠組みにははまらないけれども、編集的な視点からは意味のある修正項目があるかもしません。 もっと多くのデータや類似の発生状況を収集することで、それも改善できると思います。
今後の計画を教えてください。
Nishchay:毎日、多くの新規ユーザーが当社の製品を試してくださるので、製品がスムーズに機能して基本的なニーズを満たすよう、使い勝手やユーザー体験を向上させることが当面の課題です。そしてもちろん、研究論文の執筆者の明白なニーズも暗黙のニーズもともに満たす機能を開発し、リリースし続けることも、当社のロードマップで繰り返し確認している課題です。
GPTやChatGPTを基にした文章生成ツールが大量発生する今、不正利用の可能性(意図的か否かに関わらず)のあるAIソリューションの開発責任を、これまで以上に痛感しています。Paperpalチームは、倫理的な出版実践の推進者という立場を維持しつつ、これらの技術的進歩の恩恵をユーザーの皆様に公開する方法を考えているところです。
また、特に英語を母語としない学術著者が抱える問題点や特有のニーズを理解するために精力的に取り組んでいますので、日本の研究者の皆さんにもPaperpalをご利用いただき、一緒により良いツールを作り上げていければと思っています。