「Readable」の開発者、京都大学の佐藤竜馬さんにインタビュー

readable

高精度な翻訳サービスとして研究者からも人気の高い「DeepL」ですが、PDFファイルを翻訳したときにレイアウトが崩れてしまうことがあるという欠点が。それを解消し、英語のPDFファイルをレイアウトを保ったまま日本語に翻訳してくれるサービスとして注目を集めているのが「Readable」です。その「Readable」を開発した紫乃さん(@joisino_)こと佐藤竜馬さんにお話をうかがいました。

-現在、佐藤さんは京都大学大学院の鹿島・山田研究室に所属していますが、すでにいろいろな経歴があり、一般的な博士課程の学生とはちょっと違うイメージがあります。まずは経歴や研究テーマなどを教えていただけますか?

佐藤:「機械学習」や「AI」といわれている研究を学部の頃からしていますが、翻訳などとは直接の関係はなく、推薦システムとか検索システム、たとえばAmazonで「この商品がおすすめです」と表示されるシステムですね。どのように推薦をすると人に気にいってもらえるのか、どうすれば自動で良い推薦ができるのか。そのようなことだったり、より数学的な話を中心に研究をしています。
ですから、今回「Readable」を開発したのは、自分の研究に必要ということもありますが、どちらかというと趣味的な感じです。プログラミング自体は、小学生の頃からずっとやっていて、最初はゲームやいろいろなツールを自分で作っていたのですが、その延長線上で、今回は翻訳ツールを作って公開したという流れです。

-Twitterのタイムラインを拝見すると、今回の「Readable」以外にも、最近でもいろいろな論文を出されていますが、メインは今おっしゃった推薦システムに関するところなのですね。

佐藤:そうですね。Twitterのプロフィールに貼っているサイトにいろいろなプロジェクトが書いてありますが、ほんとに雑多にいろいろとやっています。現在中心となっているのは推薦システムですが、研究のプロダクティビティに関する研究もしており、今年CIKMに主著論文で採択されたショートペーパーは、論文を書く時のいろいろな意思決定が引用数に与える影響を調べる手法を提案しています。少し前にはJournal of Informetricsという国際ジャーナルに、どこで出版すると影響力が高いか、その出版先を推薦するシステムを提案しており、そういったものもプロダクティビティの一環として研究しています。

-そんなさまざまな研究をしている佐藤さんですが、「Readable」を開発しようと思った理由はなんでしょうか?

佐藤:研究者は日々たくさん論文を読みますが、僕はその中でもよく読む方だと思います。博士課程で時間があることもあり、1日必ず1本は読むようにして、平均すると2本くらいでしょうか。ときには1日中、8~10時間くらい読むこともあります。そうすると、この論文を読むことを少しでも効率化できれば、もっとクリエイティビティの部分に工数を割くことができるようになるのではないかと。より効率的に質を落とさず論文を読みたいという想いで開発しました。

-論文を読むのに、「DeepL」にコピーペーストをして読んでいる研究者はかなり多いと思いますが、研究者目線で、どのような点を改善したいと思ったのですか? また、日本語と英語が左右で表示されることも「Readable」のユニークな点だと思いますが、そのようにした理由は何ですか?

かなり正確にレイアウトを保って翻訳することができます

佐藤:コピーペーストで翻訳して、少し読んで、また翻訳してだと、やはり時間がかかるのでイライラするし、一旦思考が中断してしまうのが難点です。ページが丸ごと翻訳されたものが手に入れば、思考が中断されることなく最初から最後まで読むことができていいですよね。

それとレイアウトを保って左右に出すということについては、機械の翻訳システムはまだ完璧ではなくて、特に式が入ったり、ちょっと専門的な内容になると、意味の通じない翻訳結果を出してしまいがちです。そういった時に、左右で同じ位置に表示されていれば、対応する原文をすぐに確認することができます。わかりにくいなと思った時に、元がどこだったかをスクロールして探すとなるとフラストレーションが溜まりますが、一瞬でぱっと原文に戻ることができると便利ではないかと思い、そのような表示にしました。

-やはり普段から論文を数多く読んでいる人ならではの視点ですね。

佐藤:確かにそうですね。図や表の位置も結構重要ですからね。実は、速読を念頭に置いてやっているんです。20ページぐらいの論文を大体1時間ぐらいで、ざっと何が書いてあるのかを押さえる。研究者だとそんな必要に迫られることもあります。査読を依頼された時に、自分がマッチしているかをすぐに判断して返信しなければいけないケースなどに、パパッと日本語と英語と見てすぐに判断ができるというのはとても便利です。僕も査読をする際は「Readable」を使っています。

-今、20ページぐらいの論文の内容を1時間ぐらいで把握するとおっしゃっていましたが、普通に英語で読む場合、1本にどれくらいの時間がかかるものなのでしょうか。

佐藤:そこまで違いが出るわけではないです。自慢ではありませんが、僕も英語はできる方で、速読もできます。ですから、全部英語で読むのと比べて、「Readable」を使うと1時間半が1時間になるとか、1時間20分が1時間になるとか、まあ10~20%速くなるという程度でしょうか。読む本数が重なってくると、その小さな差が積み重なって、効いてくるという感じですね。

-ご自身がより効率的に論文を読むために開発されたという「Readable」ですが、どんな人がどんな場面で使うことをイメージしていますか?

佐藤:ひとつは、博士になりたてだったり、学部で研究室に配属されたてで、英語論文に慣れていない人ですかね。初めて英語の論文を読む人は、最初はけっこう抵抗があると思います。そのストレスを和らげる、補助輪的な使い方が考えられます。もうひとつは、僕も含めて、現役バリバリで論文を読みまくり、査読などでも大量に捌かないといけない人たちでしょうか。その両方で「Readable」は使えると思います。

元々は自分で使うために作った「Readable」ですが、公開してものすごい反響があり、驚いているというのが正直なところです。いろいろな方から反応をいただき、日本語から英語ができないかとか、中国語でも使えるのかとか、お問い合わせもいただいています。自分が気づかなかった需要があることもわかり、今後に活かしていければと思っています。

-「Readable」が今後さらに発展していくのを楽しみにしています。この「Readable」もまずはTwitter上で話題になりましたが、情報やツールの公開など、佐藤さんはTwitterでの発信も積極的にされています。そこにはどんな意図があるのでしょうか?

佐藤:そうですね。まずは、研究者コミュニティは1つのコミュニティというか、団結してみんなでいいものを作っていこうと思っているので、そこにできるだけ貢献したいという想いです。論文出版という形も1つの貢献だと思いますが、それ以外にもツールを作るとか、わかりやすいブログ記事や解説を書くとか、そういうところも1つの貢献だと思っています。いかに研究者コミュニティに貢献できるかが研究者として1番重要だという信念のもとでやっているというのがひとつです。

もう1つはもうちょっと下心というか(笑)、いろいろな人に知ってもらえれば、例えば引用されたり、企業や研究者の人に知ってもらえば、アカデミアや民間企業も含めてキャリアやポジションが開ける可能性もあるかもしれないというところで、積極的に宣伝活動をしているという側面もあります。
宣伝活動といっても、できるだけ多くの人に自分の活動を知ってもらおうということで。Twitterで自分の研究紹介をする感じですね。研究費が使えるかは微妙だったので、自分のポケットマネーでTwitter広告を打ってみたこともあります。それを元に、自分の研究をプロモーションする効果についての記事を書いたり、そんな活動もしていました。Twitterで投稿したものの中には、専門的な研究内容ながら23万インプレッション、224リツイート、1000いいねを獲得したものもあり、できるだけわかりやすく発表して、いろいろな人に見てもらうということを続けている感じですね。

-そういった活動を個人でやられている方は珍しいですよね。今後もどんな情報が発信されていくのか楽しみですが、そんな佐藤さんが今「こんなツールがあったらいいな」と考えているのはどんなことでしょうか?

佐藤:最近思っているのは、文献を調べる際、今ではGoogle Scholar‬などいろいろな文献検索サービスがあるので、がんばれば調べることはできますよね。ただ、1日探して2日探して、ようやく見つかるなんてこともありますし、なんでこれが最初から見つからなかったんだろうなんてことも。いろいろなサービスが登場して、できないことはなくなってきましたが、細かい点での不満はいろいろあります。
例えばGoogle Scholar‬の場合。この検索結果はGoogleが決めているわけですよね。それを「こういうふうに並び替えられればいいのに」と思っても、Google側が対処してくれないとダメなわけです。それをユーザー側でなにか結果をうまく変える方法がないかなと。
研究者にとって、こういう検索のやり方が欲しいとか、こういう並び方で論文が出てきたらうれしいというのは、それぞれでやはり違うと思います。それぞれの人に合った探し方とかをもう少し柔軟に対応してくれるようなものがあるといいですね。
今自分が研究している推薦システムや検索システムで、そういうところでも良いものができたらいいなと思っています。

-本日は貴重なお話をありがとうございました。

よかったらシェアしてね!

この記事を書いた人

エディテージはカクタス・コミュニケーションズが運営するサービスブランドです。学術論文校正・校閲、学術翻訳、論文投稿支援、テープ起こし・ナレーションといった全方位的な出版支援ソリューションを提供しています。

目次