近年の AI の進歩により、論文の読み方も大きく変化を遂げました。AI を活用することで以前と比べてはるかに簡単かつ早く論文が読めるようになりました。
以前私の個人ブログにて、論文の読み方やまとめ方を紹介しました。その時には要約ツールは用いていませんでしたが、最近はすっかり要約ツールを多用するようになりました。
本稿では、最新の AI を使った論文の読み方を丁寧に紹介します。
目次
本稿でおすすめするのは ChatGPT か Claude で要約を生成して論文の概要をつかみ、Readable で精読するという方法です。ChatGPT や Claude では単に全体の要約を生成するだけでなく、肝となる箇所を特定したり理解するためにも用います。具体的な手順については後の項で解説します。
私が特定のテーマについて調査を行う場合には、テーマに関係する論文を被引用数の多いものを中心に 10 本ほど選び、それぞれの要約を生成し、要約結果を基に精読する論文の選定と精読する順番を決めています。候補論文の選び方については私の個人ブログで詳しく述べたので参考にしてください。
精読論文の選定の基準は、要約を読んで面白いと思ったかどうかが第一です。面白ければ、仮に要約を読んで内容を完全に理解したと思っても、要約で終わりにはせずに精読に進みます。これは要約では本当に面白い論文を味わい尽くせないというのが理由です。10 万文字の論文を 1000 文字に要約すると 100 倍早く読める点が嬉しいわけですが、その代償として 9 万 9 千文字分のディテールは省かれます。これはどのような要約であれ本質的に存在する限界です。いかに生成 AI が発達してもこの要約の本質的な限界を乗り越えることはできません。そして、良い論文というのは、この 9 万 9 千文字分のディテールにこそ価値のある知見が組み込まれていたりするものです。本当に素晴らしい論文であれば、10 回読み返してもなお新しい発見があります。これは 10 万文字を 100 万文字で読んでいることになるので、0.1 倍の要約(逆方向の要約)とも言えますが、それでも価値があります。特に初心者のうちは、こうしたディテールから著者の息遣いを感じ取ることが研究の上達の近道であると思います。なので、要約から何か光るものを感じとった場合には、仮に要約を読んで内容を完全に理解したと思っても要約で終わりにせず、精読に進むことをおすすめします。
精読論文の選定の他の基準としては、そのテーマにとってのマイルストーン的な研究かどうかということもあります。例えば、被引用数が数万件となるような論文は、主張の概要だけでなく細かなテキストまで読み込むのが分野の常識となっている可能性があります。そのような研究は、仮に自分が面白いと思わなかったとしても、他の論文を理解したり自分の研究を進める上で必要なので、原文を精読しておくことが望ましいでしょう。
私の場合、要約から精読に進む論文は全体の 3 割くらいです。
精読せず要約で終わった論文は自分の中では読んだ論文のカウントには含めていません。そもそも面白そうだと思わなかった論文であり、自分のプラスにはなっていないからです。仮に要約を読んだだけでその論文を理解できたとしても、その程度で理解できる論文は自分のコンフォートゾーンの中にあるものなので、理解したとしても成長にはつながっていません。したがって要約だけで終わった論文だけを考えると、生産性には寄与していないことになります。
しかし、プロセス全体を考慮に入れると、要約ツールにより論文を読む生産性は大いに向上したと感じています。第一に、精読する論文の質が大きく上がりました。これまでは、精読したもののイマイチだったという経験がよくありました。これでは精読にかけた時間がもったいないです。要約を基に選定することで、イマイチな論文を掴まされる割合が大きく減少しました。逆に言えば、要約による選定のおかげで、自分の糧となる論文を多く精読できるようになりました。第二に、先に要約を読んでおくことで、精読に進んだときの理解も早くなりました。これにより、精読にかかる時間も短くなり、結果として読める論文の数も増えました。
以下の章では、実際に ChatGPT や Claude を使って論文の要約を生成する方法を紹介します。
ChatGPT Plus により利用できる GPT-4 では PDF ファイルを添付できます。この機能を用いた論文要約は以下の手順でシンプルに実現可能です。
たったこれだけです。以前は PDF 読み込みの精度が悪かったので工夫が必要でしたが、最近はこれだけでちゃんと上手くいきます。
命令文(プロンプト)は何を使っても大きな違いはありません。間違えると罰則を与えると脅す方がよい、などと言われることがあり、実際にそういう研究結果もあります [Bsharat+ 2023] が、使っていてあまり違いは感じません。最近の AI は平易な言葉でも良い結果が出るようにうまく訓練されているので、あまり深く考えすぎるよりも、「日本語で要約して」などとストレートに命令するのが良いと思います。
自分の専門外の論文など、内容が難しくて分からない場合には、「私を5歳児だと思って分かりやすく説明して」と命令するのも有用です。
海外のインターネット掲示板(Reddit など)では Explain Like I’m 5.(私を5歳児だと思って分かりやすく説明して)という文化があります。最近の AI はこれらのやりとりを大量に学習しています。また、専門的な話になりますが、この5歳児向けの説明能力は AI の能力を測るベンチマークとしても利用されることがよくあり、AI によってはこの能力にチューニングされていることもあります。要約が難しすぎる場合には、このようにレベル感を命令に含めるのは有用でしょう。
また、キャラクターを設定することでモチベーションを高めるというやり方も提案されています [@amachino 2023, @currypurin 2023]。
キャラクターの設定を永続化させたい場合は、画面左下の自分の名前をクリック → Customize ChatGPT をクリック → How would you like ChatGPT to respond? に「ギャルの友達みたいに元気に説明して!」などと入力することで設定可能です。
仕事として毎日論文を読む場合にはかえって煩わしくなるかもしれませんが、たまにこのように工夫を行うともモチベーションを高めるのに役立ちそうです。
また、ChatGPT は全体要約以外にも使うことができます。一般に、論文を読むときには
A. 何の問題を解こうとしているのか
B. どうやってその問題を解いたのか
C. 問題を解いた結果どうなったのか
を理解することが重要です。その分野に馴染みがないうちは A と C を、慣れてくると(前提と結果は自ずと見えてくるので)B を重点的に調べるのが良いでしょう。例えば B を知りたい場合には、要約を生成した直後に「手法の手順を具体的に説明して」などと入力すると、細かく説明してくれます。
ChatGPT Plus はとても便利であるものの、月額 20 ドル(約 3000 円)を学生が支払うのは難しいかもしれません。本節では無料版を使った読み方についても解説します。
無料版で使うことのできる GPT 3.5 では残念ながら PDF には対応していません。しかし、論文テキストを貼り付けることで要約を生成してもらうことは可能です。
長さの制限はありますが、数ページであれば一回で要約してくれます。章単位で要約してもらうと理解もしやすいでしょう。
PDF のテキストをコピペすると改行や数式がおかしくなってしまいますが、手で修正する必要はありません。そのまま貼り付けてください。最近の AI は改行などのノイズが入っていても、正しく読み取ってくれます。
PDF をいちいち保存するよりも全文コピペした方が楽なこともあるので、ChatGPT Plus を利用している方もこの方法は有用です。
続けて「手法の手順を具体的に説明して」などと他の質問ができるのも PDF を貼り付けた場合と同様です。
Claude は Anthropic 社が開発した生成 AI です。機能や価格は ChatGPT とほとんど同じです。使い方も ChatGPT とほとんど同じであり、PDF を添付して命令することで要約してくれます。
今から使い始める方は Claude をおすすめします。
ChatGPT と Claude の大きな違いは、Claude は無料版でも PDF などのファイルを貼り付けられることです。このため、無料版を使う方は Claude が便利でしょう。
要約の質についても、現状では僅かながら Claude の方が良いように感じます。
ただし、違いはごく些細なものであり、今後の開発状況によっても逆転する可能性は大いにあります。既に ChatGPT を使っている場合は必ずしも乗り換える必要はなく、様々な理由からどちらを使うか迷った場合もエイヤと決めてしまってよいと思います。
また、予算に余裕がある場合には両方とも契約することをおすすめします。有料版も使用回数の上限があり、大量に論文を読む場合にはすぐに上限に達してしまいます。そのような場合にもう一方のサービスが使えると研究がストップしてしまう事態を避けられます。また、文献によって得意不得意があるため、片方でうまくいかない場合にもう片方で試すといった使い方も可能です。
論文には論文要旨 (abstract) というものが必ず付いています。個人ブログでも述べたように、以前は私も要約ツールは使わずに、論文要旨を読んで概要を掴むというやり方を採用していました。しかし、現在は要約ツールに利があると考えています。
第一に、論文要旨は論文の良い面しか書かれていないことが多いということ。論文要旨は著者らが書いたものなので、良い方向にバイアスがかかっています。特に論文要旨は文字数の制限が厳しいこともあり、良い面と悪い面のどちらを削るかとなると悪い面が削られることが多いです。しかし、研究の質を測る上では、論文中に限界点も議論されているか、そしてそれはどの程度の限界かを見極めることも重要です。これは論文要旨を読むだけでは分かりません。第二に、論文要旨は固定的なものなのに対して、ChatGPT などを使うと適応的な対話ができます。上に述べたように、手法の詳細など、自分が知りたい箇所を掘り下げることができます。各々、研究において重視する点も異なるでしょうし、対象論文によっても掘り下げるべき箇所は変わってくるので、適応的に探索ができることは大いに利があります。第三に、ChatGPT による要約はかなり手軽になったので、論文要旨を翻訳して読むのと手間がほとんど変わらなくなったということです。最初に論文要旨を読み、そのあとで ChatGPT で対話による探索をするのは二度手間に感じるようになりました。論文を開いて直ちに ChatGPT に投げるコストはほとんどなく、そうしておけば、要約を読んでそのまま対話を続けてスムーズに探索を開始でき、論文を取捨選択する時間を大きく削減できるようになりました。
ChatGPT や Claude は非常に便利ですが、いくつか注意点があります。
第一に、ChatGPT や Claude は間違ったことを生成する可能性があります。いわゆるハルシネーション(幻覚)です。要約をさせるときには基づいた文献があるので比較的ハルシネーションは起こりづらいですが、追加で質問を行ったときなどには論文中に無いことを勝手にでっち上げる可能性があります。
AI に限らず、記述を鵜呑みにしないことは研究において非常に重要です。アルブレヒト・デューラーのインドサイという有名な例があります。デューラーはルネサンス期のドイツの有名な画家です。彼が 1515 年に描いたインドサイは非常に美しく、ヨーロッパ中で評判となりました。
問題は、デューラーはインドサイの実物を見たことが無かったということです。彼は作者不明のインドサイのスケッチを基にこの作品を作成しました。そのため、このインドサイは現実のインドサイには存在しない「幻覚」が数多くあります。肩(RHINOGERVS の R の近く)にある二つ目の小さな角はインドサイには存在しません。足を覆う鱗も存在しません。また、現実のインドサイの胴体はこれよりも遥かに長いです。
ここまでならまだよいのですが、大きな問題は、デューラーのインドサイがあまりにも有名になったために、以降 200 年以上にわたり、デューラーのインドサイが正しいインドサイの姿だとヨーロッパ人が勘違いしたことです。このデューラーのインドサイはコンラート・ゲスナーの著書『動物誌』でも複製され、フィレンツェの僭主アレッサンドロ・デ・メディチのエンブレムにもなりました。
ここまで多くの人に受容されるということは画家にとっては名誉である反面、誤った姿をここまで広めてしまったということは不名誉でもあります。事実、彼は優れた画家でしたが、偽りのインドサイを広めたことは現代まで語られ続けてしまっています。一度誤った記述が広まってしまうと、それを修正することも一苦労です。AI が作り出した「幻覚のツノ」をあなたが広めてしまうことになるかもしれません。気をつけましょう。
研究において記述を鵜呑みにしない大切さについてはイーモン・ケオの How to do good research, get published in SIGKDD and get it cited! を参照することをおすすめします。上記のサイの例もこちらの文献で知りました。なお、ケオのスライドでは “The drawing is remarkably accurate, except that there is a spurious horn on the shoulder(この絵は、肩に偽のツノがあることを除けば、とても正確である)” となっていますが、この記述は誤りです。先程も述べたように、肩のツノ以外にも、ウロコや体長など正確でない部分があります。私がケオの記述を鵜呑みにしたら、誤った情報を皆さんに伝えていたかもしれません。この例からもメタ的に、記述を鵜呑みにせずに、検証をしてから利用する重要性がわかります。
ChatGPT を用いる第二の注意点は、要約はディテールを省略してしまうことです。冒頭でも述べましたが、良い論文というのはディテールにも有用な知見が詰まっています。良い論文を要約だけで済ませたり、研究者本人の含蓄のある言葉を AI の淡白な言葉で置き換えてしまうことはもったいないです。重要な論文ほど、原典を読み込むことをおすすめします。
ChatGPT と Claude は非常に有用であるものの、これらだけでは原典を精読できません。以下では Readable を用いて原典を読み込む方法を紹介します。
Readable は レイアウトを保ったまま PDF を翻訳するサービスです。以下のように、図表がある場合や 2 カラムの場合でも、しっかりレイアウトを保ったまま翻訳し、対訳見開きで表示してくれます。
対訳見開き機能が非常に便利で、さまざまな使い方が可能です。
基本的な使い方は、左側の日本語を読み進め、分からない箇所や重要な箇所に差し掛かると原典にあたるというものです。これにより、大幅に時短ができるほか、日本語で読み始められるので論文を読むハードルもグッと下がります。また、対応する原文を確認するのも、ページをパラパラめくる必要がなく、目線を右に水平移動するだけなので、非常にスムーズです。
逆に、基本的には右側の英語を読み進め、関連研究の説明など重要性が低い箇所に差し掛かると日本語で飛ばし読みをするという読み方も可能です。読む日本語と英語の割合は慣れの度合いによって柔軟に調整するとよいでしょう。
また、要約で気になった箇所があれば、その点を書き抜いてもらい、対応する箇所を論文で確認することも可能です。
あとはこの英語をコピーして PDF 上で検索すれば論文中で対応する箇所を見つけられます。
英語が非常に得意な人であっても、日本語で読めるメリットは大きいです。私も TOEIC リーディングを満点取る程度には英語が得意ですが、それでも日本語の方が圧倒的に読みやすいです。特に、日本語は漢字のおかげで流し読みが非常にしやすいです。文字の形を基に単語を探すこともできます。これは欧米の研究者には真似のできない日本人ならではのメリットです。これまでは、論文読解は英語ネイティブの研究者が圧倒的に有利でしたが、Readable を用いることで、英語ネイティブよりも日本語ネイティブの方がむしろ有利に論文読解を進めることが可能となるのです。
Readable 有料版は月額 980 円または年額 9800 円であり、学生でも手が届くほど安価です。毎月 1 本論文を読む場合でも、Readable で読む時間が 1 時間短縮できれば十分元が取れます。また、翻訳本数は無制限なので、たくさん論文を読む専門家の方にとっても有用です。Readable 有料版を研究費で購入する方法は後述します。
研究者によっては、これらのツールのアシストを使わずに、英語の原文だけで論文を読むべき(少なくとも読めるようにはなるべき)だと考える方もいます。翻訳ツールの使用を禁止する研究室もあるようです。
原文で読むメリットはたしかに多いです。第一に、自分で論文を書くときに役立ちます。研究者になるためには英語で論文をいくつも書かなくてはなりません。原文で論文を読むと、論文特有の言い回しやリズムを身につけることができます。論文の英語はかなりクセがありますし、分野によってもクセが違います。英語ネイティブの人でも、訓練をしないと英語で論文を書けません。これは研究職でない日本人が日本語で論文を書けないことからも想像ができるかと思います。最近は ChatGPT などを使って英作文ができるようにもなりましたが、その分野特有の雰囲気までは再現できません。専門家であれば、専門外の英語ネイティブの人が書いた論文や、ChatGPT が書いた論文は書き方のクセなどからすぐに見分けることができます。私は英語ネイティブではありませんが、自分の専門分野であれば、アメリカの平均的な大学生よりは上手く英語で論文を書ける自信があります。これは原文でいくつも論文を読んできて、論文特有の言い回しを身につけてきたからです。第二に、何度か述べているように、原文ならではのディテールから知見が得られることもよくあります。原文から機微を察せられるようになることは、研究内容を深く理解する上でも、自分が論文を書く上でも重要です。
私の意見は、研究者を目指すのであれば原文で読めるようにはなるべき、研究者を目指さないのであれば必ずしも必要はない、というものです。また、読めるようにはなるべきとは言っても、常に原文で読む必要はなく、アシストありの状態から徐々にアシストを外して読めるようにしたり、速読が必要な場合には気にせずアシストをフル活用すると良いと考えています。また、冒頭で述べたように要約などを駆使して読む論文を選定することも有用です。
研究者を目指さない学生の場合、もちろん原文で読めるようになることが理想ではあるものの、ツールを使って読むというのが現実的だと思います。
大学のうちに身につけておくべき論文に関するスキルは、最も重要なのが正しい文献を選ぶスキル、第二に文献を正確に読むスキルだと考えています。いくら論文を正しく読めるようになっても、論文自体が間違えていては話になりません。しかも残念なことに、品質の高い論文よりも品質の低い論文の数の方が圧倒的に多いのが現実です。ガラクタの山から品質の高い論文を探し出すということがどうしても必要です。その能力を身につけるためには、たくさん論文を読んで、論文どうしを比較し、良し悪しを見分けられるようになるしかありません。どれだけ丁寧に読んでも、1 本しか読まなければその論文自体が正しいか間違えているかを判別するのは困難です。たくさんの文献の中に位置づけることではじめてその文献の意義や正確さが見えてくるものです。しかし、研究者を目指さない学生の場合だとそう何本も論文を読む時間は取れないでしょう。時間が限られているのであれば、ツールを使いながらできるだけ多く読むというのが現実路線だと思います。
本稿で紹介した ChatGPT と Readable を組み合わせる方法は、現実的な時間制限と丁寧に読みこむトレードオフをうまく制御することができます。どうしても研究に時間が取れない場合には、ChatGPT などの要約で読むのが最も時短になります。厳選した論文を Readable の日本語側で読むというのが次いで楽な方法、そこから徐々に英語側の割合を増やしていくことで正確な読み込みが可能になっていきます。研究者を目指す方であれば、この順に徐々に移行して原典で読むことに慣れていくトレーニングをすることもできます。最初は Readable の日本語側を補助輪として使い、徐々に英語側の割合を増やしていけば、徐々に英語の原文で読めるようになっていくでしょう。
結局、原文で読めるようになることが理想ではあるものの、現実的にはツールの補助を活用せざるを得ない場合もありますし、読めるようになることを目指すにしても、ツールを一括で禁止するのではなく、ツールを活用しながら上手に訓練することが重要です。
最後に、研究費でこれらのサービスを利用する方法を紹介します。
ChatGPT と Claude は月額 20 ドルのクレジットカード払いのみ対応しています。年払いや請求書払いには対応していません。研究費で利用する場合には、研究者が立替を行う必要がある場合が多いでしょう。研究機関によっては、この手続きは面倒かもしれません。先日、OpenAI が日本法人を設立したので、このあたりの事務的な手続きが今後改善されることに期待しましょう。
Readable は様々な支払い方法に対応してます。最も基本的なのは月額か年額でのクレジットカード払いですが、請求書払いにも対応しています。請求書払いをご希望の方はお問い合わせフォームより見積もりの依頼をお送りください。また、研究室単位や部署単位での複数アカウントの見積もりや、複数年のアカウントの見積もり、年度末までのアカウントの見積もりなどにも対応しています。多数のアカウントをご利用の場合は割引もありますのでご相談ください。
本稿では最新の AI を使った論文の読み方を紹介しました。AI を用いると早く、高速に論文を読むことができるようになります。論文を選定して質の高い論文を選ぶためにも AI は便利です。また、単に楽して読むだけでなく、慣れの度合いにあわせて、より丁寧に読んでいくことも可能ですし、研究者としての読み方を身につけることにも活用できます。AI を使って快適な研究ライフをお送りください。
京都大学情報学研究科博士課程修了。博士(情報学)。現在、国立情報学研究所 情報学プリンシプル系 助教。Readable を開発・運営している。専門は機械学習とデータマイニング。著書に『最適輸送の理論とアルゴリズム』『グラフニューラルネットワーク』がある(ともに講談社)。
連絡先:@joisino_ / https://joisino.net
2024/04/17
# 研究・論文
2024/5/23
# 研究・論文
2024/4/24
# 研究・論文
2024/5/14
# 研究・論文
2024/7/15
# 研究・論文