論文を読むことは私たちの日常業務の一つとも言えますが、論文の数が多すぎるのですが、どうすれば早く読んで要約できるでしょうか? ChatGPT の登場以来、論文を読むために利用できるサービスがたくさんあります。実際、ChatGPT API の使用は非常に簡単で、わずか 30 行の Python コードで独自のアプリケーションをローカルに構築できます。
論文を読むことは私たちの日常業務の一つとも言えますが、論文の数が多すぎます。どうすれば早く読んで要約できるでしょうか? ChatGPT の登場以来、論文を読むために利用できるサービスがたくさんあります。実際、ChatGPT API の使用は非常に簡単で、わずか 30 行の Python コードで独自のアプリケーションをローカルに構築できます。
Python と ChatGPT API を使用して論文を要約する手順は簡単です:
import PyPDF2
import openai
pdf_summary_text = ""
Parse pdf
pdf_file_path = "./pdfs/paper.pdf"
pdf_file = open(pdf_file_path, 'rb')
pdf_reader = PyPDF2.PdfReader(pdf_file)
各ページのテキストを取得します:
for page_num in range(len(pdf_reader. Pages)):
page_text = pdf_reader.pages[page_num].extract_text(). lower()
概要には openai の API を使用します
response = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "あなたは役に立つ研究助手です。"},
{" role ": "user", "content": f"これを要約します: {page_text}"},
],
)
page_summary = response["choices"][0]["message"] [ "content"]
概要をマージ
pdf_summary_text = page_summary "n"
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], "_summary.txt " )
with open(pdf_summary_file, "w ") as file:
file.write(pdf_summary_text)
完了、PDF ファイルを閉じてメモリをリサイクルします
pdf_file.close( )
完全なコードは次のとおりです:
import os
import PyPDF2
import re
import openai
# ここでは、次のことを想定しています。 Jupiter Notebook を指定し、URL
!curl -o Paper.pdf https://arxiv.org/pdf/2301.00810v3.pdf?utm_source=pocket_saves
# から紙を直接ダウンロードします。概要が含まれます
pdf_summary_text = ""
# PDF ファイルを開きます
pdf_file_path = "paper.pdf"
# PyPDF2 を使用して PDF ファイルを読み取ります
pdf_file = open(pdf_file_path, 'rb ')
pdf_reader = PyPDF2.PdfReader(pdf_file)
# PDF ファイル内のすべてのページをループします
for page_num in range(len(pdf_reader.pages)):
# からテキストを抽出しますページ
page_text = pdf_reader.pages[page_num].extract_text(). lower()
response = openai.ChatCompletion.create(
model="gpt-3.5-turbo",##) #messages= [
{"role": "system", "content": "あなたは有能な研究助手です。"},
{"role": "user", "content": f"要約これ: { page_text}"},
],
)
page_summary = response["choices"][0]["message"]["content"]
pdf_summary_text =page_summary "n"
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], "_summary.txt")
with open(pdf_summary_file, "w ") as file:
file.write(pdf_summary_text )
pdf_file.close()
with open(pdf_summary_file, "r") as file:
print(file.read())
2つあります注意事項 事項:
以上が30 行の Python コードで ChatGPT API を呼び出し、論文の主な内容を要約できます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。