Membaca kertas boleh dikatakan sebagai salah satu tugas harian kita. Terdapat terlalu banyak kertas kerja. Sejak kemunculan ChatGPT, terdapat banyak perkhidmatan yang tersedia untuk membaca kertas. Sebenarnya, menggunakan API ChatGPT adalah sangat mudah Kita boleh membina aplikasi kita sendiri secara tempatan dengan hanya 30 baris kod python.
Membaca kertas boleh dikatakan sebagai salah satu tugas harian kita. Sejak kemunculan ChatGPT, terdapat banyak perkhidmatan yang tersedia untuk membaca kertas. Sebenarnya, menggunakan API ChatGPT adalah sangat mudah Kita boleh membina aplikasi kita sendiri secara tempatan dengan hanya 30 baris kod python.
Langkah-langkah untuk meringkaskan kertas menggunakan Python dan ChatGPT API adalah mudah:
import PyPDF2
import openai
pdf_summary_text = ""
Parse pdf
pdf_file_path = "./pdfs/paper.pdf"
pdf_file = open(pdf_file_path, 'rb')
pdf_reader = PyPDF2.PdfReader(pdf_file)
Dapatkan teks setiap halaman:
untuk page_num dalam julat(len(pdf_reader. pages)):
page_text = pdf_reader.pages[page_num].extract_text().lower()
Gunakan API openai untuk ringkasan
respon = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
message=[
{"role": "system", "content": "Anda ialah pembantu penyelidik yang membantu."},
{" peranan ": "user", "content": f"Ringkaskan ini: {page_text}"},
],
)
page_summary = response["choices"][0]["message"] [ "kandungan"]
Gabungkan ringkasan
pdf_summary_text += page_summary + "n"
pdf_summary_file = pdf_file_path.replace(os.path.slitext(pdf_file_path)[1], "._summary txt")
dengan buka(pdf_summary_file, "w+") sebagai fail:
file.write(pdf_summary_text)
Selesai, tutup fail pdf dan kitar semula memori
pdf_file. close()
Kod lengkap adalah seperti berikut:
import os
import PyPDF2
import semula
import openai
# Di sini saya anggap anda berada pada Buku Nota Musytari dan muat turun kertas itu terus daripada URL
!curl -o paper.pdf https://arxiv.org/pdf/2301.00810v3.pdf?utm_source=pocket_saves
# Tetapkan rentetan yang akan mengandungi ringkasan
pdf_summary_text = ""
# Buka fail PDF
pdf_file_path = "paper.pdf"
# Baca fail PDF menggunakan PyPDF2
pdf_file = open(pdf_file_path, 'rb' )
pdf_reader = PyPDF2.PdfReader(pdf_file)
# Gelung semua halaman dalam fail PDF
untuk page_num dalam julat(len(pdf_reader.pages)):
# Ekstrak teks daripada halaman
page_text = pdf_reader.pages[page_num].extract_text().lower()
respons = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "Anda ialah pembantu penyelidik yang membantu."},
{"role": "user", "content": f "Ringkaskan ini : {page_text}"},
],
)
page_summary = response["choices"][0]["message"]["content"]
pdf_summary_text+=page_summary + "n"
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], "_summary.txt")
dengan open(pdf_summary_file, "w+") sebagai fail:
fail. tulis(pdf_summary_text )
pdf_file.close()
dengan open(pdf_summary_file, "r") sebagai fail:
print(file.read())
Perlu penjelasan Terdapat dua perkara:
1 Had panggilan API percuma bagi openai adalah terhad 🎜>
2. boleh cuba muat naik carta kertas untuk melihat jika akan ada keputusan yang lebih baik (Tidak pasti)Atas ialah kandungan terperinci 30 baris kod Python boleh memanggil API ChatGPT untuk meringkaskan kandungan utama kertas itu. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!