Penjanaan bahasa semula jadi ialah teknologi kecerdasan buatan yang menukar data kepada teks bahasa semula jadi. Dalam era data besar hari ini, semakin banyak perniagaan perlu menggambarkan atau mempersembahkan data kepada pengguna, dan penjanaan bahasa semula jadi ialah kaedah yang sangat berkesan. PHP ialah bahasa skrip sebelah pelayan yang sangat popular yang boleh digunakan untuk membangunkan aplikasi web. Artikel ini akan memperkenalkan secara ringkas cara menggunakan PHP untuk penjanaan bahasa semula jadi asas.
Pustaka fungsi PHP sendiri tidak termasuk fungsi yang diperlukan untuk penjanaan bahasa semula jadi, jadi kami perlu memperkenalkan beberapa perpustakaan penjanaan bahasa semula jadi PHP . Antara yang lebih biasa digunakan ialah:
Pustaka ini biasanya disediakan sebagai sambungan PHP, jadi anda perlu memasangnya dan memasukkannya ke dalam kod anda.
Sebelum penjanaan bahasa semula jadi, biasanya perlu mentakrifkan beberapa templat. Templat ialah sekeping teks yang mengandungi ruang letak yang akan digantikan dengan data sebenar dalam kod. Sebagai contoh, berikut ialah templat mudah:
在{{地点}}出现了{{数量}}只{{动物}},它们挤满了{{人群}}。
Templat ini mengandungi tiga ruang letak: tempat, kuantiti dan haiwan. Dalam kod, kami akan menggantikan ruang letak ini dengan data sebenar.
Untuk menjana teks bahasa semula jadi menggunakan perpustakaan PHP kita perlu melakukan langkah berikut:
Berikut ialah contoh kod menggunakan perpustakaan SimpleNLG:
use simplenlgrameworkSPhraseSpec; use simplenlglexiconXMLLexicon; use simplenlg lxsentencesRealiser; $lexicon = new XMLLexicon(); $realiser = new Realiser($lexicon); $sentence = new SPhraseSpec(); $sentence->setSubject("你"); $sentence->setVerb("吃"); $sentence->setObject("苹果"); $text = $realiser->realiseSentence($sentence);
Dalam contoh ini, kami menggunakan perpustakaan SimpleNLG untuk menjana ayat bahasa Inggeris mudah, "You ate the apple" . Mula-mula, kami mencipta objek tesaurus XML dan objek Realiser. Kemudian, kami mencipta objek SPhraseSpec untuk mewakili ayat yang ingin kami hasilkan, menetapkan subjek, predikat dan objeknya. Akhir sekali, kami memanggil kaedah realizeSentence objek Realiser untuk mendapatkan ayat bahasa Inggeris terakhir.
Setelah kami mempunyai teks bahasa semula jadi, kami perlu menggantikan ruang letak dengan data sebenar. Sebagai contoh, jika kami menggunakan templat yang ditakrifkan di atas, kami boleh menggantikan ruang letak seperti ini:
$template = "在{{地点}}出现了{{数量}}只{{动物}},它们挤满了{{人群}}。"; $data = [ "地点" => "动物园", "数量" => 10, "动物" => "大象", "人群" => "游客" ]; $text = str_replace(array_map(function($key) { return "{{{$key}}}"; }, array_keys($data)), array_values($data), $template);
Dalam kod ini, kami mentakrifkan tatasusunan data yang mengandungi data sebenar yang kami mahu gantikan pemegang tempat itu. Kemudian, kami menggunakan fungsi str_replace untuk menggantikan ruang letak dengan data. Perhatikan bahawa kami menggunakan fungsi array_map dan array_keys untuk menjana tatasusunan ruang letak, dan fungsi array_values untuk mendapatkan nilai daripada tatasusunan data.
Akhir sekali, kita boleh menggabungkan langkah-langkah di atas untuk mencapai penjanaan bahasa semula jadi. Sebagai contoh, kami boleh merujuk data dalam pangkalan data dalam templat:
$template = "{{城市}}长{{长度}}公里,共有{{人口}}人。"; $query = "SELECT * FROM cities WHERE name='上海'"; $data = $pdo->query($query)->fetch(); $text = str_replace(array_map(function($key) { return "{{{$key}}}"; }, array_keys($data)), array_values($data), $template); echo $text;
Dalam contoh ini, kami mentakrifkan pernyataan pertanyaan untuk mendapatkan maklumat tentang bandar Shanghai daripada pangkalan data. Kami kemudian menggabungkan data yang diperoleh dengan templat, menggunakan fungsi str_replace untuk menggantikan ruang letak dengan data sebenar, dan akhirnya menjana teks bahasa semula jadi.
Ringkasan
Artikel ini memperkenalkan cara menggunakan PHP untuk penjanaan bahasa semula jadi asas, termasuk mencipta templat, menggunakan perpustakaan PHP untuk menjana teks, menggantikan ruang letak dan menjana teks bahasa semula jadi. Walaupun teknik ini hanya sebahagian daripada penjanaan bahasa semula jadi, teknik ini sangat berguna untuk mengendalikan beberapa tugas asas rendering teks bahasa semula jadi. Pada masa yang sama, perhatian juga harus diberikan kepada ketepatan dan keselamatan data untuk mengelakkan kebocoran maklumat sensitif.
Atas ialah kandungan terperinci Bagaimana untuk melakukan penjanaan bahasa semula jadi asas menggunakan PHP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!