Dengan pembangunan Internet, banyak pembangun telah mula menggunakan Node.js untuk pembangunan back-end. Walau bagaimanapun, sesetengah pembangun akan menghadapi masalah aksara Cina bercelaru apabila menggunakan Node.js untuk menerima aksara Cina. Soalan ini mengelirukan dan sukar. Artikel ini akan memperkenalkan masalah aksara Cina bercelaru yang diterima oleh Node.js dan menyediakan beberapa penyelesaian.
Penerangan Masalah
Apabila menggunakan Node.js untuk menerima permintaan yang mengandungi aksara Cina, aksara bercelaru kadangkala berlaku, seperti yang ditunjukkan dalam rajah di bawah:
Seperti yang ditunjukkan dalam gambar di atas, parameter permintaan yang diterima mengandungi aksara Cina, tetapi ia ditukar kepada aksara bercelaru. Ini jelas bukan keputusan yang kita mahu, jadi di mana masalahnya?
Analisis Masalah
Pertama sekali, kita perlu memahami prinsip Node.js menerima parameter permintaan.
Node.js ialah platform berprestasi tinggi berdasarkan model I/O dipacu peristiwa dan tidak menyekat Ia mendengar port rangkaian Apabila permintaan diterima, ia mencetuskan peristiwa dan merangkum permintaan menjadi objek permintaan. Objek permintaan mengandungi pengepala permintaan, badan permintaan dan maklumat lain. Apabila menerima badan permintaan, Node.js menggunakan pengekodan UTF-8 untuk penyahkodan secara lalai.
Jadi, jika kandungan permintaan yang kami terima mengandungi aksara Cina, dan Jenis Kandungan dalam pengepala permintaan tidak menetapkan pengekodan set aksara, UTF-8 akan digunakan secara lalai untuk penyahkodan dalam pengekodan permintaan Set pengekodan, set aksara tertentu akan digunakan untuk penyahkodan. Walau bagaimanapun, jika pengekodan set aksara tidak ditetapkan dalam pengepala permintaan dan badan permintaan mengandungi berbilang pengekodan set aksara atau aksara bercelaru, Node.js mungkin menyebabkan aksara bercelaru semasa penyahkodan.
Penyelesaian
Untuk masalah aksara Cina bercelaru yang diterima oleh Node.js, kita boleh bermula dari aspek berikut:
Untuk mengelakkan masalah pengekodan set aksara yang tidak konsisten, kami boleh menetapkan pengekodan set aksara bersatu dalam pengepala permintaan.
Sebagai contoh, kita boleh menetapkan dalam pengepala permintaan:
Content-Type: application/x-www-form-urlencoded;charset=utf-8
Dengan cara ini, apabila menerima badan permintaan yang mengandungi aksara Cina dalam Node.js, ia boleh dinyahkod secara seragam dengan menggunakan UTF- 8 pengekodan.
Selain menetapkan pengekodan set aksara dalam pengepala permintaan, kami juga boleh memaksa pengekodan set aksara yang ditentukan untuk penyahkodan.
Sebagai contoh, apabila menggunakan rangka kerja ekspres, kita boleh menggunakan perisian tengah penghurai badan dan menentukan pengekodan set aksara untuk penyahkodan. Contohnya adalah seperti berikut:
const bodyParser = require('body-parser') const app = express() app.use(bodyParser.urlencoded({ extended: false, limit: '50mb', parameterLimit: 10000, type: 'application/x-www-form-urlencoded', verify: (req, res, buf) => { req.raw = buf } }))
Kaedah lain ialah menggunakan modul iconv-lite untuk menyahkod, contoh kod ialah seperti berikut:
const iconv = require('iconv-lite') const buffer = Buffer.from('e4b8ade69687', 'hex') const str = iconv.decode(buffer, 'utf8') console.log(str) // 输出:"中文"
Penyelesaian terakhir ialah menggunakan modul pengekodan teks untuk penyahkodan.
Sebagai contoh, apabila menggunakan rangka kerja ekspres, kita boleh menggunakan penyahkod pengekodan teks untuk penghurai kandungan permintaan kami dan menetapkannya kepada utf-8. Contohnya adalah seperti berikut:
const express = require('express') const bodyParser = require('body-parser') const { TextDecoder } = require('text-encoding') const app = express() app.use(bodyParser.json({ verify: function(req, res, buf) { req.body = JSON.parse(new TextDecoder('utf-8').decode(buf)) }}))
Ringkasan
Artikel ini memperkenalkan masalah bercelaru yang mungkin berlaku apabila Node.js menerima permintaan yang mengandungi aksara Cina, serta beberapa kaedah untuk menyelesaikan masalah ini.
Dalam pembangunan Node.js, adalah sangat penting untuk menangani masalah aksara Cina yang kacau-bilau dengan betul. Untuk menyelesaikan masalah ini, kita boleh menggunakan pengekodan set aksara bersatu, secara paksa menentukan pengekodan set aksara, menggunakan modul iconv-lite untuk menyahkod, dan menggunakan modul pengekodan teks untuk menyahkod, dsb., untuk mengelakkan aksara bercelaru dan memastikan operasi biasa aplikasi. Saya harap artikel ini dapat membantu pembangun menyelesaikan masalah ini.
Atas ialah kandungan terperinci Aksara Cina bercelaru diterima oleh nodejs. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!