Cette fois, je vais vous apporter quelques précautions sur l'utilisation de Node.js pour convertir les formats d'encodage de fichiers et sur l'utilisation de Node.js pour convertir les formats d'encodage de fichiers. Voici des cas pratiques. , jetons un coup d'oeil.
L'encodage ASCII est pénible. Après des recherches dans des ressources en ligne, des tests et des comparaisons répétés, j'ai finalement trouvé la méthode plus fiable suivante (certains encodages d'affichage EditPlus sont utf-8 mais la bibliothèque node.js). renvoie quelque chose d'autre. Coding>_<)
Pour déterminer si la modification est correcte, il vous suffit de la soumettre via SVN après la modification, de parcourir la liste de soumission, de double-cliquer sur n'importe quel fichier à soumettre, le cas échéant. la boîte de dialogue illustrée dans la figure ci-dessous s'affiche, cela signifie que la modification est réussie. Les autres verront que le texte chinois est devenu tronqué
var fs = require('fs'); var chardet = require('chardet'); var jschardet = require("jschardet"); var encoding = require("encoding"); var path = "lua目录"; function readDirectory(dirPath) { if (fs.existsSync(dirPath)) { var files = fs.readdirSync(dirPath); files.forEach(function (file) { var filePath = dirPath + "/" + file; var stats = fs.statSync(filePath); if (stats.isDirectory()) { // console.log('/n读取目录:\n', filePath, "\n"); readDirectory(filePath); } else if (stats.isFile() && /\.lua$/.test(filePath)) { var buff = fs.readFileSync(filePath); if (buff.length && buff[0].toString(16).toLowerCase() == "ef" && buff[1].toString(16).toLowerCase() == "bb" && buff[2].toString(16).toLowerCase() == "bf") { //EF BB BF 239 187 191 console.log('\n发现BOM文件:', filePath, "\n"); buff = buff.slice(3); fs.writeFile(filePath, buff.toString(), "utf8"); } // { encoding: 'UTF-8', confidence: 0.99 } // var charset = chardet.detectFileSync(filePath); var info = jschardet.detect(buff); if (info.encoding == "GB2312" || info.encoding == "ascii") { var resultBuffer = encoding.convert(buff, "UTF-8", info.encoding); fs.writeFile(filePath, resultBuffer, "utf8"); } else if (info.encoding != "UTF-8" && chardet.detectFileSync(filePath) != "UTF-8") { if (buff.toString().indexOf("\r\n") > -1) { var resultBuffer = encoding.convert(buff, "UTF-8", "GBK"); fs.writeFile(filePath, resultBuffer, "utf8"); } } } }); } else { console.log('Not Found Path : ', dirPath); } } readDirectory(path);Faites attention. le jugement ci-dessus Lorsque le premier est clairement GB2312 ou ascii, changez directement L'encodage correspondant est converti en utf-8. Et si le format renvoyé l'est, déterminez d'abord s'il y a un caractère de saut de ligne sous le PC, et si c'est le cas, traitez-le tout comme GBK pour le traitement.
L'idée est en fait relativement simple. La difficulté réside dans la détermination du format d'encodage du fichier. C'est vraiment difficile>_
Je pense que vous maîtrisez la méthode après avoir lu le cas dans cet article. Pour plus de passionnant. Pour plus d'informations, veuillez prêter attention aux autres articles connexes sur le site Web PHP chinois !
Lecture recommandée :
Trois objets intégrés pour l'apprentissage de l'amélioration de base de js
Types de données de base pour l'amélioration de base de js apprentissage
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!