file_get_contents()가 UTF-8 문자를 중단합니다
UTF-8 인코딩을 사용하여 외부 서버에서 HTML을 로드할 때 문제가 발생합니다. ľ, š, č, ť, ž와 같은 문자가 손상되어 잘못된 문자로 대체되었습니다.
문제의 근본
file_get_contents() 함수에서 오류가 발생할 수 있습니다. 인코딩 문제. 기본적으로 데이터를 ASCII로 해석하므로 UTF-8 문자를 올바르게 처리하지 못합니다.
제안된 솔루션
이 문제를 해결하려면 대체 인코딩 방법을 사용하는 것이 좋습니다. .
1. 수동 인코딩 변환
가져온 HTML을 UTF-8로 변환하려면 mb_convert_encoding() 함수를 사용하세요.
$html = file_get_contents('http://example.com/foreign.html'); $utf8_html = mb_convert_encoding($html, 'UTF-8', mb_detect_encoding($html, 'UTF-8', true));
2. 출력 인코딩
스크립트에 다음 줄을 추가하여 출력이 올바르게 인코딩되었는지 확인하세요.
header('Content-Type: text/html; charset=UTF-8');
3. HTML 엔터티 변환
가져온 HTML을 출력하기 전에 HTML 엔터티로 변환:
$html = file_get_contents('http://example.com/foreign.html'); $html_entities = htmlentities($html, ENT_COMPAT, 'UTF-8'); echo $html_entities;
4. JSON 디코딩
외부 HTML이 JSON으로 저장된 경우 JSON 클래스를 사용하여 디코딩합니다.
$json = file_get_contents('http://example.com/foreign.html'); $decoded_json = json_decode($json, true); $html = $decoded_json['html'];
이러한 기술을 활용하면 file_get_contents로 인해 발생하는 인코딩 문제를 피할 수 있습니다. () UTF-8 문자가 올바르게 표시되는지 확인하세요.
위 내용은 `file_get_contents()`를 사용할 때 UTF-8 문자가 손상되는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!