404를 반환하는 URL로 인해 코드에 문제가 발생한다는 사실을 발견하는 것이 웹 스크래핑의 일반적인 문제점입니다. 이 문제를 효율적으로 해결하려면 URL에 404 응답이 있는지 확인하기 위해 코드 시작 부분에 테스트를 구현하는 것이 필수적입니다.
@fsockopen() 사용과 같은 제안은 리디렉션을 고려하지 않을 수 있지만 더 적합한 접근 방식은 다음을 사용하는 것입니다. 컬의 컬_getinfo() 함수. 방법은 다음과 같습니다.
// Initialize a cURL handle with the given URL $handle = curl_init($url); // Enable return of transfer as a string curl_setopt($handle, CURLOPT_RETURNTRANSFER, TRUE); // Get the response (HTML or data linked to the URL) $response = curl_exec($handle); // Check for 404 (file not found) response $httpCode = curl_getinfo($handle, CURLINFO_HTTP_CODE); // Handle 404 if ($httpCode == 404) { /* Perform your custom 404 handling here. */ } // Close the curl session curl_close($handle); // Continue processing with the retrieved $response
이 코드를 통합하면 404 응답을 효과적으로 확인하여 코드에서 문제가 있는 URL을 건너뛰고 사용 가능한 URL로 진행할 수 있습니다.
위 내용은 웹 스크래핑 전에 PHP에서 404 오류를 효율적으로 확인할 수 있는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!