403 Java에서는 금지되지만 웹 브라우저에서는 금지됨: Google 검색 문제 해결
웹 브라우저에서 검색 결과를 성공적으로 검색했음에도 불구하고, Java 프로그램을 사용하여 Google 검색 데이터를 가져오려고 할 때 403 Forbidden 오류가 발생하면 당황스러울 수 있습니다. 근본 원인은 Java 요청에 사용자 에이전트 정보가 없다는 것입니다.
이 문제를 해결하려면 "User-Agent" 헤더를 설정하여 웹 브라우저의 동작을 시뮬레이션해야 합니다.
URLConnection connection = new URL("https://www.google.com/search?q=" + query).openConnection(); connection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11"); connection.connect();
이 헤더는 요청을 웹 브라우저에서 발생한 것으로 처리하도록 서버에 지시하여 403 오류를 방지합니다. SSL 처리가 자동으로 처리된다는 점은 주목할 가치가 있습니다.
그러나 Java를 사용하여 결과 금액을 검색하려면 추가 단계가 필요합니다. 쿠키를 가져오고 리디렉션 토큰 링크를 구문 분석해야 합니다.
String cookie = connection.getHeaderField("Set-Cookie").split(";")[0]; Pattern pattern = Pattern.compile("content=\\"0;url=(.*?)\\""); Matcher m = pattern.matcher(response); if (m.find()) { String url = m.group(1); connection = new URL(url).openConnection(); connection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11"); connection.setRequestProperty("Cookie", cookie); connection.connect(); r = new BufferedReader(new InputStreamReader(connection.getInputStream(), Charset.forName("UTF-8"))); sb = new StringBuilder(); while ((line = r.readLine()) != null) { sb.append(line); } response = sb.toString(); pattern = Pattern.compile("<div>
전체 코드 블록을 실행하면 검색 결과 수를 나타내는 2930000000L의 결과가 생성됩니다.
위 내용은 Java Google 검색 프로그램에서는 403 Forbidden 오류가 발생하지만 웹 브라우저에서는 발생하지 않는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!