Python输入中文的问题-PHP 중국어 네트워크 Q&A

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

Python输入中文的问题

迷茫 2017-04-18 09:02:59

280

我写了一个爬乌云漏洞库的爬虫，其URL形式为http://www.wooyun.org/corps/公司名称/page/1，程序最后raw_input处输入公司名称即可跑出该公司的漏洞。现在的问题是中文编码的问题没解决好，如果公司的名称是英文如RiSing就可以，如果是中文就报错。求各位大大指点

# coding=utf-8 import sys reload(sys) sys.setdefaultencoding('utf-8') import urllib import urllib2 import re def getPage(pageNum): try: url = 'http://www.wooyun.org/corps/' + corpName + '/page/' + str(pageNum) request = urllib2.Request(url) response = urllib2.urlopen(request) return response.read().decode('utf-8') except urllib2.URLError, e: if hasattr(e,u"reason"): print u"error",e.reason return None def getContent(page): pattern = re.compile('.*?(.*?).*?(.*?)',re.S) items = re.findall(pattern,page) for item in items: print item[0],'http://www.wooyun.org'+item[1],item[2] def getPageNum(page): pattern = re.compile('(.*?)(.*?)


     
      
       
       3
      
      
       
       0
      
      
       
       0
      
     
     
      
       
       
        迷茫
        业精于勤，荒于嬉;行成于思，毁于随。
       
      
      
       
       
        
         
        
       
      
     
     
      
       
        모든 응답
        (3)
       
       
       
      
      
      
       
       
        
         
          伊谢尔伦2017-04-18 09:04:59
          3층
         
         
          网址含中文要转义..
把14行换成
          url = 'http://www.wooyun.org/corps/' + urllib.quote(corpName)+ '/page/' + str(pageNum)
          Ubuntu Gnome Terminal 已经测试(百度)成功
         
         
          
          좋다+0
          
           답글 추가
           关闭回复
          
         
         
          
           
            
             
             迷茫
            
           
           
           
          
         
         
          
         
        
       
      
      
      
       
       
        
         
          阿神2017-04-18 09:04:59
          2층
         
         
          我觉得估计不是字符编码的问题，URL里怎么能直接出现汉字？你不要以为浏览器里显示：http://www.wooyun.org/corps/公司名称/page/1你就觉得浏览器请求的URL里面的公司名称就真是汉字。
          事实上浏览器去请求的时候，URL里的汉字全都会用URLEncode转一下的，真正的请求里没有汉字的。
          就像你请求：http://www.wooyun.org/corps/阿里巴巴/page/1，这是不会成功的。
但你把URL写成：http://www.wooyun.org/corps/%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4/page/1，你可以成功请求到阿里巴巴的页面。
         
         
          
          좋다+0
          
           답글 추가
           关闭回复
          
         
         
          
           
            
             
             迷茫
            
           
           
           
          
         
         
          
         
        
       
      
      
      
       
       
        
         
          巴扎黑2017-04-18 09:04:59
          1층
         
         
          from urllib import quote print quote('百度')
         
         
          
          좋다+0
          
           답글 추가
           关闭回复
          
         
         
          
           
            
             
             迷茫


    
    
     
     
      
       
        인기 주제
       
       더>
      
      
       
        a5용지 크기는 어떻게 되나요?
        등록 도메인 이름 쿼리 도구
        nohup과 &의 차이점
        C 언어에서 +=의 의미 소개
       
      
     
     
      
       
        인기 기사
       
      
      
       
        
         
          
          비트코인(BTC)은 잠시 $60,000를 넘어 상승했지만 $60,000 근처에서 거래되면서 이익을 포기하여 주식 시장의 움직임을 모방했습니다.
         
        
         
          
          Michael Saylor는 비트코인의 변동성을 옹호하며 이를 유동성과 신용을 위해 '지불하는 가격'이라고 부릅니다.
         
        
         
          
          Laravel에서 재사용 가능한 모델 검색 만들기: 효율적인 설정 및 모범 사례
         
        
         
          
          애플의 새로운 특허가 공개됐다! AI가 인생의 새로운 장을 기록하는 데 도움이 되나요?
         
        
         
          
          Calm Boots의 재사용 대기시간은 얼마나 줄어들 수 있나요?
         
       
      
     
     
      
       
        인기 튜토리얼
       
       더>
      
      
       
        
         관련 튜토리얼
         
        
        
         인기 추천
         
        
        
         최신 강좌
         
        
       
       
        
         
          최신 ThinkPHP 5.1 세계 최초 비디오 튜토리얼(PHP 전문가 온라인 교육 과정이 되기까지 60일)
          
           
            1394785
            
           
           
            
           
          
         
        
         
          PHP 입문 튜토리얼 1: 일주일 안에 PHP 배우기
          
           
            4206476
            
           
           
            
           
          
         
        
         
          JAVA 초보자용 비디오 튜토리얼
          
           
            2347736
            
           
           
            
           
          
         
       
       
        
         
          최신 ThinkPHP 5.1 세계 최초 비디오 튜토리얼(PHP 전문가 온라인 교육 과정이 되기까지 60일)
          
           
            1394785
            
           
           
            
           
          
         
        
         
          JAVA 초보자용 비디오 튜토리얼
          
           
            2347736
            
           
           
            
           
          
         
        
         
          Little Turtle의 Python 학습에 대한 제로 기반 소개 비디오 튜토리얼
          
           
            493085
            
           
           
            
           
          
         
        
         
          웹 프론트 엔드 개발에 대한 빠른 소개
          
           
            213403
            
           
           
            
           
          
         
        
         
          PS 비디오 튜토리얼을 처음부터 마스터하세요
          
           
            842580
            
           
           
            
           
          
         
       
       
        
         
          [웹 프런트엔드] Node.js 빠른 시작
          
           
            3102
            
           
           
            
           
          
         
        
         
          해외 웹 개발 풀스택 강좌 총집합
          
           
            2481
            
           
           
            
           
          
         
        
         
          Go 언어 실습 GraphQL
          
           
            1973
            
           
           
            
           
          
         
        
         
          550W 팬 마스터가 JavaScript를 처음부터 차근차근 학습합니다
          
           
            464
            
           
           
            
           
          
         
        
         
          기초 지식이 전혀 없는 초보자도 6시간 만에 시작할 수 있는 파이썬 마스터 모쉬
          
           
            10757
            
           
           
            
           
          
         
       
      
     
     
      
       
        최신 다운로드
       
       더>
      
      
       
        
         웹 효과
         
        
        
         웹사이트 소스 코드
         
        
        
         웹사이트 자료
         
        
        
         프론트엔드 템플릿
         
        
       
       
        
         
          
          [양식 버튼] jQuery 기업 메시지 양식 연락처 코드
         
        
         
          
          [플레이어 특수 효과] HTML5 MP3 뮤직 박스 재생 효과
         
        
         
          
          [메뉴 탐색] HTML5 멋진 입자 애니메이션 탐색 메뉴 특수 효과
         
        
         
          
          [양식 버튼] jQuery 시각적 양식 드래그 앤 드롭 편집 코드
         
        
         
          
          [플레이어 특수 효과] VUE.JS 모방 Kugou 음악 플레이어 코드
         
        
         
          
          [HTML5 특수 효과] 클래식 HTML5 푸시 박스 게임
         
        
         
          
          [그림 특수 효과] 이미지 효과를 추가하거나 줄이기 위해 jQuery 스크롤
         
        
         
          
          [사진 앨범 효과] CSS3 개인 앨범 커버 호버 확대/축소 효과
         
       
       
        
         
          
          [부트스트랩 템플릿] 유기농 과일 및 야채 공급업체 웹 템플릿 Bootstrap5
         
        
         
          
          [백엔드 템플릿] Bootstrap3 다기능 데이터 정보 배경 관리 반응형 웹 페이지 템플릿-Novus
         
        
         
          
          [부트스트랩 템플릿] 부동산 자원 서비스 플랫폼 웹 페이지 템플릿 Bootstrap5
         
        
         
          
          [부트스트랩 템플릿] 간단한 이력서 정보 웹 템플릿 Bootstrap4
         
        
         
          
          [부트스트랩 템플릿] 부트스트랩 반응형 와이드스크린 도서 교육 웹사이트 템플릿 - DREAMLIFE
         
        
         
          
          [백엔드 템플릿] MAC 스타일 반응 형 블루 엔터프라이즈 CMS 배경 관리 시스템 템플릿
         
        
         
          
          [백엔드 템플릿] 반응형 그라데이션 분위기 배경 관리 시스템 웹사이트 템플릿-usinessbox
         
        
         
          
          [부트스트랩 템플릿] 반응형 야채 및 과일 매장 웹사이트 템플릿-Organio
         
       
       
        
         
          
          [PNG 소재] 귀여운 여름 요소 벡터 자료(EPS+PNG)
         
        
         
          
          [PNG 소재] 4개의 빨간색 2023 졸업 배지 벡터 자료(AI+EPS+PNG)
         
        
         
          
          [배너 그림] 노래하는 새와 꽃 디자인 봄 배너 벡터 자료로 가득 찬 카트(AI+EPS)
         
        
         
          
          [PNG 소재] 황금 졸업 모자 벡터 자료(EPS+PNG)
         
        
         
          
          [PNG 소재] 흑백 스타일 산 아이콘 벡터 자료(EPS+PNG)
         
        
         
          
          [PNG 소재] 다양한 색상의 망토와 포즈를 갖춘 슈퍼히어로 실루엣 벡터 자료(EPS+PNG)
         
        
         
          
          [배너 그림] 플랫 스타일 식목일 배너 벡터 자료(AI+EPS)
         
        
         
          
          [PNG 소재] 9개의 만화 스타일의 폭발적인 채팅 거품 벡터 자료(EPS+PNG)
         
       
       
        
         
          
          [프런트엔드 템플릿] 가정 장식 청소 및 수리 서비스 회사 웹사이트 템플릿
         
        
         
          
          [프런트엔드 템플릿] 신선한 색상의 개인 이력서 가이드 페이지 템플릿
         
        
         
          
          [프런트엔드 템플릿] 디자이너 크리에이티브 작업 이력서 웹 템플릿
         
        
         
          
          [프런트엔드 템플릿] 현대 엔지니어링 건설 회사 웹사이트 템플릿
         
        
         
          
          [프런트엔드 템플릿] 교육 서비스 기관을 위한 반응형 HTML5 템플릿
         
        
         
          
          [프런트엔드 템플릿] 온라인 전자책 쇼핑몰 웹사이트 템플릿
         
        
         
          
          [프런트엔드 템플릿] IT 기술로 인터넷 회사 웹 사이트 템플릿을 해결합니다.
         
        
         
          
          [프런트엔드 템플릿] 보라색 스타일 외환 거래 서비스 웹 사이트 템플릿


  
   
    
     
      
       
        회사 소개
        부인 성명
        Sitemap
        
       
       
        PHP 중국어 웹사이트：공공복지 온라인 PHP 교육，PHP 학습자의 빠른 성장을 도와주세요！

Php8, 나도 갈게

30분 안에 웹사이트 레이아웃 배우기

Shangguan Oracle 초보자부터 능숙한 비디오 튜토리얼까지

UNI-APP 코드의 첫 번째 줄

처음부터 앱 실행까지 Flutter

Lian 형제 새 Linux 비디오 튜토리얼

AXURE 9 비디오 튜토리얼(제품 관리자 대화형 제품 디자인 UI에 적합)

Zero 기본 숙련도 PS 비디오 튜토리얼

시작하는 데 도움이 되는 16일 UI 비디오 튜토리얼

PS 기술 및 슬라이싱 기술 비디오 튜토리얼

Alibaba Cloud 환경 구축 및 프로젝트 출시 비디오 튜토리얼

컴퓨터 네트워크 개요 - 프로그래머가 마스터해야 하는 기본 지식

프로그래머를 위한 필수 튜토리얼 - HTTP 프로토콜 설명

웹소켓 비디오 튜토리얼