python은 중국어 숫자를 아라비아 숫자로 변환합니다.
(무료 학습 권장 사항:파이썬 비디오 튜토리얼)
텍스트에서 숫자를 추출하는 정규 표현식
다음은 텍스트에서 중국 연도를 추출하는 데모입니다
import re m0 = "在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立"pattrern1 = '[零一二三四五六七八九]{4,}'pattrern2 = '[〇一二三四五六七八九零壹贰叁肆伍陆柒捌玖貮两]{4,}'time1 = re.findall(pattrern1,m0)#转化数字
연도 추출: '1949', '1990', '1996'
다음은 정규 표현식의 많은 예입니다. example
중국어를 아라비아 숫자로 변환
사전을 만든 다음 숫자 항목 일치에 대해 이야기하세요.
CN_NUM = { '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0, '壹': 1, '贰': 2, '叁': 3, '肆': 4, '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '两': 2,}for i in range(len(time1)): new_str = '' for j in time1[i]: new_str += str(CN_NUM[j]) time1[i] = new_str time1
결과가 나오고 위 예의 중국 연도가 성공적으로 변환됩니다. 아라비아 숫자로: '1949', '1990', '1996'
전체 코드
# 2、将句子中年份的大写数字改为阿拉伯数字import re m0 = "在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立"pattrern1 = '[零一二三四五六七八九]{4,}'pattrern2 = '[〇一二三四五六七八九零壹贰叁肆伍陆柒捌玖貮两]{4,}'time1 = re.findall(pattrern1,m0)#转化数字CN_NUM = { '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0, '壹': 1, '贰': 2, '叁': 3, '肆': 4, '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '两': 2,}for i in range(len(time1)): new_str = '' for j in time1[i]: new_str += str(CN_NUM[j]) time1[i] = new_str time1
많은 무료 학습 권장 사항이 있으니 방문하세요python tutorial(동영상)
위 내용은 중국어 숫자를 아라비아 숫자로 변환하는 Python 배우기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!