a='''
[장면: 센트럴 퍼크, 챈들러, 조이, 피비, 모니카가 있습니다.]
모니카: 말할 것도 없어요! 그 사람은 그냥 같이 일하는 사람이에요!
조이: 이봐요, 그 사람이랑 데이트 중이군요!
그 사람에게 무슨 문제가 있는 것 같아요!
그럼 조이, 잘 지내요. 그럼 그 사람은 혹도 있고 머리핀도 있나요?
피비: 잠깐만요, 그 사람은 분필을 먹나요? ?[장면: Chandler, Joey, abcsde.]
Phoebe: 그냥, 내가 Carl과 겪은 일을 그녀가 겪게 하고 싶지 않으니까- 오!
Monica: 좋아요, 모두들 진정하세요. 데이트도 아니고 그냥 두 사람이 저녁 먹으러 나가서- 섹스도 안 하는 거에요
챈들러: 나한테는 데이트처럼 들리는데.[장면: 조이.]
위와 같이 텍스트 a가 있는데,
각 장면의 대화 텍스트를 가져와서 lsit로 저장하고 싶습니다. 위의 굵게 표시된 것처럼 각 장면의 차이점은 [Scene: 영어 문장 추가.]입니다. 그런 다음 공식으로 작성된 정규식을 사용합니다.
paragraphs = re.findall('[Scene: w+.](.*?)[Scene: w+.]',a,re.S)
일치하는 내용이 없고 문단이 비어 있는 것을 발견했습니다.
오류의 원인은 무엇인가요? 각 장면의 대화 내용을 어떻게 일치시킬 수 있나요?
감사합니다.
错误有几点
没有使用原生字符串
没有转义[
以下是我修改后的代码。
python正则表达式指南
http://www.cnblogs.com/huxi/a...