C#에서 정규식을 사용하여 문자열 분할: 따옴표 안의 쉼표 처리
데이터 구문 분석 또는 SQL 문자열 작업과 같은 다양한 시나리오에서 쉼표가 포함된 문자열은 정규식을 사용하여 분할해야 할 수 있습니다. 그러나 쉼표가 따옴표 안팎에 나타나면 문제가 발생합니다.
다음 문자열을 고려해 보겠습니다.
<code>('ABCDEFG', 123542, 'XYZ 99,9')</code>
우리의 목표는 다음과 같은 출력을 얻기 위해 정규 표현식을 사용하여 이 문자열을 구성 요소 부분으로 분할하는 것입니다.
핵심은 따옴표 밖의 쉼표를 인식하는 것입니다. 이를 위해 강력한 정규식 패턴을 사용할 수 있습니다:
<code>",(?=(?:[^']*'[^']*')*[^']*$)"</code>
이 패턴을 분석해 보겠습니다.
"
: 문자 그대로의 쉼표와 일치합니다.
(?=(?:[^']*'[^']*')*[^']*$)
: 쉼표 뒤에 짝수 개의 따옴표가 있는지 확인하는 예측 어설션입니다.
(?:[^']*'[^']*')*
: 작은따옴표 쌍과 그 사이의 내용을 일치시킵니다. [^']*$
: 마지막 따옴표 뒤의 모든 문자와 일치하지만 따옴표는 포함하지 않습니다. 이 패턴을 사용하면 쉼표 뒤에 짝수 개의 따옴표가 오는 것을 일치시킬 수 있으므로 따옴표 외부의 문자열만 효과적으로 분할할 수 있습니다.
분할에 이 정규식을 사용하려면 다음 C# 코드를 사용합니다.
<code class="language-csharp">var result = Regex.Split(samplestring, ",(?=(?:[^']*'[^']*')*[^']*$)");</code>
이 코드를 실행하면 result
에는 문자열 배열이 포함됩니다. 각 문자열은 원하는 조건에 따라 분할된 원본 문자열의 구성 요소를 나타냅니다.
위 내용은 따옴표 안의 쉼표를 처리하기 위해 Regex를 사용하여 C#에서 문자열을 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!