정규식 설계
정규식 설계에 도움이 되는 정보들입니다.
자연수 구간 매칭
숫자를 범위로 캡처하는 것은 꽤 복잡합니다. 아래 프로그램을 사용하세요.
→
구간을 입력해주세요.
공백 예외처리
LLM은 완벽하지 않다는 점을 유의해야 합니다.
Syntax 등을 사용해 출력 형식을 강하게 제어할 수 있어도, 결국 가끔씩 오류가 나는 것도 가능합니다.
이 중 가장 흔한 케이스인 공백을 잡아내 예외처리해볼 수 있습니다.
예를 들어, {{char::(캐릭터명)}} 꼴로 텍스트를 잡아내고자 아래와 같이 정규식을 설계했습니다.
md
\{\{char::(.*?)\}\}그러나 실제 출력 중 일부에는 괄호와 텍스트 사이에 띄어쓰기가 나오는 경우도 생깁니다.
md
{{ char::코멧}}이 경우는 정규식으로 잡지 못해 텍스트가 그대로 남게 됩니다.
이를 예방하기 위해, 띄어쓰기가 혹여나 들어갈 수 있는 자리에 공백 감지 문법 \s*를 넣어볼 수 있습니다.
md
\{\{\s*char::(.*?)\s*\}\}이와 같이 설계하면 간혹 나오는 공백 오류도 깔끔하게 처리할 수 있습니다.