Ehnd 사전 사용법(초보자용) 링크

https://arca.live/b/yuzusoft/20886508?p=1


1. 정규식이란 무엇인가...?

내가 전편에서 정규식을 사용하면 恋愛라는 단어를 일일이 추가하지 않아도 된다고 했을거임.

그런데 정규식이 무엇인가... 라는 의문이 들음.

나도 정확히 배운게 아니라 야메로 배운거라서 뜻이 정확하지는 않을거임.


내가 이해하기로는

정규식 : 조건을 설정 가능한 사전.

이라고 생각함.


간단히 말해서, 恋愛 라는 단어가 있음.

여기서 愛 라는 단어를 아이라는 단어로 사전 등록하고 싶음.

그런데 앞에 라는 단어가 나오면 그 때는 아이라고 해석하지 않았으면 좋겠음.

그럴 때 사용하는 것이 정규식임.


2. 정규식 사용법.

나도 왜 그런지, 이런것은 잘 모름.

예전에 한 번 알아봤는데, ?!는 무엇을 나타내고, ^는 무엇을 나타낸다느니, 외우기 귀찮더라고...

그러니까 우리가 미연시를 하면서 가장 많이 쓸 한 문장에 대해서만 알아보자.

사실 이것만 알아도 다른건 쓰일일이 거의 없음.

나도 이것만 사용하는걸...


아무튼 우선 예시로 보일 그림과, 전처리 필터를 켜보겠음.




여기서 우리는 愛을 아이라고 번역하되, 앞뒤로 한자가 오면 아이라고 번역 하지 않았으면 좋겠음.

연애라던가, 애정이라던가... 이럴 때마다 아이라고 해석되면, 일일이 추가하기에는 귀찮음.

그러니 정규식을 작성해보겠음.


([^一-龥])愛(?![一-龥])    $1@:아이#N    10000000    1



([^一-龥])愛(?![一-龥])    $1@:아이#N    10000000    1


여기서도 다른 것과 마찬가지로 빈칸은 띄어쓰기(스페이스바)가 아니라 Tab임.


엄청 복잡해보일수도 있는데, 이해하려면 머리 터지고 귀찮으니까 그냥 위에 문장 형식 가져다가, 한자와 한글부분만 바꾸는 것을 추천함.

만약, 이해하고 싶다면, 정규식에 대해 따로 알아보던가, 투컨 공식 홈페이지에 누가 정규식 설명 올려놓은거 있음.

그거 보면 됨.

여기서는 다루지 않을 예정.


일단 한자랑 한글 부분만 바꾼다고 했는데, 이 부분을 바꾸려면 그래도 한자와 한글부분이 무엇을 나타내느냐 하는 것은 알아야 할거임.

그래서 간단히 설명하자면,


一-龥 이게 나타내는 것은 모든 한자를 뜻함.

한자 첫 시작이 一 이고, 한자 제일 마지막이 인데, 한자의 맨 처음(一)부터 맨 마지막(龥)까지에 포함되는 모든 한자를 범위지정한 것이라고 생각하면 됨.

한글로 나타내면, 가-힣 이런식으로 되었다고 생각하면 됨.

가 부분부터 힣까지 모든 한글을 범위지정한거잖아.

이것처럼 한자 모든 부분을 범위 지정한다고 생각하면 됨.


([^一-龥])愛(?![一-龥])    $1@:아이#N    10000000    1


그래서 이게 나타내는 말은 앞에 모든 한자(一-龥)가 나오지 않고, 뒤에 모든 한자(一-龥)가 나오지 않는 경우 愛를 아이라고 번역한다. 라는 뜻임.

恋愛 같은 경우도 마찬가지로 앞에 한자인 恋가 나오기 때문에 아이라고 번역하지 않게 됨.

일단 밑에 적용된 그림을 보여주겠음.



보면 단독으로 쓰인 이름 부분은 아이라고 번역되는데, 恋이 앞에 있는 恋愛는 번역하지 않고 바로 연애라고 번역이 되는 것을 알 수 있음.

이와같이 연애, 애정 같이 애(愛)앞뒤로 한자가 나오는 경우는 번역하지 않고, 단독으로 쓰이는 경우는 아이라고 번역하게 됨.


참고로 히라가나 또는 가타카나와 함께 나올 경우도 아이라고 번역하게 됨.

왜냐하면 히라가나 범위지정식(ぁ-ん), 가타카나 범위지정식(ァ-ヶ)이 사용된게 아니기 때문임.


만약 히라가나와 가타카나 나왔을 때도 필터링 했으면 좋겠다. 그렇다면, 


([^一-龥ぁ-んァ-ヶ])愛(?![一-龥ぁ-んァ-ヶ])    $1@:아이#N    10000000    1


이런식으로 한자 식 뒤에 추가 하면 됨.

만약 앞에 글자랑   글자 두개만 필터링하고 뒤에 ん글자랑 ァ글자 두개만 필터링 추가 하고 싶다?


([^一-龥])愛(?![一-龥ん])    $1@:아이#N    10000000    1


이런식으로 작성하면 됨.


이런식으로 한 번 정리해 놓으면, 앞뒤로 한자 있는 경우를 매 번 정리하지 않아도 됨.


만약, 더 자세한 정보를 원한다면, 위에서 말했듯이, 투컨 사이트에서 정규식 관련 정보를 찾아보거나, 따로 검색해서 정규식 공부해 보기를 바람.

나는 이것만으로도 왠만한건 다 해결되더라고.


아무튼 도움이 되었길 바라며 글을 마치겠음.