Ehnd+꿀도르 관련으로 이런 댓글이 달려서 이에 해당되는 포스트 필터 기능을 알아보는 시간을 가져보도록 하겠따




이건 내가 개조하고 있는 유저사전 중 후처리 필터의 일부다. 후처리 필터(포스트 필터)는 번역기가 한번 돌린 결과물을 고치는 역할을 한다.

그렇기 때문에 다른 두개의 파일(프리 필터, 유저사전)과는 달리 일어->한글이 아니라 한글->한글로 바꾸는 방식을 취한다.


포스트 필터의 구조는 프리 필터와 동일한데, 원문(tab)결과물(tab)차수(tab)1or0 이런 구조로 써넣으면 된다. 

맨 뒤의 숫자는 1은 정규식을 쓸 경우, 아니면 0인데 정규식에 관해서는 꿀도르님 블로그 들어가서 읽어보셈. 이 글은 포스트 필터만 소개하는 글이라 그거 일일이 다 설명 못 함. 관심 있으면 꿀도르님 블로그 들어가서 읽어보자 앵간한 건 다 설명되어 있음


하여튼 간략한 예시를 하나 보자



(/log를 이지트랜스에 인식시키면 이렇게 Ehnd 로그 윈도우가 뜬다)

私的に足りていないので라는 문장을 번역시켜 보면 이런 로그가 나온다.

해당 문구를 번역기는 '사적 기에 충분하지 않기 때문에.' 라고 번역했으나 포스트 필터가 '적 기에'를 '적으로'로 교정시켜 결과적으로 '사적으로 충분하지 않기 때문에.'라는 문장이 튀어나오게 되었다.


참고로 해당 부분을 수정한 라인은 '적 기에(tab)적으로(tab)20000000(tab)0' 이렇게 작성되어 있음


이런 식으로 한글로 번역된 것을 수정하는 것이 포스트 필터다.

이걸로 번역을 다듬으면 존나 쩌는 결과물이 나오겠지? 이런 생각을 할 수 있는데 직접 해보면 알겠지만 포스트 필터만으로는 한계가 있어서 그렇게 엄청난 결과물은 나오기가 힘들다. 당장 어느 문장은 괜찮아 보여도 다른 문장들 돌려보다 보면 거기서 삐꾸나는 경우가 많음 ㅇㅇ


참고할 것으로는 원조맛집 꿀도르님 블로그 보면 예시로 처리 순서인 차수를 777으로 해놔서 777로 해놓는 사람들이 많은데 그렇게 낮은 차수 쓰다간 다른 필터가 꼬여서 좆되는 경우가 생길 수 있따. 그러니까 최소 10000000, 좀 더 안전하게는 20000000, 가장 안전빵으로는 30000000 정도의 차수를 쓰는 것이 좋다.

그리고 꿀도르 개조해서 쓸 거면 [email protected] 이런 식으로 파일 하나 만들어서 쓰는게 관리하기 좋음