1. 이 글을 쓰게 된 계기



내가 하던 겜 끝나고 이로히카를 하려 했었는데, 끝낸지 넘 오래돼서 이로세카를 재탕하고 들어갈려고 했음


근데 이미 깬 구판으로 하려니 세이브나 루트 같은게 다 열려있어서 기왕 할거면 HD판으로 하자는 생각이 듦


그래서 HD판으로 겜을 하고 있었는데...



유키토의 강조점이 나오자마자 번역이 박살나기 시작했음


설마 앞으로도 계속 이러진 않겠지.. 이렇게 생각하던 찰나....



나는 무언가 잘못되고 있음을 깨닫고 내가 쓰고 있던 Textrator라는 후커의 상태를 보러 갔음



내가 생각한대로 유키토의 강조점이 그대로 후킹되어 번역을 망치고 있었음


물론 일본어 텍스트를 읽으면 어느정도 해석이 가능하지만 나는 이런게 불편했기 때문에 강조점을 어떻게 없애야할까를


계속 고민하다가 Regex 필터를 사용하여 강조점을 없애는 데 성공했음


그래서 이번 경험을 통해서 내가 얻은 Regex 필터의 사용법을 공유해보려 함


물론 난 컴맹에다가 프로그램 더 잘 아는 개고수 유붕이들도 많이 있을테니 잘못된 정보가 있다면 피드백 해주면 좋겠음



2. Regex 필터 사용법


난 Textractor랑 아네모네를 사용하고 있고, 당연히 이 프로그램들을 사용한다는 가정 하에 설명해볼거임


만약 Textractor랑 아네모네를 모른다면 


https://arca.live/b/yuzusoft/16910672?target=all&keyword=textractor&category=%ED%8C%81&p=1


다른 사람이 쓴 아주 멋진 글이 있으니 이거부터 보고 이 글을 읽어주면 좋겠음


각설하고, 결론부터 말하면 Regex는 일종의 언어라고 함 (난 컴맹이라 관련 지식이 1도 없음)


나무위키에 따르면 Regex는 다음과 같음


프로그래밍에서 문자열을 다룰 때, 문자열의 일정한 패턴을 표현하는 일종의 형식 언어를 말한다.

정규식이라고도 부르며, 보통 RegEx혹은 RegExp라 많이 쓴다.


뭔진 모르겠지만 그렇다고 한다... 어쨌든 이게 뭔지 아는 건 필터를 사용하는데에 크게 중요하지 않음


본론으로 들어가서, 잡다한 스토리들은 배제하고 담백하게 어떻게 사용하는지만 써볼려고 함



Textractor(텍렉이라 칭하겠음)의 왼쪽을 보면 '확장기능'이라는 메뉴가 있음


그걸 누르면 오른쪽처럼 창이 뜨는데, 그 창을 우클릭 해서 '확장기능 추가'를 누르자



그럼 이렇게 창이 뜰텐데, 'Regex Filter'라고 적혀있는 파일을 등록하고 확장기능 창에서 젤 위로 옮겨주면 됨


그 이유는 먼저 Regex 필터가 우리가 없애길 원하는 특수문자를 없앤 후에 번역 처리가 되야하기 때문임



그렇게 하고 나면 '정규식 필터'라고 적혀져있는 팝업창이 뜰 거임


저기에 우리가 삭제하고 싶은 문자를 정규식 표현을 통해 입력해줘야 하는데, 대부분의 문제는 


https://namu.wiki/w/Textractor#s-7.1 


이 링크에 있는 정규식들을 복붙하면 어느정도 해결해볼 수 있음


하지만 저기에 있는 정규식 표현인 '[\u0000-\u2fff\ua000-\uffff]'는 모든 특수문자를 제거하기 때문에


내가 원하는 특수문자를 없애기 위해서 물음표나 느낌표 등 


텍스트에서 많이 쓰이는 모든 특수문자를 없애는 상황이 벌어질 수 있음


그렇다면 어떻게 내가 원하는 특수문자만 없앨 수 있을까?


'[\u(내가 원하는 특수문자의 유니코드)]'


위와 같은 형식으로 입력하면 내가 원하는 특수문자만 없앨 수 있다


이렇게만 보면 무슨 소리인지 감이 잘 안올테니, 위에서 보여준 유키토의 강조점을 없애보도록 하겠음


・ <--- 이것이 텍렉에 긁히는 바로 그 문제의 유키토 강조점임


하지만 위의 형식에서 볼 수 있듯이 우리는 '・'를 필터에 입력해야하는 것이 아닌, '・의 유니코드'를 입력해야함


https://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C_3000~3FFF


이 글을 읽고 있는 사람 중에 유니코드를 전부 외우고 있는 사람은 당연히 없을테니


위의 링크에 들어가서 일일히 찾아볼 수 밖에 없다...


ctrl + F를 누른 다음에 없애고자 하는 특수문자를 복붙해 쉽게 찾아볼 수 있는 팁이 있긴 하지만


결국 어떤 유니코드 표 범위에 있는지는 노가다를 뛸 수 밖에 없다.


그러나 면시에서 키릴 문자나 베트남어를 쓰지는 않을 것이기 때문에, 링크의 일본어 표로도 큰 문제는 없어보임



위키피디아에 있는 유니코드표를 읽는 법은 '(세로 문자열 + 가로 문자)로 읽으면 됨


따라서 유키토 강조점의 유니코드는 '30F0B'임


이제 이 유니코드를 앞에서 설명한 형식에 대입해보면 '[\u30FB]'가 되는 걸 알 수 있음



이렇게 입력해주고 이로세카를 켜서 문제의 부분을 다시 봐보면..





위와 같이 문제의 부분이 잘 필터링 되어 후킹되고 있음을 확인할 수 있음


쨌든 이 글을 통해서 유붕이들도 텍렉쓰면서 이상한 특수문자 있을 때 더 편하게 겜 할 수 있으면 좋겠네


나중에 또 새롭게 알게 된 팁 같은 거 있으면 다시 글 써보도록 할게



+ Regex 필터에 '・|'를 입력해도 제대로 작동됨


※ 본 글은 컴퓨터를 기준으로 작성되었습니다. 모바일로 읽을 경우 불편할 수 있습니다.

※ 본 글에 있는 오탈자나 잘못된 정보가 있다면 이 곳으로 제보해주시면 정말 감사하겠습니다.


다른 글 보러가기