고대 번역기 extrans가 문자열에서 유의미한 단어를 추출하기 위해서 n그람 파싱을 할것으로 예상됨

n그람 파싱은 글자를 n개씩 나누어서 분리해보는 방식임


'라스트오리진' 을 n그람 파싱하면 다음과 같음.

n=1 -> 라+스+트+오+리+진

n=2 -> 라스+스트+트오+오리+리진+진

n=3 -> 라스트+스트오+트오리+오리진+리진+진

...

n=6 -> 라스트오리진+스트오리진+트오리진+오리진+리진+진


여기서 나온 단어들을 이미 가지고 있는 긴 것부터 언어사전에 대입했을 때 유의미한 결과가 나올 수 있음

여기서는 '라스트', '오리진', '오리' 정도가 검색될것으로 보임.

잘 번역 하면 last origin이 나올 것이고 잘못 번역하면 last duck gin 이 나올것


이걸 일본어 의성어인   (쿠쿠쿠)에 적용하면 다음과 같음

n=1 -> 쿠+쿠+쿠

n=2 -> 쿠쿠+쿠

n=3 -> 쿠쿠쿠


그 중에서 일본어 사전에서 찾을 수 있는 단어는 '쿠쿠' 랑 '쿠'임

'쿠' 는 숫자 9임. 큐우 또는 쿠라고 읽음

'쿠쿠'는 99임, 근데 이게 구구법이라는 단어로 등재되어있음. 구구법은 우리가 아는 곱셈 할 때 외우는 구구단임

'쿠'보다 '쿠쿠'가 더 길게 완성된 단어라서 구구법+숫자9라고 번역함


그리고 우리가 보는 구구법구가 완성됨

반박시 니 말이 맞음