역사언어학은 그 이름대로 '언어의 역사를 다루는 학문'이라는 점을 생각하면 문헌을 뒤져가며 옛 형태를 찾아내는 학문이라는 생각을 하기 쉽습니다만, 그것이 결코 역사언어학의 전부는 아닙니다. 불규칙한 언어 현상에 대해 '원래 규칙적이었던 것은 아닐까?'라는 가정을 세우고, 어떻게 해야 불규칙한 현상을 규칙적인 원형으로부터 도출할 수 있을지를 고민하는 것 또한 역사언어학의 중요한 한 축입니다. 대체로 언어에 존재하는 불규칙성은 과거에 존재한 규칙이 변형된 결과이기 때문에, 논리 퍼즐을 풀듯 원형을 추측하고 규칙이 변형된 과정을 추론할 수 있습니다. 원형을 잘못 추측하면 변화 과정을 전혀 알 수 없지만, 원형을 잘 추측하면 그 뒤의 변화 과정은 실타래가 풀리듯 자연스럽게 따라오기 때문에 잘 추측된 원형은 그것이 잘 추측되었음이 매우 직관적으로 느껴집니다. 이것은 우리가 논리 퍼즐을 풀 때 먼저 한 가지 가능성을 대입해 보고 모순이 생기면 그 가능성을 배제하는 과정과 비슷합니다.
이 글에서는 지난 주말 (2025년 11월 22–23일), 오카야마 대학에서 개최된 일본언어학회 제171회 학술대회에서의 제 발표 내용을 다룹니다. 일본어나 류큐 제어에 대한 지식이 있다면 물론 더 잘 이해하실 수 있겠습니다만 그런 배경 지식이 없어도 대충 역사언어학이라는 학문이 이렇게 돌아가는구나를 대충 느낌만이라도 이해하실 수 있도록 풀어 쓰고자 시도했습니다.
과거 류큐 왕국에 속했던 일본 남서부의 도서 지역에서는 일본어와 같은 뿌리에서 갈라져나온 다양한 언어들이 사용되어 왔습니다. 오늘날 학계에서는 이들 언어를 아마미어, 오키나와어, 미야코어, 야에야마어, 요나구니어의 5개 언어로 분류하며, 이들을 통틀어 류큐 제어(琉球諸語 Ryukyuan languages)라고 부릅니다. 이들 언어를 잘 비교하면 이들의 공통 조상인 류큐 조어(琉球祖語 Proto-Ryukyuan)를 복원할 수 있는데, 이러한 비교 재구의 과정 역시 재미있는 주제이지만 이 글의 범위를 넘어가므로 안타깝게도 이 글에서는 다루지 않습니다. 아무튼 류큐 조어를 잘 복원하면 문헌상의 고대 일본어와 상당히 비슷한 언어가 나오고, 이를 통해 류큐 제어가 일본어와 같은 뿌리에서 갈라져나왔다는 사실과, 구체적으로 어느 정도 시기에 갈라져나왔는지를 알아낼 수 있습니다.
이 류큐 조어로 복원된 단어들 가운데 5개의 수수께끼 같은 단어들이 있습니다 (별표 *는 문헌상 나타나는 형태가 아니라 복원된 단어임을 나타냅니다).
① *umaᵑga "손자/손녀"
② *wekeᵑga "남자"
③ *wekeri "오빠/남동생"
④ *wenaᵑgo "여자"
⑤ *wonari "누나/여동생"
이들 단어가 수수께끼인 이유는 고대 일본어와 잘 일치하지 않기 때문입니다. 예컨대 ① "손자/손녀"는 옛 일본어로는 umaᵑgo로 o 발음으로 끝나지만 (현대 일본어 mago), 류큐 조어의 *umaᵑga는 *a 발음으로 끝납니다 (예컨대 현대 오키나와어 슈리 방언 ˀmmaɡa). 한편 ②, ③, ④, ⑤는 일본어에서 발견되는 형태와는 완전히 딴판입니다. 20세기 일본을 대표하는 유명한 역사언어학자들 가운데 하나인 무라야마 시치로(村山七郎, 1908–1995)가 지적한 바와 같이 (1981: 164–169), 그나마 ④가 옛 일본어로 "소녀"를 뜻하는 wonnaᵑgo와 닮기는 했습니다만, ④의 *wenaᵑgo와 비교하면 모음 o와 *e가 일치하지 않는 문제가 있습니다. 참고로 이 모음 불일치에 대해 무라야마 시치로는 "여자"를 뜻하는 류큐 조어 형태 (④)도 원래 일본어와 마찬가지로 모음 *o를 가졌는데 (즉 *wenaᵑgo가 아니라 *wonaᵑgo였는데), 뒤의 *a의 영향을 입어 *o가 *e로 변화했다는 가설을 제시했습니다. 이러한 변화는 역사언어학 용어로는 부분 동화(partial assimilation)라고 하는데, *o는 입술 모양이 둥근 원순 모음인데 반해 *a는 그렇지 않으므로, *a의 영향을 받아 *o가 입술 모양이 둥글지 않은 다른 모음으로 변화할 수 있는 것입니다. 그러나 정확히 동일한 조건에서 그러한 변화를 겪지 않은 ⑤의 존재를 생각하면 이 설명에는 그다지 설득력이 없습니다.
그러나 무라야마 시치로가 그랬듯이 모종의 모음 변화를 상정하기는 해야 합니다. 차분하게 생각해 보면, ②와 ③, 그리고 ④와 ⑤에 각각 공통되는 부분이 있습니다. 이들 각 단어를 우리는 다음과 같이 두 부분으로 나눠볼 수 있습니다.
② *weke-ᵑga "남자-사람"
③ *weke-ri "남자-형제"
④ *wena-ᵑgo "여자-사람"
⑤ *wona-ri "여자-형제"
남자 형제 또는 여자 형제를 의미하는 ③과 ⑤가 모두 *ri 발음으로 끝나므로 *ri는 "형제(sibling)"를 의미하고, 이것을 떼어낸 앞부분이 성별을 나타낸다는 것입니다. ②와 ④는 성별을 나타내는 앞부분만 다르면 되는데 뒷부분도 다르다는 것은 잉여적이므로, 앞서 언급한 ①과 일본어 umaᵑgo의 비교에서 보았듯, 모종의 이유로 ②에서만 *o가 *a로 바뀐 것처럼 보입니다. 한편으로 ④와 ⑤는 앞부분이 다르므로, 무라야마 시치로의 지적처럼 ④에서 *o가 *e로 바뀐 것입니다. 그러나 여전히 어떤 규칙에 의해 이렇게 모음이 바뀌었는지는 알 수 없습니다. 이런 식으로 동일한 의미를 가지는 어근의 모음이 서로 다른 단어에서 다르게 나타나는 모음 교체(vowel alternation) 현상은 류큐 조어에서는 일반적으로 찾아볼 수 없습니다.
그런데 이 '일반적으로 찾아볼 수 없다'라는 점이 거꾸로 단서가 됩니다. 일반적으로 찾아볼 수 없는 현상이 극소수의 단어에서만 나타난다면, 이것은 그 언어에 과거에 존재했던 현상이 거의 소멸하고 마지막 남은 흔적이거나, 아니면 외부의 다른 언어에서 들어온 특징임을 의미합니다. 이 경우는 어느 쪽일까요? 이 단어들이 과거의 특징을 보존하고 있다고 보기에는 ④가 일본어로 여자를 뜻하는 wonnaᵑgo와 닮았다는 점이 문제가 됩니다. 일본어 wonnaᵑgo "소녀"는 일본어와 류큐 조어의 공통 조상으로부터 물려받은 단어가 아니라, 일본어와 류큐 조어가 분기한 시점에는 존재하지 않았고 나중에 일본어에서 새롭게 만들어진 단어이기 때문입니다. 일본어 wonnaᵑgo "소녀"는 wonna "여자"에 접미사 -ᵑgo가 붙은 형태인데, wonna는 8세기 고대 일본어에서 "젊은 여성"을 뜻했던 womîna가 변화한 단어입니다. 따라서 류큐 조어에 우연히 일본어와 똑같은 변화를 겪은 이 단어가 존재했다고 생각하기보다는 류큐 조어와 동시대 (10–12세기경)의 일본어에서 들어왔다고 생각하는 것이 자연스럽습니다. 그렇다면 모음 교체 현상 역시 당시 (10–12세기) 일본어의 어떤 방언에 존재했던 발음을 따라한 결과로 생각하게 됩니다.
일본어 또한 이러한 복잡한 모음 교체를 원래 가지지 않았던 것은 문헌상의 고대 일본어를 통해 알 수 있으므로, 우리가 ①에서 ⑤까지의 5개 단어에서 관찰할 수 있는 모음 교체 현상은 어떠한 깊은 어원적 이유가 있는 것이 아니라 단순히 모종의 발음 변화 현상임을 우리는 알게 됩니다. 예컨대 영어에서 land와 England의 a의 발음이 다르다든지, 스페인어에서 duermo "(나는) 잔다"와 dormimos "(우리는) 잔다"의 앞부분이 duer-와 dor-로 다르다든지 하는 것과 같이, 어원은 동일한데 단어 속에서의 위치와 같은 어떠한 조건에 따라 발음에 차이가 생긴 것입니다. 그렇다면 이제 남은 것은 이 변화의 조건을 알아내는 일입니다. 이 목표를 위해 우리는 가상의 원형을 먼저 세웁니다.
① *umaᵑga "손자/손녀" ← umaᵑgo
② *wekeᵑga "남자" ← wo(to)ko-ᵑgo
③ *wekeri "오빠/남동생" ← wo(to)ko-ri? (뒷부분 어원 불명)
④ *wenaᵑgo "여자" ← wo(n)na-ᵑgo
⑤ *wonari "누나/여동생" ← wo(n)na-ri? (뒷부분 어원 불명)
앞서 언급했듯 ①의 원형은 umaᵑgo로 간주됩니다. ④와 ⑤의 앞부분은 wonna에서 유래한 것으로, 또한 이에 따라 ②와 ③는 동시대의 일본어에서 "남자"의 뜻으로 쓰인 wotoko에서 가운데 부분이 탈락한 것으로 간주하게 됩니다. 이 5개 단어의 원형에는 o가 (탈락한 부분을 제외하고) 무려 9개나 있습니다. 양쪽 (류큐 조어와 가상의 원형)에서 서로 대응되는 위치에 번호를 달아보면 다음과 같습니다.
① *umaᵑga₁ "손자/손녀" ← umaᵑgo₁
② *we₂ke₃ᵑga₄ "남자" ← wo₂(to)ko₃-ᵑgo₄
③ *we₅ke₆ri "오빠/남동생" ← wo₅(to)ko₆-ri
④ *we₇naᵑgo₈ "여자" ← wo₇(n)na-ᵑgo₈
⑤ *wo₉nari "누나/여동생" ← wo₉(n)na-ri
각 o의 변화를 보면 (1), (4)에서는 o가 *a로 변화하고, (2), (3), (5), (6), (7)에서는 o가 *e로 변화하고, 마지막 (8)과 (9)에서는 o가 그대로 *o입니다. 이렇게 무려 3가지 서로 다른 결과가 있기 때문에 복잡해 보이지만, 우선 o가 *a로 변화하는 것은 단어의 끝에 있을 때뿐임을 지적할 수 있습니다. 반대로 단어의 끝에서는 o가 *e로 변화하지 않습니다. 다시 말해, 단어의 끝에서는 *a 또는 *o, 단어의 끝 이외에서는 *o 또는 *e로, 각각 2가지 결과밖에 없습니다. 그러나 여전히 이 2가지 결과가 어떤 기준으로 선택되는지는 전혀 알 수 없습니다.
여기서 제 연구 발표 내용의 비밀 무기가 나옵니다. 바로 어휘적 강세(lexical stress)입니다. 많은 언어에서 (앞서 소개한 영어나 스페인어의 예처럼) 모음의 발음이 변화하는 것은 강세, 즉 단어에 따라 정해진 음절을 강하게 발음하는 현상과 관련이 있습니다. 강세를 가진 언어에서 강세가 있는 음절의 모음, 즉 강세 모음(stressed vowel)은 다른 모음보다 강하게 발음되고, 반대로 비강세 모음(unstressed vowel)은 약하게 발음됩니다. 영어 England의 예는 land에 Eng-이 붙어서 강세를 잃어버린 것에 의해 발음이 약해진 예이고, 스페인어 duermo의 예는 (제2음절 mi에 강세가 오는 dormimos와는 달리) 제1음절에 강세가 오기 때문에 o를 '더 강하게' 발음하고자 한 결과로 이중모음 ue로 모음 꺾임(vowel breaking)을 일으키게 된 역사적 변화의 예입니다. 비록 중심 어근은 동일하더라도 앞뒤에 무엇이 더 붙느냐에 따라 강세의 배치가 달라지므로, 같은 어근을 공유하는 단어라도 그 어근 부분의 발음이 다르게 되는 결과를 가져올 수 있습니다.
이제 어휘적 강세라는 색안경을 끼고 ①에서 ⑤의 다섯 단어를 바라보도록 합니다. 가설은 간단합니다. 한 단어에서 반드시 하나의 음절에 강세가 있고, 모음의 강세 유무와 모음의 위치 (앞서 언급한 대로 단어의 끝인지 아닌지)만을 가지고 o의 변화 결과를 예측할 수 있다는 것입니다. 원형의 모음 o는 단어의 끝에서는 *a 또는 *o, 단어의 끝 이외에서는 *o 또는 *e가 된다는 사실을 우리는 이미 알고 있습니다. 그 중 어느 것이 강세가 있을 때의 결과이고 어느 것이 강세가 없을 때의 결과인지를 먼저 알아내야 합니다. 여기서는 ②가 큰 도움을 줍니다. ②의 (2)와 (3)에서 o가 *e로 변화하기 때문입니다. 만약 o가 *e로 변화하는 것이 강세가 있을 때의 결과라면, (2)와 (3) 모두 강세 모음이라는 것이 되므로 한 단어에서 반드시 한 음절만이 강세를 가진다는 전제에 위배됩니다. 따라서 단어 마지막 이외에서 강세 있는 o는 *o가 되고 강세 없는 o는 *e가 된다는 것을 알 수 있습니다. 한편 ②는 3음절어인데 (2)와 (3)이 모두 강세를 가지지 않으므로 (4)가 반드시 강세를 가져야 합니다. 그리고 (4)에서 o가 *a로 변화한다는 사실로부터 우리는 단어 마지막에서는 강세 있는 o는 *a가 되고 강세 없는 o는 *o가 된다는 사실을 알 수 있습니다.
이 규칙을 ② 이외의 다른 4개 단어로 확장시켜도 모순 없이 모두 적용할 수 있습니다. 만약 단어 마지막의 o가 *a로 변하거나, 단어 마지막이 아닌 o가 *e로 변하지 않고 *o로 유지된다면, 그 단어는 그 위치에 강세가 있는 것입니다. 만약 단어 마지막의 모음을 제외한 다른 모든 모음이 원형에서 o인데 *e로 변했다면, 소거법에 의해 그 단어는 단어 마지막의 모음에 강세를 가져야 합니다.
① *umaᵑga "손자/손녀" ← umaᵑgó
② *wekeᵑga "남자" ← wo(to)ko-ᵑgó
③ *wekeri "오빠/남동생" ← wo(to)ko-rí
④ *wenaᵑgo "여자" ← wo(n)ná-ᵑgo
⑤ *wonari "누나/여동생" ← wó(n)na-ri
이렇게 도출되는 강세 위치를 양음 부호(´)로 나타내면 위와 같습니다. ①, ②, ③은 단어 마지막에 강세가 있고, ④와 ⑤는 단어 마지막이 아닌 위치에 강세가 있습니다. 여기서 '그래서 어쩌라고?'라는 감상을 가지실 수 있겠습니다만, 사실 여기에는 굉장히 재미있는 의미가 있습니다.
아시는 분들도 많겠지만 표준 일본어를 비롯한 일본어의 많은 방언에는 단어에 따라 정해진 음 높이가 있습니다. 이 체계는 문헌상으로는 한자의 뜻을 11세기 일본어 발음으로 풀이한 사전인 '유취명의초(類聚名義抄)' 등에서부터 뚜렷하게 나타나는데, 유취명의초에 기록된 당시 일본어의 음 높이 체계는 먼저 단어의 첫머리가 높게 시작되냐 낮게 시작되냐에 따라 둘로 나뉘고, 이 구분이 가장 중요한 구분입니다. 서양 일본어학계에서는 이 구분을 register라고 부르고 A (high register)와 B (low register)로 명명하며, 일본에서는 코키시키(高起式)와 테이키시키(低起式)의 두 '시키(式)'라고 부르는데, 이 글에서는 서양 학계의 용어를 따라 높게 시작하는 것을 A형, 낮게 시작하는 것을 B형이라고 부르겠습니다. 합성어의 경우에도 앞쪽 어근이 A형이면 A형을 따라가고, 앞쪽 어근이 B형이면 B형을 따라가는 소위 '시키 보존(式保存)' 법칙이 있습니다. 그런데 일본어 umaᵑgo "손자/손녀"와 wotoko "남자"는 B형이고, wonna "여자"는 A형입니다. 무슨 이야기냐면 '강세'라는 무언가가 존재해서 그것이 모음의 변화 결과를 결정한다는 가설을 세우고 강세 위치를 추론한 결과, 단어 마지막에 강세가 있는 것이 일본어의 B형과, 단어 마지막이 아닌 위치에 강세가 있는 것이 일본어의 A형과 일치한다는 결과가 나왔다는 것입니다.
이는 우리가 보고 있는 단어들이 일본어의 음 높이 구분을 강세로 변화시킨 당시 (10–12세기)의 어떤 방언의 흔적임을 알려줍니다. 이러한 가설에서는 강세 배치가 2가지 (A형에서 변화한 배치와 B형에서 변화한 배치) 존재할 것이 예상되는데, A형에서 변화한 단어는 모두 같은 강세 위치를 가져야 함에도 불구하고 ④와 ⑤의 강세 위치 차이 (④는 제2음절, ⑤는 제1음절)가 있는 것이 이상하게 보일 수도 있습니다만, ④의 경우 ᵑg가 자음 2개 분량의 역할을 할 수 있다는 점을 통해 이것을 설명할 수 있습니다. 많은 강세 언어는 개음절보다는 폐음절에 강세를 가지고자 하는 경향이 있는데, 예컨대 고전 라틴어는 보통 뒤에서부터 3번째 음절에 강세가 오지만, 뒤에서부터 2번째 음절이 폐음절인 경우 뒤에서부터 2번째 음절이 강세를 가집니다. ④는 뒤에서부터 2번째인 제2음절이 폐음절이기 때문에 그 음절에 강세가 오고, ⑤는 제2음절이 개음절이기 때문에 뒤에서부터 3번째인 제1음절에 강세가 온다고 생각할 수 있습니다.
실제 제 발표 내용은 이것으로 끝나는 것이 아니라 이와 연동되어 나타나는 자음의 불규칙한 변화를 통해 ①에서 ⑤의 다섯 단어뿐만 아니라 추가로 더 많은 예시를 제시하고 있습니다만 이 글은 이미 상당히 길어졌으므로 생략합니다. 아무튼 10‒12세기에 큐슈 지역에 존재했던 특수한 방언으로서 류큐 조어가 이 방언을 통해 일본어를 받아들였다는 점과, (이 글에서는 분량상 다루지 못했습니다만) 현대 일본 본토의 방언에서 이 방언과 유사한 흔적이 나타나는 지역의 분포를 고려하면, 이 방언은 헤이안 시대에 큐슈 지역을 총괄하는 관청이었던 다자이후(大宰府)의 관리들이 사용했던 구어임을 짐작할 수 있습니다. 복잡한 추론을 거치지 않고서는 이렇게 특이한 발음을 가진 방언이 과거에 존재했음을 전혀 알 수 없을 정도로 이 방언이 갑작스럽게 소멸한 것은 헤이안 시대의 종언과 함께 다자이후를 중심으로 한 큐슈의 질서가 해체된 것을 통해 설명됩니다.
이와 같이 류큐 조어의 5개 단어에서 나타나는 불규칙한 모음 변화 현상으로부터 퍼즐을 풀듯 논리를 전개해 헤이안 시대 큐슈의 언어 사정을 알 수 있게 된다는 것이 역사언어학의 묘미라고 할 수 있습니다.