<옆표지>
한국어 교육을 위한 기초 어휘 선정 n - 기초 어휘 빈도 조사 결과 -
문화관광부 한국어 세계화 추진 위원회
한국어 세 계 화 추진을 위한 기반 구축 사 업 1차년도 결과 보고서
제1 세부과제: 외국어로서의 한국어 교육을 위한 기초 어휘 선정
n 기초 어휘 빈도 조사 결과
세부 연구 책임자: 서상규(연세대학교) 공동연구원:남윤진(서울대학교) 진기호(한국외국어대학교)
문화관광부 한국어 세계화 추진 위원회 1998년 12월 14일 -2-
-3-
한국어 교육을 위한 기초 어휘 선정 <차 례> 권n 1. 서론..........................................................................................1 1.1. 어휘의 수(어휘량)에 관한 기본적인 전제 ....................................................1 1.2. 필수적인 어휘의 수 ........................................................................3 2. 기본 어휘의 개념과 범위.......................................................................6 2.1. 기초 어휘 .................................................................................6 2.2. 기본 어휘 .................................................................................7 2.3. 교육용 기본 어휘의 선정 ...................................................................9 2.3.1. 기본 어휘 선정의 방법..................................................................9 2.3.2. 기본 어휘와 사용률 ........................................................ 10 2.4. 어휘량과 기본도의 추정 ................................................................... 12 3. 현대 한국어의 어휘 빈도 정보의 추출 .......................................................... 18 3.1. “연세 말뭉치”(The Yonsei Corpora)의 구성과 그 용용......................................... 18 3.2. 낱말 빈도의 계량적 분석 .................................................................. 21 3.2.1. 낱말수의 통계적 분포 ................................................................. 22 3.2.2. 빈도 구간에 따른 낱말수와 빈도수의 증가율............................................. 23 3.2.3. 낱말수의 분포 ........................................................................ 26 3.2.4. 씨갈래별 분포 ........................................................................ 27 3.2.4.1. 빈도 구간에 따른 낱말수와 빈도수의 분포 ........................................... 28 3.2.4.2. 빈도 구간에 따른 낱말수와 빈도수의 비율 ........................................... 30 3.2.4.3. 높은 빈도 구간의 씨갈래별 낱말수와 빈도수의 분포 .................................. 31 3.3. 맺음말................................................................................... 32 4. 한국어 교육을 위한 교육용 말뭉치의 구성 ...................................................... 33 4.1. 교육용 말뭉치의 개념과 요건 .............................................................. 33 4.1.1. 한국어 교육용 말뭉치의 개념........................................................... 33 4.1.2. 한국어 교육용 표준 말뭉치의 요건...................................................... 33 4.2. 한국어 교육용 표준 말뭉치의 구성 ......................................................... 34 4.2.1. 표준 말뭉치 설계와 관련된 제반 문제................................................... 34 4.2.2. 표준 말뭉치의 구조 ................................................................... 35 4.3. 주 말뭉치의 설계 ......................................................................... 35 4.3.1. 텍스트의 범주화 ...................................................................... 35 4.3.1.1. 텍스트 외적 자질에 의한 분류...................................................... 36 4.3.1.2. 텍스트 내적 자질에 의한 구분...................................................... 37 4.3.1.3. 범주 분류 시안.................................................................... 38 4.3.2. 주말뭉치의 텍스트 범주 구성........................................................... 40 4.3.3. 주말뭉치의 장르별 분량 배정........................................................... 41 4.3.4. 주말뭉치의 구축 ...................................................................... 41 4.3.4.1. 텍스트의 선정..................................................................... 41 4.3.4.2. 주말뭉치.......................................................................... 42 4.3.4.3. 말뭉치 구성 텍스트 목록........................................................... 42 ............................................................................... 42 4.4. 결론..................................................................................... 45 4.4.1. 요약 ................................................................................. 45 4.4.2. 과제 ................................................................................. 46 5. 어휘 빈도 정보에 기반을 둔 기본 어휘의 설정 요소 ............................................. 47 5.1. 한국어 교육의 단계 ....................................................................... 47 5.2. 한국어 교육용 기초 어휘의 빈도 구간상의 분포 ............................................. 48
-4-
6. 기초 어휘의 검증............................................................................. 52 6.2. 검증 자료 ................................................................................ 52 6.3. 검증 자료와 기초 어휘의 합집합 ........................................................... 54 6.3.2. 합집합의 어휘 분포 ................................................................... 89 6.3.3. 합집합의 씨갈래별 어휘 비율 증감...................................................... 89 6.3.4. 합집합의 어휘 종수의 분포와 일치도.................................................... 90 6.3.5. 어휘 중복도 검증 ..................................................................... 91 6.3.6. 교육용 말뭉치의 어휘 빈도............................................................. 92 6.3.7. 어휘의 중요도 검증 ................................................................... 92 6.4. 검증 자료와 기초 어휘의 교집합 ........................................................... 93 6.5. 합집합과 교집합의 어휘 분포 .............................................................. 98 7. 외국어로서의 한국어 교육을 위한 기초 어휘 의미 빈도 .......................................... 99 7.1. 선행 연구 ................................................................................ 99 7.2. 어휘 의미 빈도 조사를 위한 요소 .......................................................... 99 7.2.1. 대상 어휘와 기반 사전의 선정.......................................................... 99 7.2.2. 빈도 조사를 위한 도구................................................................ 100 7.2.3. 의미 빈도 조사 대상 용례............................................................. 100 7.3. 한국어 어휘 의미 빈도의 시험 기술 ....................................................... 100 7.3.1. 임자씨(체언) ..............................................................................101 7.3.2. 풀이씨(용언) ..............................................................................102 7.3.3. 꾸밈씨(수식언) ............................................................................103 7.4. 결과의 분석 ............................................................................. 104 7.4.1. 작업상의 문제점 ..................................................................... 104 7.4.1.1. 용례의 정확성 문제............................................................... 104 7.4.1.2. 의미 분류 문제................................................................... 104 7.4.2. 의의 ................................................................................ 104 7.4.2.1. 실제 사용 빈도의 조사............................................................ 105 7.4.2.2. 용언의 격틀 빈도 파악............................................................ 105 7.4.2.3. 사전의 모형 제시................................................................. 105 7.4.3. 응용 ................................................................................ 105 7.5. 참고 문헌 ............................................................................... 105 8. 한국어 기본 어휘 후보 목록 5,000 .................................................................109 8.1. 범례.................................................................................... 109 8.2. 기본 어휘 후보 목록 5000(일반어휘, 빈도순) ...................................................110 8.3. 기본 어휘 후보 목록 5000(일반 어휘, 가나다순)................................................179 8.4. 기본 어휘 후보 목록 5000(토씨/씨끝 포함 빈도순)..............................................214 8.5. 기본 어휘 후보 목록 5000(토씨/씨끝 포함 가나다순)............................................283 권o 1. 2. 3. 4. 5. 6.
분석 대상 자료.............................................................................. 319 분석 방법................................................................................... 319 약호 해설................................................................................... 319 추가된 어휘................................................................................. 320 추가된 어휘의 등급판정 기준................................................................. 320 국내 한국어 교재 수록 단어 목록 ............................................................. 321
-5-
외국어로서의 한국어 교육을 위한 기초 어휘 선정 - 기초 어휘 빈도 조사 결과 -
1. 서론 교육용 기본 어휘의 선정은, 어휘의 교육 영역에서 매우 중요하고 필수적인 작업이다. 뿐만 아니라, 다른 모든 과제의 기초 가 되는 과제로서, 연구 결과물의 이용 범위가 넓고 파급 효과가 매우 큰 기반 과제의 성격을 지닌다. 그러나 이제까지의 연 구에서는 주로 기존 교과서의 분석에 치중한 바가 있으며, 객관적인 방법보다는 절충적인 방법으로 분석된 어휘 목록들이 제 시되어 있는 것이 대부분이었으므로, 실용적인 목적에 이용될 만한 결과를 도출하지는 못하였다고 할 수 있다. 또한 대규모의 어휘 빈도 조사 작업은 1950년대 이후로는 본격적으로 이루어진 바가 없다. 또한 이러한 부분적인 성과가 외국어로서의 한국 어 교육 분야에 이용된 사례도 그리 많지 않다. 이 과제의 목표는 외국어로서의 한국어 교육을 위한 필수 선결 과제인 교육용 기초 어휘를 대규모의 실제 언어 자료(말뭉 치)에 대한 국어학적, 정보학적, 계량적 분석을 통하여 선정하는 것이다. 이 과제의 결과물은 한국어 학습용 교재 개발, 사전 편찬 등에 직접적으로 이용될 것이며, 현재 추진 중인 국어 정보화 사업 등과 관련하여 정보화 시대의 한국어의 위상을 높이 는 데 크게 기여할 것이다. 어휘 학습의 단계적인 모형을 제시하기 위한 어휘의 분류도 이와 관련하여 연구될 수 있다. 이 글에서는 교육적인 목적에 맞는 어휘 분류와 말뭉치의 구축에 관한 논의를 하고자 한다.
1.1. 어휘의 수(어휘량)에 관한 기본적인 전제 어떤 언어의 모국어 화자도, 그 언어의 모든 어휘를 다 알고 부려쓴다고 자신 있게 주장하지는 못한다. 어휘부(Lexis)라는 것의 규모가 거대할 뿐 아니라, 그것은 언어의 다른 측면(음운이나 문법)에 비해, 아직은 정밀하게 구조화되어 있지 않기 때 문이다. 한국어의 음운의 수나, 음운 규칙의 종류와 수, 문법적 형태소나 문법 규칙의 수나 종류는 상대적으로 그 수효도 매 우 제한되어 있으며, 대부분의 문법에서 이미 상세히 기술되어 왔다. 음운이나 문법의 영역에 있어서는, 그 습득 과정에 있어서도 지속적으로 발달하여 일정한 시기에 완성된다고 할 수 있을 것이다. 그러나 어휘(부)에 있어서는 사정이 다르다. 일반적으로 개별 언어의 어휘의 수가 정확히 얼마인지, 또는 그 습득의 단계가 어떻게 되는지 아직 명확히 밝혀진 바가 없다. 게다가 음운이나 문법과는 달리, 어휘에 있어서는 화자의 생애 동안에
-6-
적지 않은 목록의 변화가 동반되므로, 평생에 걸쳐 학습해야 한다고 할 수 있을 것이다.1 다시 말해, 어렸을 때 쓰던 말들이 점차 쓰이지 않게 되는 일이나, 새로운 어휘의 등장과 학습 등이 반드시 있게 마련인 것이다. 이 점은 최근 수년 사이에 새로 이 등장한 어휘를 떠올려 보면 분명해질 것이다.2 그런 점에서 현실적으로 볼 때 ‘어휘부’에 관한 상세한 정보라고 하는 것은 대체적으로 잘 알려진 어휘의 의미나 형태적 특성 등에 편중되어 있고, 어휘의 수나 통계적인 특성들에 관해서는 상대적으로 무지한 상태라고 하지 않을 수가 없게 된다. 그 한 예로, 우리는 한 언어에 존재하는 어휘의 수가 정확히 얼마나 되는지 알고 있지 못하다. 다만, 사전편찬학자들의 경우 에 가장 큰 규모의 종합적인 사전의 표제항의 수로서 고려하고 있는 어휘의 수를 참조할 수 있을 정도이다. 그러나 이것도 우 리의 현실적인 의문에 답을 해 주지 않는다는 사실을 다음에서 볼 수 있다.3 언어 프랑스어
스페인어
독일어
영어
사전명(약호)
Le Grand Robert de la langue fran aise Grand Larousse encyclop dique Dicconario general ilustrado de la lengua espa ora Dicconario actual de la lengua espa ora Dicconario de la lengua espa ora
표제어의 수 25,000∼30,000 1985 70,000∼80,000 1959-1964 163,270 1987 1990 1992
2nd edition
85,000∼120,00 0
Das Groβe W rterbuch der Deutsche Sprache
1976-
180,000
Shorter Oxford English Dictionary
1973
163,000 252,259
Oxford English Dictionary
1989
Webster's Third New International Dictionary Standard Dictionary
1961 1905
부표제어를 포함할 경우, 약 2배
2nd edition 합성어/파생어(157,000), 구/결 290,500 합(169,000)을 합하면. 616,500
450,000 800,000
이 자료에서 볼 수 있듯이, 어휘의 범위를 어떻게 잡느냐에 따라서 최저의 25,000 표제항에서 많게는 무려 800,000만 표제 항에 이르는 격차를 보이게 된다. 이러한 격차를 야기시키는 원인으로는 여러 가지가 있을 수 있다. 첫째로는, 사전의 표제어 의 범위를 규범적(prescriptive)으로 정하는 경우와 그렇지 않은 경우에 ‘사전’에 수용될 어휘의 수가 당연히 달라지게 된다. 프랑스어와 스페인어의 경우에 특히 아카데미에서 정해진 ‘규범’이 사전에 영향을 미치는 예를 볼 수 있으며, 반대로 독일어 나 영어의 경우에는 ‘기술적’(descriptive)인 원칙이 우선되는 경향을 보인다. 한편으로 인명과 지명 따위를 포함하는 이른바 ‘백과사전적’(encyclopidic) 성격을 지니는가 하는 점도 표제어의 선택에 영향을 미치게 되는데, 영국보다는 미국이 더욱 그러 한 경향이 짙다. 표제어의 선택에 영향을 끼치는 또하나의 요소로, ‘전문용어’(technical term)를 어느 정도 수용하는가 하는 정도를 들 수 있 다. 아울러, ‘어휘(word)’라는 개념에 대립되는 ‘표제어’(entry)라고 하는 모호한 개념에도 적지 않은 영향을 받게 된다. 영어 사전에서, 다른 언어의 사전과는 달리, 표제항의 수가 엄청나게 많게 나타나는 것은 바로 이 점에서의 차이 때문이라고 볼 수 있다.
1
) 물론 전 생애를 걸쳐 같은 비율로 어휘가 습득된다는 것은 결코 아니다. 언어 습득 과정이라는 관점에서 본다면, 어휘부의 습득 역시 그 정도는 다를지라도, 음운이나 문법의 습득과 마찬가지로, 단계적인 발달 단계가 있음은 분명하다. 다만 그것이 확실히 밝혀져 있지 않 다는 것이다. 2 ) 현대 한국어에서 가장 새로운 말이 어떤 것인지는 현재 국내에서는 감시(monitering)되고 있지 않다. 간혹 신문사나 잡지사에서 한 해 의 기사에 등장한 신어나, 유행어 따위를 정리하여 책으로 묶는 일이 있을 정도이다. 끊임없이 변화하는 어휘의 명멸을 기록하고 자료 로써 정리하는 일은 일반 개인에게는 거의 불가능한 일이다. 우리의 경우, 국립국어연구원과 같은 기관에서 대규모로 지속적으로 이러 한 일을 수행함으로써, 그 정리된 결과를 학계에 제공하는 서비스가 절실히 요망된다고 할 수 있다. 3 ) Steven Dodd(1993:36-37)
-7-
1.2. 필수적인 어휘의 수 한 언어의 총수에 대해서 우리가 명확한 정보를 얻어내기가 매우 어려운 것이 현실이라면, 그리고 우리의 목적이 한국어의 학습을 위한 어휘의 선정에 있다는 것을 감안한다면, 이른바 학습에 필요한 필수적인 어휘의 수에 대해서 제한적인 논의를 할 수 있을 것이다. 그러나 실상은 이 문제에 대해서도 하나의 뚜렷한 해답을 얻기는 어려운 것 같다. 우선 가장 중요한 요소는 ‘필수’라고 하 는 경우, 무엇을 위해서 필수적인가 하는 목적과 영역의 문제가 제기되기 때문이다. 한 예로, 언어 학습을 위한 BBC 방송(1991)4에서는, 여행자의 생존을 위한 절대 최소의 어휘수로 약 100개의 단어와 구를 들고 있으며, 어떤 나라에서의 일정 기간 동안의 안락한 체재를 위해서는 약 1,000개 내외의 어휘가 필요한 것으로 제안하고 있다. 인공 언어(artificial language)의 고안자들에게서도 역시 비슷한 경향을 발견할 수 있다. Ogden의 ‘기초 영어’(BASIC English) 에서는 핵심어로 850개의 어휘를 들고 있으며5, Zamenhof의 에스페란토의 초기 단계에서도 약 900∼1,000개의 어근으로 구 성되어 있었다. 한편, 롱맨 현대 영어 사전(Longman Dictionary of Contemporary English. 1978, 1987)의 편찬자들은 선험적인 정의를 위한 어휘로 2,000∼3,000의 어휘를 사용하고 있다. 코빌드 사전에서는 2,000개(활용형을 별도로 친다면 3,000개)의 어휘 목록을 사용하고 있다. 이 때의 어휘 목록은 콜린스 코빌드 필수 영어 사전(Collins COUBILD Essential English Dictionary. 1988)의 ‘정 의’(뜻풀이. definition)에서 10번 이상 사용된 어휘들로 구성되어 있다. Alford(1971)는, 평균적인 한 쪽의 텍스트의 약 30%를 이해하기 위해서는, 주제와는 상관 없이, 10∼12개의 어휘를 단어를 아는 것으로 충분하다고 주장하며, 이는 언어의 장벽을 넘어서도 그대로 적용된다고 했다. MaArthur(1978)에 의하면, 거의 어 떤 텍스트의 85% 정도의 범위를 이해하기 위해 필요한 어휘의 수는 약 1,000개 정도라는 사실도 밝혀졌다. 이해의 범위를 만 일에 91-92%까지 올리려면, 약 2,000개의 어휘가 필요하게 된다. 또한 3,000개의 어휘를 가진다면, 이해의 범위는 약 95%에 이르게 된다. 이와 같은 사실을 종합한다면, 생존을 위해서는 약 1,000개의 어휘가 필요하며, 간단한 독서를 위해서는 약 3,000개의 어 휘가 필요하다는 것이다. 그렇다면 한 개인이 보유하고 있는 어휘의 수는 얼마나 될 것인가. 소유 어휘수의 추정에는 ‘화자의 다양한 계층’과 관련된 다고 일반적으로 생각되는데, 여기에도 엄청난 편차가 존재한다. 가장 적은 어휘수에 속하는 한 예로, Fries와 Traver(1960)에 서는 학생들은 약 3,000개의 어휘를 소유한다고 주장했다. 1930년대에 찰스 오그덴(Charles Ogden)은 다방 종업원은 7,000∼ 8,000개의 어휘, 공무원 노조원은 10,000∼12,000개의 어휘, 전문과학자는 60,000∼80,000개의 어휘를 소유하는 것으로 추 정하였다. 이와 관련하여, Garc a Hoz(1953:23-24)에 의하면, 윈스턴 처칠은 그의 저작에서 25,000∼30,000개의 어휘를 사 용하고 있으며, McCrum et al.(1986:102, 113)에 따르면 세익스피어는 약 30,000, 킹제임스 성경에는 겨우 8,000개의 어휘가 사용되고 있다고 보고하고 있다. Diack(1975)에서는, 여섯 개의 집단으로 나누어 어휘 수를 추정하고 있다. 즉, 어린 아이들은 6,000개 이내, 글자를 읽을 수 있는 12살의 아이들은 6,000∼12,000개, 대부분의 성인들은 12,000∼18,000개, 학위 과정의 학생은 18,000∼24,000개, 잘 교 육받은 전문가는 24,000∼30,000개, 전문적인 어휘 사용자6들은 30,000∼36,000개의 어휘를 가진 것으로 추정된다. 한편으로 Anderson과 Freebody(1981)이나 Miller와 Gildea(1987)에서는, 미국의 고등학교 졸업생들이 약 80,000개의 어휘를 보유하고
4
) Steven Dodd(1993:38) 5
) BASIC English의 어휘의 구성과 의미의 구성은 다음과 같다. [표1-Error! Main Document Only.] Basic English의 구성 [표1-Error! Main Document Only.] Basic English 각 단어의 의미의 수
6
) 예를 들면, 크로스워드 작성자, 언어 교사, 번역가 등을 말한다.
-8-
있는 것으로 주장하고 있다.7 가장 많은 수의 어휘를 추정하는 것으로는 Diller(1971:29)를 들 수 있는데, 여기서는 12살 짜리가 인식할 수 있는 어휘의 수는 약 135,000개로, 하버드 대학의 신입생은 약 200,000개의 어휘를, 전형적인 30세의 문학 박사는 250,000개의 어휘를 보 유한 것으로 보고하고 있으며, 미국 대학생들이 약 216,000개의 어휘를 보유한 것으로 주장하고 있다. 최근에 이르러, 뉴질랜드의 Goulden et al.(1990)에서는, 평균적으로 교육을 받은 영어의 모국어 화자가 보유하고 있는 어휘 의 수를 17,000개로 추정하고 있다. 우리나라에서도 각종의 조사를 통하여, 우리말의 어휘량을 밝히려는 노력이 계속되어 왔다. ① 학령전 유아의 사용 어휘량 김종훈(1975), 이상금 외(1971)에서는 취학전 아동을 대상으로 한 어휘량을 보고하고 있는데, 이를 간략히 보이면 아래와 같다.8 언어 (조사자) 연령 0-1세 1-1.5세 1-2세 2-3세 3-4세 4-5세 5-6세
김종훈 (1975)
한국어 이상금 외 (1971) 5 34 302 3,120 943
일본어 大久保
영어 久保
360 1,029 1,544 2,160 3,182
295 886 1,675 2,050 2,289
스미스
나이스
1 22 272 896 1,540 2,072 2,562
133 1,139 1,765 2,502 3,075
② 초등학교(국민학교) 학습용 어휘 한편, 초등학교 이상의 학습용 어휘에 관한 연구를 통해서도 어휘량에 접근하려는 시도가 적지 않았다.
7
) 아래의 표는 연령에 따른 어휘량의 발달을 보여 준다.<표> 이해 어휘량의 발달(玉村文郞編(1989;159)에서 재인용, 日本語と日本語敎育(上), 阪本一男, 私の基本語彙論)
8
) 이상금의 조사는 3, 4, 5,세 어린이를 구분하지 않고 조사 한 것이다.(3,120항목)
-9-
조사자 서정국(1968) 이응백(1972 안승덕,김재윤(1975) 이응백(1978) 이응백, 이인섭, 김승 렬(1982) 국어연구소(1986) 국어연구소(1987) 정우상(1987) 임지룡(1991)
조사 목적 초등 국어 전체 빈도 6 이상의 어휘 국민학교 학습용 기본 어휘 조사 초등 국어 교과서(3차)의 어휘 조사 국민학교 입문기 학습용 기본 어휘 조사
조사 방법
입문기 1학년 전체 교과서
국민학교 아동의 어휘력 조사
이응백(1972)+1,2,3,학년 전교과서(4차)
초등 전 교과서,아동 잡지
어휘량 2,365 17,10 7,603 1,480 15,00 5
국민학교 교육용 어휘(1,2,3학년용) 국민학교 교육용 어휘(4,5,6학년용) (4차 전교과서, 어린이 신문,잡지,학생작품) 국민학교 교과서 어휘연구,국어연구소 연
18,05 20,10
구보고서 국어의 기초 어휘에 대한 연구
8 9,590
국민학교 국어교과서(5차) 36권
③ 중학교 교과서 어휘 조사자 국어연구소(1988) 국어연구소(1988)
조사 목적
조사 방법 중학교 국어 교과서 6권 중학교 국사 교과서 상하권
중학교 교과서 어휘
- 10 -
어휘량 15,76 7,427
2. 기본 어휘의 개념과 범위
이제까지 이루어진 기존 논의들에서, 어휘 목록을 제시하는 경우는 대체로 기본 어휘와 기초 어휘에 대한 구분을 명확하게 하지 않은 채로 동의어처럼 사용하는 경우가 많다. 이응백(1969, 1972)에서는 학습용 기본 어휘를 “1) 사용도가 높은 어휘, 2) 사용범위가 넓은 어휘, 3) 조어력이 높은 어휘, 4) 기초적인 어휘”로, 한국교육개발원(1976)에서는 “1) 교과 학습에 기초가 되는 어휘, 2) 조어력이 높은 어휘, 3) 사용 범위가 넓 은 어휘”로 각각 규정하고 있다.
2.1. 기초 어휘 우리가 교육용 기본 어휘라는 개념을 사용하는 것과 관련하여 구분해야 할 개념 중의 하나로 ‘기초 어휘’라는 것이 있다. 기본 어휘라는 용어는 기초 어휘와 같은 뜻으로 쓰는 경우도 있지만 대체로 다음과 같은 차이점들을 보인다. 김광해(1993)에서는, 기초 어휘란 일상 언어 생활에 있어서 필수적인 단어 1천 개 내지 2천 개를 최소한으로 선정한 뒤, 이를 계통적으로 분류하여 제시한 체계를 말하는 것으로 정의하고 있다. C.K.Ogden 등이 국제적으로 사용되기 위한 제 2 언 어(국제 보조어)로서 도움을 주기 위한 목적으로 선정한 기초 영어(The System of Basic English) 850어 같은 것이 그 대표적인 예로서 유명하다. 여기서는 水谷靜·田中章夫(1988;79)에서 제창된 기초 어휘의 조건을 다음과 같이 인용하고 있다. 첫째, 그 어휘를 사용하지 않고 다른 단어를 대용하는 일이 불가능하여, 문장을 작성하는 일이 불가능해지며, 다른 단어를 대용한다고 하더라도 오히려 그것이 더 불편해진다. 둘째, 그 단어들을 서로 조합하여 다른 복잡한 개념이나 새로운 명명이 필요한 개념 등을 나타내는 단어를 쉽게 만들 수 있다. 셋째, 기초 어휘에 속하지 않은 단어를 설명하는 경우 결국에는 기초 어휘의 범위에 들어 있는 단어들에 의지하는 일이 대 개 가능하다. 넷째, 그 단어들의 많은 것은 오랜 옛날부터 사용되어 오던 것이며, 앞으로도 계속 사용될 가능성이 크다. 다섯째, 여러 방면의 화제에 흔하게 사용된다. 한편, 김종학(1995)에서는, 기초 어휘에 대한 개념을 규정하고 한국어의 특성에 맞는 기초 어휘 선정 기준을 설정하여 한국 어 기초 어휘를 선정, 이 가운데에서 표준적인 어휘를 선택하여 그에 대한 한국어 어휘사적인 분석을 하는 데 목적을 두고, M. Swadesh(1950)이 제시한 언어연대학을 위한 기초 어휘 연구를 행하였다. 여기에서는 기초 어휘의 판정의 절차에 관한 시사 적인 주장을 하고 있다. 첫째, 기존 사전의 표제어로 수록된 단어를 대상으로 하여 현대 한국어 어휘 중 고유어로 판단되는 어휘의 목록 작성 둘째, 형태적으로 단일어만을 선정 목록 재작성 셋째, 시간을 거슬러 올라가 15세기 문헌부터 현대까지 지속되어 온 어휘만 선정 넷째, 유아어 등 특수 계층에만 해당되는 어휘는 제외시킴. 다섯째, 의성어 의태어는 제외시킴. 여섯째, 의미가 특수분야에 관련되는 어휘와 문화적인 요소를 지니는 어휘는 제외시킴 일곱째, 도구의 명칭, 동식물의 종명에 해당하는 어휘는 제외시킴. 여덟째, 기존의 연구에서 외래어로 확인된 어휘를 제외시킴 아홉째, 동근파생어군별로 분류한 다음 공통어근을 중심으로 정리
- 11 -
열째, 알타이(Altai)제어에서 대응되는 단어를 찾아 대조함. 앞에서 언급한 연구에서 제시된 바에 따르면, ‘기초 어휘’를 추출하기 위한 방법론이 구체적으로 나타나 있지는 않으나 ‘기 존 사전’ 또는 ‘직관’에 의거하여, 어휘를 선정하는 것처럼 보인다. 이러한 기초 어휘는, 공시적이며 객관적인 방법의 하나로 서 계량적 분포(빈도수)의 분석에 따라 선정되는 기본 어휘와 구분되게 되는 것처럼 보인다. 즉, 방법론상으로 먼저 특성을 달리하는 것이다.9 기초 어휘가 대개 위와 같은 기능으로 사용되기 위하여 선정되는 것이므로 어느 나라에서든지 용의주도하게 선정된 기초 어휘의 목록을 가지고 있는 것이 보통이다. 영어에 있어서는 제 2 외국어로서 영어를 배우는 사람들을 위하여 E.L.Thorndike 등이 중심이 되어 1936년에 절충적 방법에 의해 선정, 발표한 2,000 어휘표가 유명하다. 또한, 일본에서도 1944년 일본 국제 문화진흥회에서 외국인의 일본어 교육에 도움을 주기 위한 목적으로 ‘일본어 기본 어휘’ 2,000어의 목록을 선정하였다. 이는 여러 명의 전문가가 참가하여 단어 하나 하나마다의 중요도를 판정하여 선출한 것이다. 우리 나라에서도 최근에 와서 이러한 부문에 관심을 기울인 연구 업적으로 임지룡(1991)을 대표적으로 꼽을 수 있다. 여기 에서는, 객관적 방법에 의해 선정된 고빈도어와 주관적 방법에 의한 의미 분야를 절충하여 내용어 1,500개의 기초 어휘를 선 정하였다. 이 어휘들은 여러 종류의 어휘 빈도 조사 가운데에서 대략 상위 빈도어 10% 이내의 범위에 해당하며, 그 중 제5차 교육과정에 따른 국민학교 국어 교과서 고빈도어 997개는 교육용 기본 어휘에 속해 있는 것이기도 하다. <표1> 우리나라의 주요 학습용 기본 어휘 조사
조사자 서정국(1968) 이응백(1972) 이응백(1978)
조사 내용 개별 어휘수 초등국어 전체,빈도 6 이상 2,365 어 초등국어 전교과서,아동,성인 잡지 17,104 어 입문기 아동 어휘(1학년용 전체) 1,480 어 이응백(1972)+4차 1,2,3 학년 전 교과서 초중고등학교 표준 어휘 목 이응백,이인섭,김승렬(1982) 15,005 어 록 국어연구소(1987) 4차 전교과서, 어린이 신문, 잡지, 학생 작품 18,055 어 정우상(1987) 4차 전교과서 20,108 어 국어연구소(1988) 이충우(1992)
중학교 국어 교과서 어휘
15,765 어
중학교 국사 교과서 어휘 국민학교,중학교 국어과
7,427 어 20,100 어
2.2. 기본 어휘 기본 어휘의 개념을 어떻게 정의할 것인가. 첫째는 좀더 포괄적인 개념으로서 작품이나 또는 한정된 언어 사용 국면에서 몇 개인가의 층을 형성하고 있다고 볼 수 있 는 경우, 여러 층에 걸쳐서 공통적으로 출현하는 어휘소의 집합을 가리킬 수 있다. 예컨대, 잡지라면 실용기사, 문예작품, 취 미 등 게재되는 내용별로 층을 형성한다고 볼 수 있거나, 또는 작품별로 층을 가상하는 일이 가능한데 이러한 경우 여러 층에 걸쳐서 공통적으로 출현하는 어휘의 집합이 기본 어휘라는 개념이다. 둘째는 좀 범위가 좁혀진 개념으로서, 언어 사용의 국면이 다양한 여러 영역으로 분리될 수 있다는 것을 전제로 하여 그 영역의 전개를 위하여 가장 기본이 되는 어휘의 집합을 가리키는 개념이다. 따라서 이러한 경우의 기본 어휘란 특정한 목적, 특정한 분야를 위한 ‘00기본 어휘’라는 식의 표현이 가능한 것이다. 예컨대,‘생활 기본 어휘’,‘학습 기본 어휘’처럼 사용될 수 9
) 한편, E. Horn(1926), A Basic Writing Vocabulary에서는 각종 편지를 자료로 50,000 어휘를 수집한 다음 그 가운데 빈도와 범위를 기 준으로 10,000 어휘를 선정하였으며, 土居光知(1933)에서도 역시 어휘 조사 후 1,000 어휘를 기초 일본어라 하여, 꼭이 방법론에 의 해서 두 개념이 구분되는 것은 아님을 알 수 있다.
- 12 -
있거나, 나아가서는 ‘국민학교 교육을 위한 기본 어휘’,‘중학교 수학 교육을 위한 기본 어휘’ 등처럼 ‘분야별 기본 어휘’라는 개념으로 사용될 수 있는 것이다. 이러한 개념의 기본 어휘를 선정하기 위해서는 분야별 고빈도어를 조사하는 일이 선행되어 야 하며, 이렇게 분야별로 빈도가 높은 어휘를 그 분야의 어휘 가운데 ‘기본도가 높은’ 어휘라고 말할 수 있다. 이충우(1994)에서는, ‘기초 어휘’를 “사용빈도보다는 한정된 소수의 어휘자료에 의해 기본이 되는 일상 생활 각 영역에서의 필요가 충족될 수 있도록 선정된 기본적인 어휘”로 정의하는 한편, ‘기본 어휘’를 “일상 생활에서 가장 기본적으로 사용되며 빈도가 높은 어휘 가운데 모든 사람에게 공통된 어휘의 상당수”로 정의하고, 정상적인 기본 생활을 하는 데 필요한 2,000-3,000어가 해당된다고 하고 있다. 또한 기본 어휘가 일상 생활에서의 기본 어휘라고 한다면, 학습에 필요한 어휘를 ‘학습용’ 기본 어휘라고 할 수 있으며, 학 습의 내용 목표가 되는 어휘를 ‘교육 어휘’라고 하여, 구별할 수 있는데, 학습용 기본 어휘보다 좀더 폭이 넓다는 점이 교육용 기본 어휘라 할 수 있다.10 한영균(1998)에서는 기본 어휘를 다음과 같은 두 가지의 측면에서 설명하고 있다. 우선 第2言語로 韓國語를 학습하는 이들이 익혀야할 基礎的 單語로서의 基本語彙도 크게 두 範疇로 나누어 다룰 필요가 있음을 지적해 두고자 한다. 그것은 學習者의 韓國語 學習 目的과도 관계가 있지만 무엇보다도 語 學習에 있어서의 어휘 습득의 단계와 깊은 관련을 가진다. 基本語彙의 첫째 유형으로 꼽을 수 있는 것이 生活을 위한 必須語이다. 이는 한국어 사용권에서 기본적인 활을 해 나가는데에 필요한 語彙를 가리킨다. 즉 基本的 對人關係 維持와 衣食住의 確保, 그리고 交通手段 共施設物 利用등 基本的인 생활을 하는 데에 필요한 語彙인 것이다. 이들은 대개 使用語彙11의 범주에 드는
言 생 公 것
으로 文語에서도 자주 쓰이지만 口語 話行에서 기초를 이루는 것이라고 할 수 있다. 이들에 대해서는 특히 적절 한 例文과 함께 정확한 意味 및 用法 區分이 필요하다. 基本語彙의 둘째 유형으로는 韓國語 學習에 기본이 되는 語彙를 들 수 있다. 이른바 學習用 基本語彙라고 할 수 있을 터인데, 使用 頻度가 높으면서 특정한 領域에 한정되지 않고 고루 사용되는 특성을 지닌다. 생활을 위 한 必須語가 주로 口語 話行에서 基礎를 이루는 것이라면, 이들은 특히 韓國語 文語의 理解에 기본이 되는 것들 이라고 할 수 있으며, 韓國語 學習의 初期 段階에는 使用語彙로서보다는 理解語彙로 중요한 것들이지만, 학습의 진전에 따라 능동적인 使用語彙가 되는 것들이다. 여기에서는, 생활을 위한 필수 어휘와 학습용 기본 어휘의 두 가지 측면을 통찰하고 있는데, 이것은 바로 우리의 연구에서 한국어 학습용 기본 어휘를 선정하는 과정에서 이루어질 ‘검증’의 작업을 통해서 반영되게 될 것이다.
2.3. 교육용 기본 어휘의 선정 2.3.1. 기본 어휘 선정의 방법 이제까지 어휘 선정과 관련한 연구로 가장 대표적이고 선구적인 업적 가운데 하나라 할 수 있는 Thorndike, E.L.(1921,1931,1944)12에서는 객관적 방법으로 많은 자료(1921년에는 41종, 1931년에는 200여종)를 분석하여 빈도와 분포를 10
) 이충우(1994)에서는 어휘교육과정은 어휘능력의 신장에 두어야 하며 다음과 같은 요소들이 반영되어야 한다고 보고 있다.1) 어휘는 어떤 순서로 가르쳐야 하는가? 2) 언어생활에 유용한 어휘는 어느 것인가? 3) 배우기 어려운 어휘는 어는 것인가? 4) 어휘 교 육에 활용 가능한 교수법은 어느 것인가? 5) 단어단독, 상관된 단어와의 대조,맥락을 이용한 방법 등에서 어떤 방법이 좋은가? 6) 구어와 문어의 차이와 이것의 경계구분과 방법은 무엇인가? 11 ) 使用語彙란 학습자가 습득해서 직접 언어 수행에 활용하는 어휘를 가리키고 理解語彙는 직접 언어수행에서 활용하지는 못하더라도 그 의미를 이해할 수 있는 어휘를 가리킨다. 제2언어 학습에 있어서의 사용어휘와 이해어휘의 구분이 필요함은 노마野間(1996)에서도 지 적한 바 있는데, 기본어휘 빈도용례사전의 편찬에 있어서 이러한 구분을 어떻게 적용할 것인가는 앞으로의 연구 테마로 남는다. 12 ) Thorndike, E.L.(1921) Teacher's Word Book 10,000 Words. Thorndike, E.L.(1931) Teacher's Word Book 20,000 Words.
- 13 -
통계적으로 처리하여 어휘의 순위를 발표하였다. Palmer, H.E.(1931)의 Second Interim Report on Vocabulary Selection에서는 경험적 방법(절충적 방법)에 의해 3,000 어를 선 정하였으며, West, Michael(1936)의 A General Service List에서는 경험적 방법에 의해 기존의 선정된 어휘를 토대로 2,060어를 선정하고 있다. 한편, Ogden, C. K.(1943)의 Basic English에서는 주관적 방법에 의해 일상 생활에서 주로 쓰이는 20,000어 가 량을 850어로써 대치하여 인간의 모든 정신활동을 표현할 수 있다고 믿고 대표적인 기본 어휘 850 어를 주관적으로 선정하 였다. 국내에서는 이호성(1934-7)에 의해 이루어진 교과서 어휘에 대한 조사 결과의 발표 이래, 문교부(1956)의 “우리말 말수 사 용의 잦기 조사”가 대표적이고도 본격적인 어휘 조사에 해당되는데, 여기에서는
초·중등 교과서가 표본의 50%를 차지하
고 있다. 서정국(1968)에서는 초등학교 교과서를 분석하여 빈도수에 따라 기본어휘 2,210어 선정하고, 학습용 기본어휘를 2,365어로 선정하였다. 이응백(1969)에서는 초등학교 국어교과서 편찬을 위한 학습 기본 어휘 설정에 관한 연구를 통해, 이어 류 17,104어, 연어류 251,485어를 분석하여 빈도 10 이상의 어휘를 선정하였다. 이 연구는 이후에도 몇 차례 이어져서, 이응 백(1978)에선 국민학교 1학년 어휘를 조사하여 입문기 기본 어휘 1,480어를 선정하였으며, 이응백, 이인섭, 김승렬(1982)에서 는, 이응백(1972)의 자료와 1982 개편 교과서의 어휘로 저·중·고 학년별 표준 어휘 목록 작성하였는데, 어휘 발달의 관점 에서 학년별로 학습용 기본어휘를 선정한 것이 특색이라 할 수 있다. 박붕배(1975)는 교과서 분석 후 각 교과에 나타난 어휘 외국어 교과에 나타난 어휘를 비교 분석하고 이들 각 교과 어휘들 이 국어 교과에 먼저 나타나야 한다고 주장하고 있다. 국립국어연구소(1986, 1987)에서는 국민학교 전 교과서 어휘를 조사하 여 이를 바탕으로 기존 어휘 조사와 어린이 이해 어휘와 사용어휘를 더하여 이를 교육용 어휘로 선정하였는데, 국립국어연구 소(1988)에서는 중학교 국어교과서의 어휘를 조사하고 있다. 이에 대해 김희진(1990)은 국립국어연구소 자료와 이응백(1972) 을 비교하여 중학교 교육용 어휘 2,795 단어를 제시하고 있다. 서덕현(1990)에서는 학교 어휘 교육에 기초 어휘가 많아서 아는 어휘 교육이 불필요하다고 하며 교육용 어휘에서 기초 어 휘와 기습득어휘는 제외해야 한다고 주장하고 있다. 이밖에도 교과서 어휘 조사의 예로는 안승덕, 김재윤(1975), 임광규 (1981), 정우상(1987),이충우(1991) 등을 들 수 있다. 기초 어휘라든가 기본 어휘에 해당하는 어휘는 대개 몇 백 개에서 몇 천 개에 이를 정도로 제한된 부분 집합을 구성하는 것이기 때문에 많은 수의 어휘를 대상으로 하여 인위적으로 선정하는 과정을 거치지 않으면 안 된다. 이러한 목록은 각각 중 요한 용도를 지닌다. 가령, 기초 어휘의 목록 같은 것은 외국인을 위한 언어 교육에 중요하며, 기본 어휘의 목록 같은 것은 자 국인을 대상으로 한 언어 교육, 또는 소사전의 편찬 등에 있어서 결정적으로 중요한 역할을 한다. 따라서 이같은 실용적 목적을 위하여 어떤 어휘의 목록을 선정하고자 할 경우에는 가장 합리적인 방법으로 각각의 목적에 부응하는 어휘를 선정할 필요가 있다. 특정한 목적 아래 어휘를 선정하는 방법에는 객관적인 방법과 주관적인 방법, 그리고 절충적인 방법 등이 있다. 김광해(1993)에서는 어휘 선정의 방법을, 객관적 방법, 주관적 방법, 절충적 방법의 세 가지로 나누어 설명하고 있다. 객관 적 방법은, 어휘 선정의 기준을 전적으로 통계 수치에 두는 것이다. 이것은 결국 어휘 자료에 나타난 빈도를 조사함으로써 얻 을 수 있는 것인데, 동일한 자료를 가지고 어휘소의 단위를 구분하는 방법과 분류 방법만 일치시키면 누가 조사하더라도 도 일한 결과가 나오게 되므로 개관적 방법이라 하는 것이다. 이러한 방법에 따라 이루어진 대표적인 사례가 E. L. Thorndike(1921,1931,1944)이다. 한편, 주관적 방법은 선정자의 주관적 판단에 기초를 두는 것이다. 특정한 목적에 부응하기 위한 어휘를 합리적으로 구할 수 없을 때 사용한다. C. K. Ogden(1930)에서 사용한 방법이다. 절충적 방법은, 어휘 조사의 결 과에 기초를 두고 주관적으로 판단하여 다방면에 걸친 단어들을 선정하여 나가는 경우가 있다. 종합적 방법, 경험적 방법이라 고도 하는데 이는 객관적으로 선정된 어휘 자료를 가지고 주관적 판단에 의하여 수정하여 더 합리적인 목적에 맞는 어휘를 선정하고자 하는 방법이다. H.E. Palmer(1931), M.West(1953) 등이 유명하며, 국어에서는 임지룡(1991)에서도 적용하여 어휘표
Thorndike, E.L.(1944) Teacher's Word Book 30,000 Words.
- 14 -
를 만든 바 있다.
2.3.2. 기본 어휘와 사용률 교육용 기본 어휘의 선정에 있어서는, 이미 김광해(1993)에서 언급된, 몇 가지의 개념을 전제로 하지 않으면 안될 것이다. 첫째, 어휘의 교육과 정책이라는 영역에서 다루게 되며 학습자의 언어 발달 단계에 맞추어 적절한 구성을 하여야 한다. 이 러한 과정에서는 학습자의 ‘이해 어휘’와 ‘사용 어휘’는 다르다. 자기가 직접 쓰지는 못해도 그 의미나 용법을 알고 있는 어휘 를 이해 어휘라고 하며, 수동적 어휘, 획득 어휘라고도 말한다. 말하거나 글을 지을 적에 사용이 가능한 어휘를 사용 어휘라 고 하며 능동적 어휘, 발표 어휘라고도 말한다. 일반적으로 사용 어휘의 양은 이해 어휘의 3분의 1 정도가 아닐까 하고 추정 되고 있다.(田中章夫,1988;57). 다음은 중요한 제 외국어에서의 기본 어휘의 수와 이해도에 관한 조사 결과에13, “조선어 빈도수 사전”과 서상규(1998)의 빈도 조사 결과를 대조한 결과이다. <표2> 어휘수와 이해도
언어 어휘수 150 300 500 1,000 1,500 2,000 3,000 3,500 4,000 5,000
영어
프랑스어
스페인어
중국어
일본어
48.0% 59.7% 67.1% 76.5% 79.0%
45.3% 51.5% 60.5%
80.5%
83.5%
81.0%
86.6% 90.0%
89.4% 92.8%
86.6% 89.5%
70.0% 75.3%
92.2% 93.5%
94.7% 96.0%
91.3% 92.5%
81.7%
한국어 조선어빈도수사전 서상규(1998) 34.0% 42.6% 49.4% 59.2% 65.2% 69.4% 75.2% 77.3% 79.0% 82.0%
55.9% 62.4% 67.8% 75.0% 79.0% 81.7% 85.2% 86.4% 87.4% 89.0%
임지룡(1991)의 어휘 빈도수에 근거하여 5,000 단어 정도면 대략 80 -90 %정도의 이해도를 나타낼 것으로 보고 있는데, 위 의 표에 추가한 “조선어빈도수사전”(1993)의 조사 결과와 서상규(1998)의 결과를 대조해 보면, 크게 다르지 않은 경향을 볼 수 있다. 그런데 한국어의 두 가지 결과에는 적지 않은 차이와 비교 대상의 문제가 있다. 첫째로, “조선어빈도수사전”의 최고 빈도 어휘에 대한 사용률이 서상규(1998)에 비하면 상대적으로 낮게 나타나다가, 5,000개에 이르러서는 그 격차가 가시적으로 좁혀 진다는 사실을 들 수 있다. 둘째로는, “조선어 빈도수 사전”의 어휘 빈도는 ‘토’를 제외한 것이므로, 서상규(1998)과는 단순히 비교하기가 어렵다는 것이다. 이 점과 관련하여, 한영균(1998)에서는 다음과 같은 지적을 하고 있다. 서상규(1998)은 연세대학교 언어정보개발연구원에서 축적한 총 4,300만 語節의 말뭉치를 自動 分析한 결과 로 助詞·語尾는 물론 일부 接尾辭까지 頻度 算出 對象으로 삼고 있어서 엄밀한 의미에서의 語彙 頻度라고 할 수는 없지만, 현재의 작업에서 의도하는 바 텍스트 안에서의 高頻度 語彙의 比率을 확인하기에는 충분한 자료가 된다. 이 연구 결과에 따르면, 4,300어절의 텍스트에 출현하는 語彙 중에서 累積比率 80%를 차지하는 上位 高頻度 語彙는 1,660개이고, 85%를 차지하는 上位 高頻度 語彙 수는 2,923개가 된다. 이 數値에는 高頻度 助詞, 語尾, 接尾辭가 포함된 것이어서 실제 語彙項目의 수는 이보다 적다. 대체로 텍스트의 85%를 차지하는 語彙는 2,500 13
) 일본국립국어연구소(1984)의 조사에 의함. 임지룡(1991)을 재인용.
- 15 -
개 안팎인 것으로 보인다. 이는 필자가 이 연구를 計劃하면서 韓國語 텍스트의 80∼85%를 차지하는 高頻度 語 彙는 약 3,000개 정도이리라고 豫想했던 것보다 적고, 日本語의 경우와 비교할 때에도 語彙의 多樣度가 낮은 수 준이라고 할 수 있다. 그러나 이러한 수치는 印歐語의 경우보다는 휠씬 높은 것이다.14 문제는, 밑줄을 친 것과 같은 것이 한국어와 일본어, 그리고 서구어 각각에 있어서의 어휘의 다양도의 차이를 그대로 반영 하고 있는 것으로 생각해도 좋을 것이냐 하는 것이다. 이들 각각의 조사 결과에서 취하고 있는 ‘어휘’의 단위가 모두 동일한 것인지 하는 문제에 대해서는, 앞서의 각주에서도 밝힌 바와 같이 재인용된 자료를 이용하고 있으므로, 당장에 확인은 불가능 하다. 그러나 위의 표에서의 일본어의 어휘 분포는, 서상규(1998)과는 달리, 묘하게도 “조선어 빈도수 사전”의 분포와 매우 유사 하게 나타난다. 서상규(1998)의 결과는 중국어의 분포와 유사하면서도, 구체적인 수치의 차이는 있을지라도, 전체적인 분포의 모양새로 볼 때 서구어의 결과와 크게 달라 보이지는 않는다. 이것은 무엇을 의미하는 것일까? 그 실마리는 “조선어 빈도수 사전”의 어휘 목록의 성격을 알게 되면 자연스럽게 드러난다. “조선어 빈도수 사전”에서는 “어휘”와 “토”(토씨와 씨끝)를 따로 다루고 있기 때문이다. 혹시 위의 일본어의 통계는 이른바 토씨와 씨끝 따위의 문법적 기능어를 제외한 일반 어휘만을 대상 으로 하고 있는 것이 아닐까 하는 의문이 제기되는 것이다. 이 문제에 대한 답을 구해 보기 위해서, 서상규(1998)의 자료를 두 가지의 형태로 가공해서 비교해 보기로 하자. 하나는 토 씨와 씨끝을 포함한 빈도 자료이고, 또다른 하나는 순수한 일반 어휘만으로 구성해 보는 것이다. 이 두 결과물을 비교할 수 있는 형태로 바꾸기 위해서는, 서상규(1998)의 목록에서 ‘토씨’와 ‘씨끝’을 제외한 목록을 만들고, 각각의 어휘의 사용률을 추 출해야 한다. 그 결과는 아래와 같다. <표3> 어휘수와 사용률(이해도)
한국어 언어 서상규(1998) 서상규(1998) 조선어 B(토/씨끝 A(종합) 빈도수사전 어휘수 제외) 150 55.9% 35.3% 34.0% 300 62.4% 44.0% 42.6% 500 67.8% 51.3% 49.4% 1,000 75.0% 61.4% 59.2% 1,500 79.0% 64.8% 65.2% 2,000 81.7% 71.2% 69.4% 3,000 85.2% 75.0% 75.2% 3,500 86.4% 77.1% 77.3% 4,000 87.4% 79.9% 79.0% 5,000 89.0% 81.3% 82.0%
일본어
중국어
영어
프랑스어
스페인어
45.3% 51.5% 60.5%
48.0% 59.7% 67.1% 76.5% 79.0%
80.5%
83.5%
81.0%
70.0% 75.3%
86.6% 90.0%
89.4% 92.8%
86.6% 89.5%
81.7%
92.2% 93.5%
94.7% 96.0%
91.3% 92.5%
토씨와 씨끝을 제외한 일반 어휘의 어휘수와 사용률(이해도)의 관계를 나타낸 서상규(1998)B에서는 “조선어빈도수 사전”과 대비해 볼 때 그 격차가 완전히 줄어들어 매우 유사한 경향을 나타냄을 알 수 있다. 그리고 그 경향은 일본어와도 거의 같은 수치에 접근함을 아울러 확인할 수 있을 것이다. 이를 통하여서, 최소한, 서상규(1998)의 빈도 자료의 어휘 분포가 여타의 일반적인 어휘 빈도 조사의 결과에서 크게 벗어나 지 않는다는 사실, 그리고 비록 적지 않은 자동 분석상의 오류를 내포하면서도, 4200여 만 마디의 대규모 말뭉치에서 얻어진 결과 자체의 신뢰성에 크게 손상은 가지 않는다는 것을 확인할 수 있게 된다. 물론, 우리가 관찰하려고 했던 기본 어휘의 수 와 사용률 간의 관계에서도 일정한 법칙성이 존재한다는 것을 아울러 알 수 있다. 이제, 현재까지 확보된 빈도 목록의 어느 선까지를 교육용 기본 어휘의 범위로 삼을 것인가 하는 문제에 접근하게 된다.
14
) 밑줄은 인용자가 친 것임.
- 16 -
2.4. 어휘량과 기본도의 추정 김광해(1993:86-88)에 인용된 바에 따르면, 「흠정성서」에는 6.568어, 「구약성서」에는 5,642어, 「신약성서」에 4,800 어 등의 어휘가 쓰이고 있으며, 세익스피어의 작품에 나타나는 어휘량은 약 21,000어, 밀튼의 작품에 나타나는 어휘량은 7천 내지 8천어라고 추정되고 있다. 프랑스의 언어학자 P.Guiraud는 빅톨 위고의 「세기의 전설」에 나타나는 어휘량을 약 6만어라고 보고 있는데, 이는 프랑스 작가들의 평균 어휘량보다 대단히 많은 것이라고 말한다. 그에 의하면 프랑스 작가의 평균 어휘량은 24,000 정도로 추정되고 있다. 또한 일본 국립국어 연구소에서 시행한 조사 결과에 따르면,「每日新聞」1949년 6월 1개월분의 개별 어휘량은 14,419어였 으며, 「萬葉集」의 어휘량은 6,505어, 「源氏物語」의 어휘량은 11,423어 등으로 조사된 바 있다.(田中章夫, 1988:55-6). <표4> 어휘조사에 의한 어휘량 <출처:田中章夫,1988;54>
H.Josselson의 러시아어 조사
41,115 어
(The Russian Word Count) H.K.Ku era & W.N.Francis의 미국 영어 조사
50,406 어
(Computational Analysis of Presentday American English) F.W.K ding의 독일어 조사(H ufigkeits liste)
43,699 어
종합 잡지의 어휘 조사 일본 국립국어연구소
41,038 어
(추정) 40,016 어
잡지 90종의 어휘조사 (인명,지명 제외한 수) 전자계산기에 의한 신문어휘 조사(시문 3개지, 1년분) (고유 명사,기호류를 제외한 수)
(30,336) 47,805 어 (29,822)
문제는 이러한 어휘에서 어떤 것을 기준으로 하여, “기본”의 성격을 규정할 것인가에 있다. 대체로, 광범위하고 다양한 성격 의 상이한 자료들을 조사 대상으로 삼아야 조사 자료에 편향된 어휘가 가능한 한 적게 반영이 된다고 할 수 있다. 광범위한 대량의 어휘 조사를 통하여 얻어진 고빈도 어휘군이라면 거의 기본적인 어휘의 집단이라고 보아 무방하다. 하지만 거의 유사 한 빈도를 보이는 고빈도어라고 하더라도 조사 대상의 어떤 범위에 편재하여 그러한 빈도를 나타낸 어휘와 전 영역에 폭 넓 게 분포함으로서 그러한 빈도를 나타낸 어휘가 있는데 기본도의 구별은 당연하다. 이러한 분포상의 특징을 감아하여 어떤 어휘가 기본어휘로서 자격이 얼마나 있는가를 판단하는 문제, 즉 어휘의 기본도를 판정하는 문제는 빈도의 다소를 ‘깊기와 얕기’, 분포의 폭을 ‘넓기와 좁기’라는 평가어로 표시하여 그 기본도를 판단하는 방법 이 개발되기도 하였다. 또 사용률(빈도)과 분포에 근거하여 어휘소의 기본도를 측정하는 ‘기본도 함수’라는 개념을 사용하여 어휘조사 자료를 대상으로 어휘소의 기본도를 산정하고 그것을 바탕으로 기본어휘를 추출하는 일도 있다 (田中章夫 1988; 65 김광해1993에서 재인용). 김광해(1993)에서는 ‘기본도 함수’의 개념을 소개하고 있는데, 일정한 기본 어휘를 선정하기 위한 객관적인 척도에는 두 가 지 유형이 있다. 1) ABF-IBM 방법 미국의 법조재단(ABF)과 IBM사가 공동으로 시행한 판례 검색 프로그램 개발 사업에서 사용한 어휘의 분류법이다. 이 방법
- 17 -
에서는 시종일관 인간의 주관적 판단을 배제하고 완전히 자동화하는 것을 목표로 삼고 있는 것이 특징이다. 이는 다음과 같 은 3단계로 나뉘어 실행한다. ① 판례의 어휘를 조사한다. ② 각 개별 어휘의 문헌수에 의한 사용률의 분포를 조사한다. ③ 왜곡도에 의한 분별 종형과 지수함수형을 모두 표준형이라고 보고 왜곡도를 계산하고 경계치에 들어 있는 어휘를 양분한다. 종형으로 정규분포 에 가까운 분포를 보이고 있는 것은 통상 기본어라든가 중요한 단어로 일컬어지는 것이기는 하지만 여기서는 비정보원으로 취급하여 제외시켜 버리고 높은 왜곡도를 보이는 단어들을 정보원으로 처리한다. 이러한 방법은 정보 검색의 키워드를 선정 하기 위한 관점에서 개발된 것이므로 기본어휘의 선정과는 정반대 입장이나 분별하는 기준은 공통된다. 2) 일본 국어연구소의 방법 일본국어연구소에서 시행한 잡지 90종의 어휘를 조사하는 연구에서 水谷(미즈타니)가 제안한 방법이다. ① 분산도의 계산 SC=( { { W}_{0 } } over {1- { W }_{0 } } )( { SUM { { Xj}^{2 } } over { Wj} } over { { X}^{2 } }-1) (이때 X는 어떤 어휘소의 전체적 사용도수, Xj는 j 층에서의 사용도수, Wj는 제 1층의 연어휘수÷전체 연어휘수, Wo는 Wj 가운데서 초소의 것으로 한다) 이 식은 층간분산을 초대층간분산으로 나눈 것이며, 0과1 사이의 값을 가진다. 각 층에 평균적으로 나타나는 경우에는 그 값이 0에 근접하는 값을 가지게 되며, 하나의 층에 집중하는 경우에는 1에 근접하는 값을 가지게 된다. ② 기본도 함수 Z = 0.6356 + 1.58525x - 0.4181y (이때 x=log10P + 5, Y=log10 SC +3으로 한다) 이것은 처음에 함수를 선형으로 정하고 125개의 자극어를 선정하여 사람들에게 판정을 시켜 그 결과와 가급적 일치하도록 정수를 결정한 것으로서 인간의 직관에 의한 판정을 가장 타당한 것으로 가정한 점에 특색이 있다. 이런 의미에서 순수하게 객관적이라고 말하기는 어려우나 일단 정수가 결정된 뒤에는 기계적으로 처리하게 된다. 국어의 경우의 경우, 언어 계량에 대해서는 신익성(1972)에서 관심이 제기되어 이상억(1986, 1989, 1990)에서 연구가 이어 졌으며 정영미(1993)에서 Zipf 법칙를 근거로 한 계량적인 분석이 이루어진 바 있다. 그렇다면, “교육용 기본 어휘”의 선정이 어휘 교육에서 갖는 의미와 적절성을 검토하지 않으면 안될 것이다. Beck, I.L., McKeown,M.G., & Omanson, R.C.(1987)15에서는 성인 어휘의 세 층위(tiers)를 다음과 같이 나누고 있다.
15
) The Effects and Uses of Diverse Vocabulary Instructional Thecniques. In McKeown, M.G. & Curtis, M.E. (Ed.), The Nature of
- 18 -
1) 첫째 층위 : 사람들은 직접 배우지 않더라도 충분히 잘 안다 대부분의 기초 단어 : 고양이, 어머니, 가다, 붉다 … 2) 둘째 층위 : 성숙한 언어 사용자라면 누구나 자주 사용하는 단어들 예 : 영향, 사려, 유용하다, 독특하다 … 3) 셋째 층위 : 사용빈도가 매우 낮거나 특정 영역에서만 제한적으로 쓰이는 단어들 예 : 허방, 해태하다 … 손영애(1992)에서는 ‘어휘력’을 양적 어휘력과 질적 어휘력으로 나누어 설명하고 있다. 이 두 개념의 내용은 다음과 같다. Ⅰ. 양적 어휘력 …… 어휘의 양 Ⅱ. 질적 어휘력 1. 어휘의 형태 1.1. 발음과 철자 1.2. 단어의 구조 2. 어휘소의 의미 2.1 여러 가지 종류의 의미 2.2 다른 단어들과의 의미관계 3. 어휘의 화용 3.1. 단어의 기능과 상황에 따른 사용의 제약 3.2. 적절하고 효과적인 단어의 사용 3.3. 상황에 적절한 단어의 의미 파악 3.4. 빠르고 효과적인 단어 처리 이를 종합한다면, 결국 어휘력은 어휘의 형태, 의미, 화용에 대한 지식 모두를 포괄하는 셈이 된다. Ruddell, M. R.(1994)은, Vocabulary Knowledge and Comprehension, Theoretical Models and Processes of Reading에서 어휘력 을 다음과 같은 세 가지의 개념으로 설명하고 있다. 1) 선언적 어휘력(declarative vocabulary knowledge): 단어의 의미에 대한 지식 2) 절차적 어휘력(procedural vocabulary knowledge): 어휘 처리 과정에 대한 수행적 정보와 행동목록. 텍 스트 속의 단어를 처리하는 능력 3) 조건적 어휘력(conditional vocabulary knowledge):다양한 행동을 전략적으로 적용하는 독자의 능력 교육용 기본어휘를 선정하는 기준은 다음과 같은 교육 상황에 맞는 변인을 고려한 판단이 아울러 필요하다. 이영숙(1996)은, 과학적이고 효과적인 어휘지도를 위한 ‘지도 대상 어휘’의 선정해야 하며, 어휘지도에 관한 연구에 따라 학습용 기본어휘 선정, 교육용 어휘 선정, 교과서 수록 어휘 조사, 어휘지도에 대한 일반론, 어휘지도법 연구(한자 이용, 문맥 이용)등이 고려되어야 한다고 주장하고 있다. 현재의 연구 결과에 따르면 초등학교 4학년부터 중학교 3학년까지 어휘력이 크 게 신장되는 시기라 할 수 있으므로 그러한 특성에 맞출 필요가 있다. 이러한 관점에서 지도 대상 어휘의 선정 원리로 다음과 같은 세 가지의 원리를 제시한다.
Vocabulary Acquisition, pp. 147-163, LEA.
- 19 -
(가). 유용성의 원리: 교수-학습 목표(어휘력 신장, 독해력 신장) 달성에 유용한 어휘를 지도 대상 어휘로 선정한다. (나). 효율성의 원리: 지도의 효율성이 큰 어휘를 지도 대상 어휘로 선정한다. (다). 단계성의 원리: 학습자의 어휘 발달 단계를 고려하여 대상 어휘 선정한다. 1) 아는 단어를 읽는 법 배우기 - 초등학교 저학년 과제 2) 이해 어휘를 표현어휘로 바꾸기 - 쓰기 영역, 말하기 영역 과제 3) 아는 단어의 새로운 의미 배우기 4) 아는 개념을 나타내는 새로운 단어 배우기 5) 아는 단어의 의미를 분명히 하고 풍부하게 하기 6) 새로운 개념을 나타내는 새로운 단어 배우기 개념 형성의 발달 단계와 개념 지식의 수준, 완전한 개념지식의 특성에 대한 지식을 바탕으로 한 단어 학습과제의 단계를 나누어 지도대상 어휘의 질적 선정을 해야 효과적인데, 이 때 고려되어야 할 변인으로서는 다음과 같은 것들을 들 수 있다. (가). 어휘 변인 : 유용성 1) 사용 빈도 2) 사용 범위 3) 조어력 4) 적용성 (나). 텍스트 변인 ; 텍스트 선정, 문맥 이용 1) 텍스트 이해에 요구되는 단어 지식의 수준 2) 텍스트 내 중요도 3) 텍스트 내 정보의 가용성 4) 텍스트의 잉여성 (다). 학습자 변인 : 단계성 1) 선행 지식과 사전 경험 2) 낯선 단어의 의미 파악 능력 (라). 교수-학습 상황 변인 ; 유용성, 효용성 1) 교수-학습 목표와 내용 2) 교육적 효용성 그런데 외국어 혹은 제2 언어 학습자의 변인은, 아동의 언어 습득과는 다른 측면이 있으므로, 선정 기준도 달라질 필요가 있다. 박경자 외(1994)에서는 제2 언어 교수 효과적인 지도를 위한 어휘 선택 기준으로 다음과 같은 조건을 들 고 있다. 1) 빈도수 2) 영역 (단어가 사용되는 상이한 교재와 발화의 본보기들) 3) 이용 가능성 ( 단어가 특정한 상황에서 사용될 수 있는 유용성) 4) 포함 가능성 (한 가지 단어로 표현할 수 있는 사물의 수) 5) 친숙성(해당 어휘소에 대한 학습자의 친숙한 정도) 6) 교실 의사소통의 유용성(교실에서 의사소통 할 때 이용되는 정도) 7) 학습가능성(모어와 목표어의 유사성에 기초한 학습의 용이성) 이와 관련하여, Mackey(1965)에서도 어휘 선정의 기준으로 다음의 다섯 가지 조건을 제시하고 있다.
- 20 -
1) 빈도 2) 범위 3) 유용성 4) 적용영역 5) 학습성 Johson D.D.& Pearson P.D.(1984)에서는 읽기용의 기초 어휘를 선정하는 기준으로 1) 고빈도 단어, 2) 지문에서 핵심적인 단 어, 3) 아는 단어의 새로운 의미의 세 가지를 제시하고, 교사의 정규적인 지도가 필수적인 단어로 1) 교과전문어휘, 2) 다의어, 3) 일반어휘 순으로 제안하고 있다. 이와 관련하여, Nagy W. E.(1991)에서도 독해력 향상을 위한 지도 대상 어휘로, 1) 개념이 어려운 단어, 2) 의미상 서로 관련이 되는 일련의 단어들, 3) 글의 이해 및 일반적인 언어사용에서 중요한 단어의 순으로 제시 하면서, 교사의 어휘 지도와 학습자의 자율 학습의 효용성 판단하기 위한 변인으로서 “학생, 텍스트, 어휘”의 셋을 들고 있다. 기본 어휘를 선정하기 위해서 고려해야 할 학습자들의 요구 사항으로서는, 언어 사실에 근거한 명백할 것, 개별적인 목적 에 따라 기대 수준이 다르므로 이에 대응할 수 있을 것, 양적으로 충분할 것, 경제적인 적정성이 확보될 것, 사용 및 관리가 용이할 것 등을 생각할 수 있다. 교육용 기본어휘는 다음과 같은 대상자에 따른 기준을 세울 필요가 있다. (가). 일반인 대상 (나). 외국어 학습환경 (다). 초등학생 수준 (라). 중학생 수준 (마). 고등교육 환경 학습자 (바). 전문적인 영역 연구자 규모에 따른 기준도 설정 할 수 있다. (가). 선정 어휘의 수 결정 기준 (나). 품사, 구성형식, 문형 제약 (다). 어휘수의 구분간의 선정 조건 (라). 용례의 제시 수준 판단 교육용 기본 어휘 선정의 적절성에 대한 검증 방법은 다음과 같은 요소들을 생각할 수 있다. (가). 사용자의 요구 사항과 대비 (나). 말뭉치 빈도 자료와 대비 (다). 중요도, 중복도, 분산 등 그러므로 이 연구에서는, 기본 어휘에 관한 앞에서의 논의에 바탕을 두고, 다음과 같은 과정을 통하여 한국어 교육용 기본 어휘의 선정을 시도한다. 1단계: “기본 어휘”의 개념의 수립
- 21 -
2단계: 말뭉치를 대상으로 한 어휘 빈도 조사 (1). 대규모(4,000만 마디 이상)의 연세 말뭉치의 어휘 빈도의 조사 (2). 교육 분야 텍스트의 어휘 빈도 조사: “한국어 교육용 말뭉치”(100만∼300만 마디 규모)를 구성하고, 어휘의 빈도를 추출 (3). 위의 두 가지의 어휘 빈도 자료의 상관을 분석하고, 아울러, 기존의 본격적인 어휘 빈도 결과의 대표 적인 “조선어 빈도수 사전”의 어휘 빈도의 분포와 대조한다. 3단계: 어휘의 분포와 단계의 분석 (1). 어휘 사용률(이해도)에 바탕을 둔 어휘 분포의 분석 (2). 어휘 증가율에 따른 구간의 분석 (3). 기본 어휘 후보 목록의 확정(약 5,000어휘, 사용률 80% 이상) 4단계: 어휘 목록의 검증과 보완 (1). 국어 교육을 위한 기본(기초) 어휘 자료와의 대조, 검증, 보완 (2). 한국어 교재의 어휘 사용의 분석 결과와 대조 (3). 한국어 사전의 ‘정의’에 나타나는 풀이말 용어의 어휘 빈도 조사 결과와 대조, 검증, 보완 (4). 기본 어휘의 중복도에 의한 중요도 설정 5단계: 한국어 교육의 단계(교과 과정)의 목표에 따라, 기본 어휘 구간과 목록을 획정한다.
- 22 -
3. 현대 한국어의 어휘 빈도 정보의 추출
연세대학교 언어정보개발연구원16 에서는 1986년 이래 현대 한국어 대사전의 편찬을 위해, 현대 한국어의 대규모 말뭉치 (corpus) 구축과 그 이용 방법에 관한 연구를 지속적으로 수행해 왔다. 1987년 연세 말뭉치1(약 300만 마디17)의 구축을 시작 으로 연세 말뭉치9까지의 말뭉치가 구축되어 활용되고 있다. 이 글에서는, 한국어 학습용 사전인 “연세 한국어사전”18의 편찬 과정 에서 이루어진, 말뭉치의 구축과, 그 이용 방법의 하나로서의 낱말 빈도 조사19의 방법론과 그 응용의 실제를, 빈도의 외 형적 특성을 중심으로 살펴보기로 한다. 특히, 1) 빈도 조사에서의 ‘단위’로서의 문법적 기능의 낱말(토씨, 씨끝)의 문제, 2) 빈도 구간별 씨갈래의 분포상의 특징, 3) 낱말수와 빈도수(사용률)의 관계, 4) 씨갈래에 따른 낱말수, 빈도수 각각의 분포와 상관의 특성을 검증하는 데에 초점을 맞춘 다.
3.1. “연세 말뭉치”(The Yonsei Corpora)의 구성과 그 용용 연세대학교 언어정보개발연구원의 말뭉치(이하, ‘연세 말뭉치’로 부름)는 1998년 2월 현재 약 4,200만(자세히는 4,264만 4,891) 마디가 구축되어 있다.20 이 “연세 말뭉치”는 1998년 현재, 모두 9개의 시대별 말뭉치(2개의 균형 말뭉치 포함)와, 이 를 재구성한 2개의 표준말뭉치21로 구성되어 있다.22 시대별 말뭉치는, 1960∼1990년대까지의, 현대 한국어의 글말을 중심으 로 구성되어 있으며, 현재 입말(구어)과 버금 입말(준구어) 자료가 추가되고 있다.23 이 말뭉치들은 한국어 사전의 편찬, 현대
16
) 1998년 3월부터, ‘한국어사전편찬실’에서 ‘언어정보개발연구원’으로 기구가 개편되었으며, 한국어사전편찬실은 현재, 언어정보개발실, 전산기술개발실, 대학원 국어정보학 협동과정과 함께, 이 연구원의 한 부서로 운영되고 있다. 17 ) 이는 띄어쓰기를 구분자로 하여 말뭉치 자료의 양을 나타내는 단위로, 일반적인 ‘어절’과 거의 같은 개념으로 볼 수 있다. 그러나 실제 자료에서는 규범으로서의 띄어쓰기의 규정을 완전히 적용한 예는 보기 드물며, 또한 일관된 원칙으로 통일하기에도 어려움이 있다. 따 라서, 이 때의 ‘마디’란 실제 언어 자료에서 ‘띄어쓰기’로 되어 있는 낱낱의 단위를 일컫는다. 18 ) 초기에는 1989-1991년에 이루어진 “현대 한국어 사전 편찬을 위한 한국어 자료의 선정과 그 전산적 처리에 관한 연구”(이상섭, 남기 심, 정찬섭, 이익환, 최윤철 공동연구, 연세대학교 학술연구비 보고서, 1991.6.)의 조사 결과에 의한 올림말을 1차 자료로 하고, 신기철 ·신용철의 “새우리말 큰사전”(1983, 3차 수정중보판)의 올림말 목록, 동아출판사의 “새국어사전”(1994)의 올림말 목록을 대조하여 사 전 편찬이 이루어졌다. 이 단계에서는 실제의 말뭉치에서의 용례 추출 결과(빈도와 쓰임)를 토대로 하여, 이희승의 “국어대사전”(1983), 한글학회의 “우리말 큰사전”(1992), 금성출판사의 “국어대사전”(1991), 사회과학원 언어학연구소의 “조선말대사전”(1992) 등의 해당 올림말의 처리 여부를 참조하여 올림말 선택에 이용하다가, 1996-1997년에 이루어진 연세 말뭉치 전체를 대상으로 한 낱말의 빈도 조 사 결과, 빈도 14 이상으로 나타난 낱말을 중심으로 약 5만 2천여 올림말을 확정하여 편찬되었다. 19 ) 이 보고는 문화관광부의 지원으로 ‘한국어세계화추진위원회’(위원장 김하수 교수)가 추진중인 “한국어 세계화 추진을 위한 기반 구축 사업”의 일환으로 이루어진 “한국어 교육용 기초 어휘 선정”(서상규 연구 책임, 남윤진, 진기호 공동 연구)의 중간결과물의 일부이기도 하다. 이 자리를 빌어, 연세 말뭉치를 이 사업을 위해 이용할 수 있도록 흔쾌히 허락해 준 연세대학교 언어정보개발연구원과 이상섭 교 수에게 고마움을 표한다. 20 ) 문화관광부의 지원으로 1998년부터 이뤄지고 있는 “세종21세기 국어 정보화 추진 중강기 계획”의 일환으로 수행되는 현대 국어 기초 자료 구축 사업에 언어정보개발연구원 역시 공동으로 참가중이며, 여기에서 새로이 개발, 구축중인 신규 말뭉치가 따로이 있으나 이 글에서 다루지 못하였다. 21 ) ‘표준말뭉치’로 불리는 2개의 말뭉치(표준말뭉치A: 1,160만 401마디, 표준말뭉치B: 1,788만 7,556마디)는 9개의 균형 및 시대별 말뭉 치를 토대로 하여, 특히 저빈도 낱말의 용례 추출의 효율성을 극대화하기 위해, 주제와 분야, 시대 및 장르, 언어적 성격 등을 고려한 비율로 재구성한 것이다. 22 ) 한국어의 표준적인 말뭉치 구성에 관한 명확한 구성 방법과 비율 등에 대해서는, 사용 목적과 방법에 따라서 달라질 수 있으며, 대체적 으로 100만∼300만 마디 내외의 각종 실험적인 말뭉치가 구성되곤 한다. 정찬섭 외(1990)나 남윤진(1997) 등이 바로 그러한 예이며, 『조선어빈도수사전』(1993)에서도 약 100만 마디의 규모를 분석의 대상으로 삼고 있다. 23 ) 여기서 ‘입말’이라 함은, 아무런 특별한 제약이나 통제 없이 이루어진 담화를 주로 녹취나 녹화 자료를 전사함으로써 얻어낸 자료를, ‘버금입말’(준구어)은 희곡이나 시나리오, 뉴스 따위의 본래 미리 작성된 스크립트를 바탕으로 하여 이루어진 발화를 모은 자료이며, 엄 밀히 말하자면 이를 다시 녹취 또는 녹화된 자료와의 대조를 통하여 교정함으로써 얻어지게 된다. 한편, 소설 따위의 문학 작품 등에 나타나는 대화들도 엄밀히 본다면 ‘입말’의 한 종류로 다룰 수 있겠으나, 방대한 자료 속에서 글말과 입말을 일일이 구분하여 다루기에 어려움이 있어, 일반적으로 글말로 분류한다. 그러므로 여기서 말하는 ‘연세 말뭉치’의 글말이란 입말의 상당 부분을 포함한 것이라 할 수 있는 것이다.
- 23 -
한국어의 낱말 빈도 조사 및 용법, 의미의 분석을 위한 용례 추출용의 자료로 활용되고 있다.24 말뭉치의 종류 균형 말뭉치
말뭉치의 이름 연세말뭉치1 (정찬섭 말뭉치) 연세말뭉치2 (정영미 말뭉치)
연세 말뭉치3 (1980년대) 연세 말뭉치4 (1990년대 입말뭉치) 연세 말뭉치5 (1970년대) 시대별 말뭉치 연세 말뭉치6 (1960년대) 연세 말뭉치7 (1990년대) 연세 말뭉치8 (교과서) 연세 말뭉치9 (아동 도서) <표5> ‘연세 말뭉치’의 구성
마디수 2,881,175 1,107,363
어절의 수 529,758 193,192
5,906,524 759,092 8,624,458 7,259,140 13,709,421 898,512 1,499,206
801232 1,090,072 995,841 1,338,695 137,144 187,769
‘연세 말뭉치4’를 제외한 “시대별 말뭉치”(말뭉치 3, 5-9)는 각 10년간의 주요 출판물을 모은 것으로, 앞서 언급한 균형 말 뭉치와 마찬가지로 각 분야를 모두 포괄하도록 종합적으로 구성하는 것을 목표로 하고 있다. 다만, 전체적인 구성으로 볼 때 ‘살아 있는 현대 한국어’를 추출하기 위해, 소설 등의 문학 작품의 비중이 상대적으로 매우 높다는 특성이 있다. (1). 연세 말뭉치1(정찬섭 말뭉치)25 이 말뭉치는, 연세 말뭉치 중 가장 이르게 구축된 말뭉치로,, 그 구성 단계에서 ‘현대 한국인의 독서 실태’에 관한 설문 조 사에 의해 구축된 말뭉치이다. 표본의 대표성을 확보하기 위하여, 일반인들에게 어떤 유형의 글이 얼마나 널리, 그리고 많이 읽히는지를 조사하는 방법을 취하였는데, 표본 선정 기준을 마련하기 위해 전문가 조사와 일반인 조사를 함께 실시하였다.26 (2). 연세 말뭉치2(정영미 말뭉치) 이 말뭉치는, 도서 대출 빈도에 따른 균형 잡힌 말뭉치를 구성할 목적으로 주제별 선정 기준을 사용하였다. 이 방법은 문헌 정보학적 방법을 응용한 것으로 가능한 모든 주제 분야의 낱말이 망라되도록 하기 위하여 듀이 십진 분류법(Dewey Decimal Classification)을 이용하여 한국어 문헌을 크게 열 가지 대범주(총류, 철학, 종교, 사회, 과학, 언어학, 순수과학, 응용과학, 예술, 문학, 역사 등의 분야)로 나누어 수집하였다.27 또한 도서의 대출 빈도는 각 낱말의 인지도를 간접적으로 나타낸다는 전제 아 래, 주로 1987-1988년의 도서를 대상으로 대출 빈도가 높은 자료를 중심으로 하여, 234개의 표본을 선정하여 1990년∼1991 년에 걸쳐 구축하였다. (3). 연세 말뭉치3(이상섭 말뭉치, 1980년대 우수 출판물) 사람들이 많이 접하는 문헌이 각 낱말의 인지도를 간접적으로 반영한다고 보고 “출판 저널”의 우수 출판물 목록에서 1980 년대 도서를 중심으로 표본을 선정하여, 1991년에 구축되었다. (4). 연세 말뭉치4(김하수 말뭉치1, 입말뭉치) 앞서 수집한 말뭉치 자료가 모두 글말 중심의 자료라는 문제점을 보완하기 위해 구축하기 시작한 말뭉치로, 현재도 지속적 으로 확충되고 있다. 입말은 자료의 선정, 수집, 전사의 과정에 고도의 전문성이 요구되어 구축 시간이 상당히 길어지게 된다.
24
) 아래 표의 ‘마디수’는 해당 말뭉치의 모든 표본에서 추출된 마디수 전체의 합을, ‘어절수’는 각 말뭉치에서 추출된 ‘각기 다른 어절’의 유형의 수를 나타낸다. 참고로, 이 통계를 얻는 과정에서는 . , ? ! ; : " ' ` 등의 9개의 구두점 및 특수기호를 제거하였다. 입말뭉치(연세 말뭉치4)를 제외한 연세 말뭉치의 4,188만 5,799마디의 자료에서 확인된 ‘각기 다른 어절’의 수는 328만 6,799개로 나타났다. 25 ) 당초 300만 마디를 목표로 1987년에 구축되었는데, 구축 과정에서 발생한 전자 파일 유실의 문제로 인해, 원 말뭉치1은 221만 7천 여 마디가 되었고, 1991년에 66만 3천 마디의 말뭉치를 보완하여, 현재는 약 288만 마디 규모로 구성되어 있다. 26 ) ‘전문가 조사’에서는 교과서의 배제 또는 표집 비율 조정, 문제 번역물의 표집과 관계된 문제, 독서물의 유목 분류 문제에 대한 조사가 이루어졌으며, ‘일반인 조사’에서는 전문가 연구의 결과를 토대로 독서물 유목을 작성하여 독서물 유목별 독서량을 조사하였다. 자세한 것은, 정찬섭 외(1990:7-70)를 참조 바람. 27 ) 주제별로 보면 총류(7.8%), 철학(9.9%), 종교(10.7%), 사회과학(12.8%), 언어(5.7%), 순수과학(11%), 응용과학(11.7%), 예술(8.1%), 문학(11.2%), 역사(11.3%) 등으로 구성되어 있다.
- 24 -
자료의 수집은 실제 사용된 입말을 녹음하여 전사하는 ‘순수 입말’과, 입말의 특성이 잘 나타나는 희곡, 방송 대본, 시나리오 따위를 중심으로 수집하는 ‘버금 입말’(준구어)로 나누어 진행되고 있다.28 (5). 연세 말뭉치5(1970년대 출판물) 1970년대 문헌을 대상으로 하여, 신문(10%)29, 소설·수필(50%)30, 일반서적(35%)31, 교과서(5%)32 등의 1970년대 문헌 자 료를 수집함으로써 구축되었다. (6). 연세 말뭉치6(1960년대 출판물) 대개의 국어학자들은 현대 우리말의 모습이 제대로 반영되기 시작한 것은 해방 이후로 보고 있다. 가능한 한 해방 이후의 우리말의 모습을 제대로 반영한 말뭉치 구축을 위해, 1980년대 이전을 10년 단위로 거슬러 올라가면서 말뭉치를 구축하기 시 작했으며, 이 말뭉치는 1960년대 자료를 수집함으로써 구축되었다. 원래는 1,000만 마디를 목표로 하였으나, 720만 마디에서 중단하였다. (7). 연세 말뭉치7(1990년대 출판물) 사람들의 말글살이에 가장 큰 영향을 미치는 것은 아무래도 당시의 언어 자료이다. 또한 1990년대도 중반기에 접어듦으로 써 1990년대의 언어 자료들이 현대 한국인의 말글살이의 가장 중요한 부분이 되었다는 판단에 따라 자료의 수집을 시작하였 으며, 1994년부터 1995년에 걸쳐 구축되었다. 위에 소개한 연세 말뭉치5, 6, 7은 거의 같은 구성 방법에 의해 구축되어 있는데, 주제별로 본다면 총류, 철학, 종교, 사회과 학, 예술, 문학, 역사학 등의 표본으로 구성되어 있으며, 전반적으로 볼 때 ‘문학, 사회과학’의 분야가 압도적으로 다수를 차지 한다. (8). 연세 말뭉치8(한영균 말뭉치, 교과서 말뭉치) 교과서는 학습자에게 가장 큰 영향을 주는 언어 자료이며 거의 모든 한국인들이 교과서의 영향을 받았다는 것은 분명한 사실이다. 물론 연세 말뭉치 1과 5에서 일부 교과서 자료가 수집되었으나 다른 자료들에 비해 상대적으로 부족한 분량이었다 는 판단 아래, 교과서를 대상으로 한 말뭉치를 따로 구축하기로 하였다. 대상 자료로는 국민학교에서 고등학교에 이르는 교과 서 중 국어과와 사회과를 중심으로 하였으며, 국민학교의 경우 거의 전 과목이 수집 대상이 되었다.33 (9). 연세 말뭉치9(김하수 말뭉치2, 아동 도서 말뭉치) 아동 도서는 순우리말의 사용 빈도가 높고 상대적으로 외래어의 사용이 적으며 문장도 비교적 우리말의 구조에 맞게 사용 되고 있다. 또한 한국어 말글살이의 한 부분을 아동들이 차지하고 있으므로 아동들을 대상으로 하는 언어 자료가 말뭉치의 일부가 되는 것은 당연한 일이라고 판단, 아동 교육용 도서 중에서 적합한 자료를 선정하여, 1996년에 구축하였다. 각 말뭉치의 주제별 구성과 규모를 종합하면 다음과 같다.34 28
) ‘연세말뭉치4’(입말뭉치)는 대화(26%), 강연(24%), 상담(14%), 희곡·대본(13%), DJ방송(13%), 토론(8%), 회의(2%) 등의 내용으로 구 성되어 있다. 다른 글말뭉치와는 달리, 여기에는 발화참여자의 나이, 성별, 직업에 대한 정보, 발화참여자의 수와 발화의 성격, 전사자 정보, 녹음 시간 정보 등이 덧붙여져 있다. 29 ) 동아일보, 조선일보, 중앙일보, 한국일보 등의 신문을 1971년부터 1980년에 이르는 기간을 격년씩, 즉 동아/조선은 홀수 연도, 중앙/한 국은 짝수 연도를 대상으로 하고, 각각의 신문은 한 달에 하루만을 무작위로 추출하되, 달과 해가 거듭될 때에 날짜는 하루씩 미루어 겹치지 않도록 하였다. 30 ) 모두 52권의 소설 작품집과, 13권의 수필집으로 구성되어 있다. 31 ) 역사, 기술, 사회과학 분야에서 모두 74권의 책으로 구성되어 있다. 32 ) 1975년의 국민학교 교과서로, 국어 6개 학년 전과정, 쓰기 6개 학년 전과정, 실과 4학년∼6학년, 바른생활 6개 학년 전과정, 국사 5,6 학년, 자연 6개 학년 전과정, 체육 4학년∼6학년 등을 입력, 구축하였다. 33 ) 이 말뭉치는 본래 울산대학교의 한영균 교수가 수집, 구축한 교과서 말뭉치를 제공받아 이를 토대로, 최신 교육 과정의 교과서를 별도 로 언어정보개발연구원에서 추가함으로써 구성된 것이다. 이 자리를 빌어, 귀중한 자료를 제공해 준 한영균 교수에게 고마움을 표한다. 34 ) 이 가운데 이미 자료의 구성이 밝혀져 있는 말뭉치1이나, 기준을 동일하게 적용하기 어려운 말뭉치4(입말뭉치)를 제외한다.
- 25 -
주제별 말뭉치 비율 (연 세 말 뭉 치 2-3,5-9 총 3,852만 4,124마 디 )
교 과 서 (고 교 ) 0.34% 교 과 서 (중 학 ) 0.17%
0( 총 류 ) 1.64% 1( 철 학 ) 2( 종 교 ) 3.25% 1.74%
교 과 서 (국 민 ) 2.71%
3( 사 회 과 학 ) 9.51% 4( 어 학 ) 0.16% 5( 순 수 과 학 ) 0.55%
9( 역 사 학 ) 3.92%
6( 기 술 과 학 ) 0.55% 7( 예 술 ) 2.54%
0( 총 류 ) 1( 철 학 ) 2( 종 교 ) 3( 사 회 과 학 ) 4( 어 학 ) 5( 순 수 과 학 ) 6( 기 술 과 학 ) 7( 예 술 ) 8( 문 학 ) 9( 역 사 학 ) 교 과 서 (국 민 ) 교 과 서 (중 학 ) 교 과 서 (고 교 )
8( 문 학 ) 72.91%
앞에서 소개한 말뭉치는, 궁극적으로 “시대별 한국어 대사전”의 편찬과 언어 정보 개발 및 처리를 위한 것으로, “연세 말뭉 치” 전체가, 현대 한국어 글말에 대한 “대규모의 표준적이고 균형적인 말뭉치” 구축해 나가기 위한 중간 산물이라고 할 수 있 다. 물론 앞으로 적정한 말뭉치의 내용 구성, 규모 등에 대한 더욱 세밀한 연구가 필요하다는 두말할 나위가 없다.
3.2. 낱말 빈도의 계량적 분석 낱말의 빈도란, “언어체계를 구성하고있는 요소들의 통계적특성과 언어사용에서 출현하는 언어현상의 확률적특성을 구체적 인 수자로 밝힌”(조선어 빈도수 사전, 2ㅉ) 것이라 할 수 있다. 이러한 빈도로 대표되는 통계적인 사실을 밝히는 목적은, 기계 번역이나, (자동) 사전 편찬 분야에서만이 아니라, (한)국어 교육이나, 문법 연구 등 각 관련 분야에서 활용될 수 있는 밑바탕의 재료를 제공하는 동시에, 그 통계적인 특성을 통하여 한국어의 양상을 더 깊이 이해할 수 있도록 한다는 의미도 아울러 지닌 다. 이를 위해서는, 낱말 빈도뿐만 아니라, 글자 빈도, 음절 빈도, 어절 빈도, 문형 빈도 등의 여러 측면에서의 고찰이 가능하 다.35 이 조사에서 사용된 빈도 추출의 단위는 복합적이다. ‘낱말’을 무엇으로 정의하느냐에 따라 분석의 단위가 달라지게 되는데, 여기에서는 씨갈래의 체계에 따른 각 낱말을 추출하는 것을 원칙으로 하되, ‘씨끝’도 분석의 대상으로 삼았으며, 안맺음씨끝과 씨끝(맺음씨끝)으로 갈라서 분석하였다.36 아울러, 조어법 수준의 단위로는 극히 일부의 가지(앞·뒷가지)와 결합, 준말은 불충분하게 분석되었으므로 주된 논의의 대 상으로 삼지는 않는다.37 35
) 본격적인 빈도 조사로는, 문교부의 “우리말에 쓰인 글자의 잦기 조사”(1955), “우리말 말수 사용의 잦기 조사”(1956)를 시작으로 하여, 문영호(1993)의 “조선어빈도수사전”(과학백과사전출판사)의 어휘, 토, 글자의 빈도, 김흥규·강범모(1997)의 “한글 사용빈도의 분 석”(고려대학교 민족문화연구소)에서의 자모와 음절 사용빈도 조사 결과나, 임칠성·水野俊平·北山一雄(1997)의 “한국어 계량연 구”(전남대학교 출판부) 등의 실제 말뭉치 조사에 의한 결과가 나와 있다. 36 ) 사실상은 토씨나 씨끝의 연결형을 가능한 한, 통합형을 낱낱의 하나로 삼았지만, 도움토씨 따위는 따로이 분석하는 것을 원칙으로 삼 았다. 이 부분은 앞으로 표본별로 토씨와 씨끝만의 빈도를 추출하는 과정에서 좀더 면밀히 다루어져야 할 것이다. 37 ) 낱말의 분석 단위의 결정의 원칙은 다소 통일되지 않은 면이 없지 않다. 이에 대해서는 추후 상세한 논의를 별도로 할 예정이지만, 몇 가지 세부적인 원칙을 소개하면 다음과 같다.<임자씨>c 합성임자씨나 복합임자씨는 하나로 다룬다. (예) ‘국민교육헌장, 윗사람 그 러나 사실상 컴퓨터에 의한 자동 분석에 의존할 수밖에 없는 이번 조사에서는 말뭉치에서 띄어쓰였을 경우에는 빈도가 각각의 구성 요 소로 흩어질 수밖에 없다는 문제를 안고 있다.d 하나의 형태가 둘 이상의 씨갈래에 속할 때에는, 자동분석에 따른 결과를 수용한다. (예) 오늘(이름씨/어찌씨), 가구(이름씨/매인이름씨)e 이름씨는 일반이름씨(→이름씨)와 고유이름씨로 갈라 통계를 내었다.f “-왕, -산, -강/이름+이가, -이는. -이도/-도, -시, -군, -면, -읍,-구,-리/성+씨”는 통합형을 ‘고유이름씨’로 한다.<풀이씨>c ‘말뿌리(어근)+파생 뒷가지’의 구성은 분석하지 않음. (예) 공부하다, 공부시키다, 참되다, 사랑스럽다 따위.d 풀이씨는 ‘움직씨, 그림씨, 잡음씨, 도움풀이 씨’로 갈랐다. e 합성풀이씨나 띄어쓰이지 않은 두 풀이씨의 결합은 가르지 않고, 하나로 다룬다.f ‘풀이씨 어간+어 지다’는 분석하지
- 26 -
그러나 이 조사에서는 약 4,200만 마디의 대규모의 말뭉치를 분석의 대상으로 삼았으므로 자연히 기계(프로그램)에 의한 자동 분석에 의존할 수밖에 없으며, 결과적으로 같은 씨갈래의 같은 꼴의 낱말의 중의성(동형어의 구별)은 해소되지 않았다. 다시 말해 여기서 다루는 낱말의 목록에서 이름씨의 ‘성’에는 ‘姓, 城, 性’ 따위의 구별이 없이 하나로 통합되어 있다는 것이 다.38
3.2.1. 낱말수의 통계적 분포 앞서 밝힌 4,200여만 어절 규모의 연세 말뭉치를 분석하여 얻어낸 ‘각기 다른 낱말수’(異語數)는 아래의 표에 보듯이 모두 46만 2,095개이다. 빈도 구간
낱말수 낱말수 낱말수 구간별 빈도의 빈도 비율 비율(누적) 빈도수 합 비율 사용율(누적)
1만 이상 488 0.11% 0.11% 9,999-1,00 3,015 0.65% 0.76% 999-100 13,874 3.00% 3.76% 99-10 38,076 8.24% 12.00% 9-1 406,642 88.00% 100% 합계 462,095 100% <표6> 연세 말뭉치의 낱말수와 빈도의 분포
30,505,83 8,532,818 4,190,766 1,273,594 655,027 45,158,04
67.6% 18.9% 9.3% 2.8% 1.5% 100%
67.6% 86.4% 95.7% 98.5% 100%
평균 빈도 62511.7 2830.0 302.0 33.4 1.6 97.7
각 낱말의 빈도를 모두 합한 전체 빈도의 합은 4,515만 8,041로 나타난다. 분석 대상의 말뭉치의 마디수가 4,264만 4,891 개라는 것과 비교해 본다면, 낱말의 수가 전체 마디수보다 늘어난 셈인데, 이것은 주로 문법적 형태소인 ‘씨끝’, 일부 ‘앞·뒷 가지’를 따로 분석해 낸 것과, 형태소의 자동 분석에서의 오분석(미등록어의 미처리 포함), 말뭉치 입력의 오류(글자, 띄어쓰기 등), 기타 고유 이름씨 등 기계에서의 자동 분석에서 제대로 처리할 수 없는 오류들에 의한 것이다.39 이러한 오류를 바로잡고 통계의 정밀도를 높이기 위해서, 자동 분석의 정확도를 높이는 방법과 사람의 손에 의한 오류 교 정의 두 가지 방법이 있을 수 있을 것이다. 이 조사에서는 후자의 방법을 택하여, 높은 빈도의 낱말로부터 낮은 빈도로 내려 가면서 낱말 빈도 목록의 오류 교정 작업을 수행하기로 하였는데, 이것은 사람이 일일이 빈도 조사의 결과(목록)을 보면서 잘 못된 정보를 제거해 나가는 일을 뜻한다. 이 일을 통해서 우리는 빈도 7까지에 해당하는 71,158개의 빈도 목록을 수정하였고, 그 결과 모두 64,666개의 낱말 목록을 얻을 수 있었다. 다시 말해, 이 과정에서만 6,492개의 오류를 제거한 셈이다. 이는 빈
않음. 형용사/동사+어(어미)+지(보조동사)g 풀이씨의 꼴바꿈(활용) 가운데 굳어진 것은 될 수 있는 대로 하나로 봄. (예) 그러나(어찌 씨)h 잡음씨의 형태는, 실제로 나타난 형태로 표시함.(게-> 거+ㅣ)<씨끝과 토씨>c 씨끝의 복합형은, 더 분석하지 않고, 그대로 싣는 것을 원칙으로 한다. 그러나 이러한 원칙을 일관성있게 조사의 처음부터 끝까지 유지하기란 그리 쉬운 일은 아니다. (예) 고서/고서는/ 고서도/고서라도d 씨끝은, 2가지 범주를 구분하여 표시한다. (맺음씨끝(→씨끝)/안맺음씨끝)e 토씨는 자리/도움/특수 토시의 표시를 하 지 않음.f 토씨의 결합에서는, 같은 범주의 결합시에는 결합형을 별개로 취급하며(엔, 엘 따위), 씨끝과 토씨의 결합은, 가능하면 통합 형으로 제시한다.<표기의 차이와 입말체>c 순수하게 말뭉치의 오류(글자가 틀린 것)가 명백할 경우에는 이를 고쳐서 바른 낱말 형태 의 빈도에 합산한다. 차레->차례, 책꽃이->책꽂이d 그러나, ‘조금, 쪼끔’ 따위와 같이, 닿소리나 홀소리 교체에 의한 의미, 말빛의 변 화가 있다고 판단되는 경우에는, 이를 다른 것으로 다룬다.e 맞춤법의 불일치는 그대로 살린다. 햇님/해님을 다른 것으로 취한다.f 입 말체의 형태는 따로 센다.(-으루,-루, -구) 38 ) 이외에도 띄어쓰기에 의한 단위 식별 문제나 합성어/복합어의 분석 한계 문제는 여전히 남는다. 예를 들어, ‘학습 기간’과 ‘학습기간’을 같은 것으로 다루어야 할 것인지 다른 것으로 보아야 할 것인지의 문제, ‘뛰어넘어들어가다’와 같은 예를 몇 개의 낱말 단위로 보아야 하는가 하는 문제들이 그러하다. 39 ) 이 글에서 분석의 대상으로 삼은 빈도 분석은 몇 가지 점에서 『조선어 빈도수 사전』(1990)의 빈도 분석과 다른 점이 있다. 첫째, 규모 상으로 통제된 소규모의 말뭉치에서 알 수 있는 사실을, 대규모의 말뭉치에서도 동일하게 나타나는가를 확인하기 위한 목적에서 이루 어졌다. 다시 말해 ‘확률’로 예측되는 사실을 실제로 검증해 보려는 데에 큰 목적이 있는 것이다. 둘째, 기계적이든 수작업에 의하든 간 에, 말뭉치에 미리 씨갈래나 의미 분석 정보를 붙인 후에 분석한 것이 아니라, 일반적인 형태소 분석기의 기법을 이용한 자동 분석에 근거하므로, ‘동형어(동음이의어)’의 구분이 되지 않는다는 단점이 있다. 셋째로, 여기에 소개하는 분석의 자료는 다시 자동 분석의 도구 에 반영되어 분석의 정확도를 향상시키는 데에 이용될 목적을 가진다는 것이다. 즉, 잘못된 분석의 해결이나 중의성을 해소하기 위한 토대 자료를 얻어내기 위한 목적도 아울러 지닌다.
- 27 -
<표7> 최저빈도 구간을 포함한 전체 낱말수와 빈도수의 분포 항목 낱말수의 낱말수의 빈도수의 합 빈도수의 비 빈도 구간 합 비율 율 일반 낱말 61,158 13.2% 25,004,36 55.4% 씨끝/토씨 1,672 0.4% 18,898,91 41.9% 빈도7이상 그밖 1,836 0.4% 672,535 1.5% 빈도 6 6,078 1.3% 36,468 0.1% 빈도 5 7,947 1.7% 39,735 0.1% 빈도 4 11,717 2.5% 46,868 0.1% 빈도 3 19,854 4.3% 59,562 0.1% 빈도 2 47,754 10.3% 95,508 0.2% 빈도 1 304,079 65.8% 304,079 0.7% 빈도7 이상 64,666 14.0% 44,575,82 98.7% 합계 빈도1-6 397,429 86.0% 582,220 1.3% 462,095 100% 45,158,04 100% 모두 합해
도 7 이상의 자료 중에 약 9.12%의 오류가 포함되어 있었다는 것이기도 하다. 이제부터 분석하게 될 64,666개의, 빈도 7이상 의 낱말 빈도의 분석은, 잘못을 모두 제거하고 수정한 결과로 얻어진 것이다.40 한편, 이 글에서 다룰 빈도 7 이상의 낱말을 포함한 전체 빈도의 분포, 특히 여기에서 언급하지 않을 빈도 6 이하의 최저 빈도 구간을 포함한 낱말수와 빈도수의 분포는 다음과 같다. 빈도 7 이상에 대해서는 일반 낱말과 씨끝/토씨 등을 갈라서 그 분포를 제시한다. 위의 <표>에서 알 수 있듯, 이 글에서 다루지 못한 빈도 6 이하 구간의 낱말수는 전체 낱말수의 무려 86%에 이른다. 그러 40
) 실제의 자동 분석에서 나타난 잘못을 수정하는 과정을 보이면 다음과 같다. 이러한 오류의 유형은 매우 다양한데, 그림에서의 ‘원표제항’과 ‘원품사항’은 각각 오류를 포함한 목록이 들어 있고, 이를 어떤 방식으로 수정했는가를 보인
것이다.
- 28 -
나 이들의 빈도를 다 합하더라도 전체 빈도수(사용률)는 단지 1.3%에 그친다. 특히 빈도 1의 구간에 전체의 65%가 넘는 30 만 이상의 낱말이 속해 있는데, 이들은 대부분은 자동 분석의 실패일 가능성이 매우 크다.41
3.2.2. 빈도 구간에 따른 낱말수와 빈도수의 증가율
한편, 빈도 구간별로, 낱말수와 빈도수의 분포를 살펴보면 매우 흥미로운 사실을 발견하게 된다. 이 그림의 ‘낱말수 분포’는 각 빈도 구간에 속한 낱말의 수가 전체(46만 2,095개 낱말)에서 차지하는 비율을 나타내며, ‘빈 도의 분포’는 각 빈도 구간에 속한 낱말들의 빈도 전체를 합한 빈도수가, 전체의 사용 빈도수(4,515만 8,034회)에서 차지하는 비율을 나타내고 있다. 두 개의 그래프는 평균 빈도인 97.7에서 서로 교차하고 있다. 이 평균 빈도 97.7에 가장 가까운 빈도 구간으로서 빈도 100 이상의 높은 빈도 구간을 대상으로 하여 초점을 맞추어 본다면, 단지 3.76%에 불과한 낱말수의 빈도만 으로도 사실상 말뭉치 자료 전체의 95.7%를 대변할 수 있다고 볼 수 있다.42 낱말수 빈도 낱말수의 비율 빈도의 합 17,377 43,229,420 100이상 3.8% 444,718 99이하 96.2% 1,928,621 합 계 462,095 100% 45,158,041 <표8> 높은 빈도 낱말과 낮은 빈도 낱말의 분포
빈도의 비율 95.7% 4.3% 100%
이러한 사실을 통해서 우리는, 빈도 100 이상의 높은 빈도 구간의 낱말이 전체의 3.8%인 17,378개에 불과한데도 이들의 빈도 총합은 전체의 무려 95.7%에 달한다는 것을 볼 수 있다. 낮은 빈도의 낱말의 경우는 이와 반대로, 수에서는 전체의 96.2%에 해당하는 낱말들이 차지하는 빈도의 총합은 고작 4.3%에 불과하다. 이 사실은 우리가 어떤 특정한 목적 아래 낱말 의 목록을 추출하는 데에 있어서, 단순히 모든 낱말을 대상으로 하는 것이 소모적이고 비경제적일 수도 있다는 사실을 암시 한다. 다시 말해, 전체의 약 3.8%의 낱말 분석만으로도 전체 자료의 95.7%를 설명할 수 있다는 것이다.
두 개의 그래프가 교차하는 지점은, 높은 빈도의 낱말과 낮은 빈도의 낱말을 가르는 가장 단순하고도 명확한 기준으로 보 인다. 다시 말해, 빈도 1만 이상의 최고 빈도 구간을 보면, 낱말수로는 전체 46만여 개 중의 단 0.1% 정도에 불과하면서도 이 들의 빈도 총합은 전체의 무려 67.6%나 차지하는 데 반해, 빈도 9∼1 구간은 이와 정반대의 모습을 보인다. 즉, 이 최저 빈도 구간의 낱말 수는 전체 낱말 수의 무려 88%를 차지하면서도, 실제 이들 모든 낱말의 빈도를 다 합해도 전체의 고작 1.5%에 불과한 것이다. 이것은 무엇을 말하는가? 실제 우리의 언어 생활에서는 높은 빈도의 낱말이 주로 사용되는 반면에, 낮은 빈도의 낱말이 쓰 이는 일은 상대적으로 매우 드물다는 사실을 나타내는 것이다. 따라서 만일에 우리가 위의 두 그래프의 교차점에서 높고 낮 은 빈도의 구간을 구분한다면, 그것이 전체 자료의 어느 정도를 대표하는가 하는 점을 고려할 필요가 있다. 전체 자료를 대상 으로 평균 빈도를 추출하면 97.7회로 나타나, 이것이 위의 그래프의 교차점에 거의 근사하다는 사실 역시 이를 뒷받침한다.
41
) 구체적으로 예를 들자면, “힝힝거린다, 힝힝거리는미친, 힝힝거리는, 힝힝거리게, 힝하고, 힝케만을, 힝을, 힛포크라테스의, 힛포크라테스 는, 힛포크라테스의, 힛틀러, 힛트러의, 힛트가, 힛타이트인, 힛타이트, 힛치콕이, 힛치관리차관보의, 힛치가, 힛지요, 힛잖여, 힛으먼, 힛 으닌게, 힛으니, 힛었는디, 힜어요” 따위들이 모두 ‘이름씨’로 처리되어 있다. 여기에서도 우리는 자동 분석에서 인식하지 못한 풀이씨 나, 고유이름씨, 말뭉치의 오류, 입말이나 방언 형태 등이 그 주된 원인임을 관찰할 수 있다. 42 ) 물론, 어떤 목적으로 이러한 통계 결과를 이용하느냐에 따라서 초점이 달리 놓일 수도 있다. 예를 들어, 이 글에서와는 달리, 프로그램 에 의한 말뭉치의 자동 형태 분석 도구의 개선에 목적이 있다면, 오히려 낮은 빈도 구간의 낱말들에 초점을 두고 관찰하는 것이 더 효 율적일 수도 있기 때문이다. 왜냐 하면, 이들 구간에는 매우 많은 “자동 분석으로 처리하기 어려운 오류와 중의성”을 지닌 결과가 모여 있기 때문이다. 실제로, 필자가 수작업에 의해, 오분석이나 과분석, 또는 추정 분석어를 관찰하는 과정에서도, 빈도 7 근처에 이르러서 는 오류율이 급증함을 경험할 수 있었다. 특히 4,200여만 어절의 분석 자료에서 빈도가 1이나 2 등의 낮은 빈도로 나타난다는 것은, 거 의 기계적인 자동 처리가 불가능하거나 현재의 기술로서는 다 다루어내기 어려운 것들이 대부분일 것이기 때문이다. 예컨대, 방언이나 입말, 고유이름씨 따위의 미등록어에 대한 추정 분석 등이 주종을 이룬다.
- 29 -
3.2.3. 낱말수의 분포 이미 앞서서 살펴본 바와 같이, 우리는 전체 평균인 97.7보다도 훨씬 아래의 빈도 7까지 오류 수정 작업을 거침으로써 한 층 신뢰성 있는 자료를 얻을 수 있었다. 빈도 오류의 수정 작업을 빈도 7까지로 한 것은 실제로 작업을 진행하는 과정에서 오류의 출현 비율이 상대적으로 급증하기 시작하는 지점이라는 데에 있었다. 이것은 매우 경험적인 결론으로써, 이제까지보다 더 큰 노력과 시간을 필요로 하겠지만43, 향후 빈도 6 이하의 자료의 수정이 완전히 이루어지게 된다면, 전체 낱말 수는 훨씬 더 급격한 수준으로 줄어들 것으로 예상된다. 그러나 이것은 본 연구의 목적 달성에 크게 영향을 끼치지 않는 것으로 판단된 다. 그 까닭은 이미 앞서도 언급한 바와 같이 이 빈도 구간에 해당하는 낱말만으로도 자료의 거의 대부분을 대표할 수 있기 때문이다. 이러한 작업의 결과로 얻어진, 빈도 7 이상의 64,666개의 낱말의 구체적인 분포는 다음과 같다. <표9> 빈도 7 이상의 낱말의 분포 항목 낱말의 갈래 낱말수 빈도구간 일반 낱말 61,158 빈도 7 이상 씨끝/토씨 1,672 그밖 1,836 합계 64,666
낱말수 비율 (상대빈도) 13.23% 0.36% 0.40% 13.99%
빈도수의 합 빈도수 비율 (상대빈도) 25,004,36 55.37% 18,898,91 41.85% 672,535 1.49% 44,575,82 98.71%
위의 표에 나타난 바와 같이, 최고 빈도어로부터 빈도 7에 해당하는 낱말의 수는 전체의 약 14%에 불과함에도 이들이 차 지하는 빈도 총합은 전체의 무려 98.8%에 해당한다. 이를 보여 주는 또 하나의 추세는 이미 앞에서 살펴본 <표2>의 가장 오 른쪽에 있는 ‘평균 빈도’와 낱말수와의 상관 관계인데, 낱말수는 각 구간에서 증가하는 데 대해 평균 빈도는 반비례한다. 즉, 1만 이상의 낱말들 전체의 평균 빈도가 62,511인데 비해, 이하 구간에서는 급격히 평균 빈도가 줄어들고, 이 표에는 나타나지 않은 빈도 6 이하에서는 낱말의 수가 급격히 증가하는 반면, 평균 빈도는 급격히 줄어들게 되는 것이다.
3.2.4. 씨갈래별 분포 먼저 최고 빈도 구간이라 할 수 있는 빈도 1만 이상의 488개의 낱말들의 씨갈래별 낱말수와 그 비율의 구성은 다음과 같 다.44 씨갈래 이름씨 고유이름씨 매인이름씨 대이름씨 셈씨 매김씨 움직씨 그림씨
낱말수 149 3 31 19 6 14 79 11
<표10> 빈도수 1만 이상의 씨갈래별 분포 비율 씨갈래 30.5% 0.6% 6.4% 3.9% 1.2% 2.9% 16.2% 2.3%
잡음씨 도움풀이씨 어찌씨 씨끝 안맺음씨끝 뒷가지 토씨 전체
낱말수
비율
3 17 38 68 6 6 38 488
0.6% 3.5% 7.8% 13.9% 1.2% 1.2% 7.8% 100%
그런데 이 구간에 속하는 488개의 낱말 중, 토씨(38개)와 씨끝(68개)/(6개), 뒷가지(6개)의 118개의 낱말을 제외한 나머지의 일반 낱말은 모두 370개로 낱말의 수로는 일반 낱말이 3배 이상이지만, 그 빈도수의 합(사용률)은 반대로 문법적 형태(토씨,
43
) 연세 말뭉치와 같은 대규모의 말뭉치의 빈도 결과를 수작업으로 수정한다는 것은 거의 불가능에 가깝다. 즉 빈도 6 이하에 속하는 약 40만여 개의 항목을 일일이 사람이 확인하며 수정하는 일이기 때문이다. 오히려, 말뭉치에 대한 품사 정보 등의 자동 꼬리붙이기(태깅) 의 정확도 향상이나, 규모가 작은 말뭉치의 빈도 결과에 바탕을 둔 확률적인 처리가 오히려 더 현실적이다. 44 ) 이 자료에서는 잡음씨가 “이다(977,775), ㅣ다(14,110), 아니다(102,336), 아이다(62), 앙이다(58)” 등의 모두 다섯 가지의 형태로 구 분되어 올라 있다.
- 30 -
씨끝류)가 18,466,782로, 일반 낱말의 빈도수의 합은 12,039,054으로 나타나, 대조를 이룬다. 결국 일반 낱말과 문법적인 형 태는 통계 처리상 별도로 처리하는 것이 오히려 낱말의 분포적 성질을 이해하는 데에 도움이 될 것으로 보인다. 이는 이들 문 법적 형태의 경우에는 그 수효가 제한되어 있을 뿐더러, 사용의 빈도는 그밖의 일반 낱말들과는 비교가 안될 만큼 크기 때문 이다. 다음의 두 개의 그림은, 빈도 7 이상의 64,666개의 낱말들 전체에 대한 씨갈래별 낱말수와 빈도수의 분포를 나타낸다. 빈도 1만 이상의 최고 빈도 구간에서의 씨갈래별 분포<표6>과 비교해 볼 때, 낱말수에서는 임자씨 중, 이름씨와 고유 이름 씨의 비율이 매우 크게 늘어난다. 이에 비해 다른 씨갈래의 낱말들은 대체로 전체 낱말수에서 차지하는 비율이 줄어들고 있 다. 특히, 워낙에 소속 낱말수가 한정되어 있는 문법적 형태인 ‘토씨’와 ‘씨끝’의 낱말수 비율은 급격하게 줄어들게 된다. 이 사실은 빈도 7 구간 이하의 최저 빈도 구간에 이르면 거의 대부분이 ‘이름씨’로 채워질 가능성을 시사한다고 볼 수 있다.
이와 같은 조사 결과를, 이전에 이루어진 다른 조사 결과와 대조해 보이면 다음과 같다.
이제까지 이루어진 몇 가지의 빈도 조사 결과와 비추어 보건대, 조사 규모의 대소의 차이는 있으나, 대체적으로 엇비슷한 그래프 모양을 나타낸다는 사실을 알 수 있다. 다만, 주로 교과서를 대상으로 한 조사 결과에서 특히 움직씨와 매김씨의 비율 이 다소 높게 나타난다는 특징을 보인다는 점에서 특이한데, 이는 교과서 문장 구성의 특성, 즉 문체론적 성격과 관련이 있을 가능성이 있다.
3.2.4.1. 빈도 구간에 따른 낱말수와 빈도수의 분포 각 씨갈래의 낱말들은 각 빈도 구간에 어떤 모양으로 분포할까? 가장 오른쪽의 ‘전체’를 보면, 1만 이상의 최상위 빈도 구 간에 1% 미만이, 빈도 1,000 이상의 구간에 약 5%, 빈도 100 이상의 구간에 약 21%로 분포하고, 99∼7의 저빈도 구간에 70% 이상의 낱말이 분포하는 것으로 나타난다. 그렇다고 해서 모든 씨갈래의 낱말들이 평균 빈도 이하의 저빈도에 집중되 어 있는 것은 아니다.
- 31 -
각씨갈래의구간별분포 100% 90% 80%
비율(%)
70% 60% 50% 40% 30% 20% 10% 0% 이름씨 1만이상
그림씨/ 도움풀 고유이 대이름 매인이 셈씨 움직씨 어찌씨 매김씨 느낌씨 씨끝 름씨 씨 름씨 잡음씨 이씨
토씨
그밖
전체
0.38% 0.06% 13.10%6.19% 8.16% 0.77% 0.43% 30.91% 1.26% 11.20% 0.00% 6.04% 8.80% 0.32% 0.75%
9999-1000 3.80% 0.80% 15.86%25.77%24.21%6.09% 5.74% 23.64% 8.49% 20.00% 6.27% 10.44%17.36%1.89% 4.66% 999-100
20.57%12.60%25.52%28.87%31.84%25.90%32.47%20.00%23.06%31.20%19.86%29.69%28.24%5.88% 21.45%
99-7
75.24%86.54%45.52%39.18%35.79%67.25%61.36%25.45%67.20%37.60%73.87%53.83%45.60%91.91%73.13%
씨갈래
이 그래프에서 가장 특징적인 것은, ‘도움풀이씨’가 최상위 빈도 구간에서의 비율이 매우 높게 나타난다는 점이다. 도움풀이 씨는 특히 각 구간의 분포 비율이 매우 균등하게 나타나고 있다는 특징도 아울러 보여 준다. 즉, 전체 평균 빈도인 99.7 이상 의 범위에 50% 이상의 낱말수가 분포하여, 최저 빈도에서는 겨우 25% 정도만의 낱말수가 쓰이는 것으로 나타난다. 정도의 차이는 있으나, ‘대이름씨(13.1%), 매김씨(11.2%), 매인이름씨(8.16%), 셈씨(6.19%)’ 등도 상대적으로 고빈도 구간의 분포가 두 드러진다. 한편, ‘씨끝(6.04%), 토씨(8.8%)’ 등도 이와 비슷한 경향을 보인다. 도움풀이씨와 같이, 각 구간에 상대적으로 균등하게 분포하는 경향은, 특히 최고빈도 구간의 비율이 높은 ‘셈씨, 대이름씨, 매김씨’ 등에서도 발견할 수 있으며, 대체로 문법적 기능이 강한 낱말들에 공통적으로 나타나는 특징이다. 이와는 반대로 평균 이하의 저빈도 구간의 비율이 압도적으로 높은 낱말들로는 ‘이름씨(75.2%), 고유이름씨(86.54%), 어찌 씨(67.25%), 느낌씨(73.87%), 움직씨(67.25%), 그림씨(61.36%)’ 등을 들 수 있다.45 이를 좀더 간략히 평균 빈도 이상과 이하의 구간으로 나누어 아래의 표에서 관찰해 보면, 이러한 특징이 더욱 확연히 드러 난다.
45
) 이들은 최저 빈도에 나타나는 낱말수의 비율이 다른 구간에 비해 급격히 커진다는 특징을 보인다. 이것은 낱말의 증가율과도 관련되 는데, 이들은 말뭉치의 규모가 커질수록 낱말의 수가 계속해서 상대적으로 급격히 늘어날 가능성을 보여 준다.
- 32 -
항목 갈래
낱말수 씨갈래
높은 빈도 낮은 빈도 낱말수 (100+) (99-7) 합계
이름씨 9,590 29,149 38,739 고유이름씨 641 4,119 4,760 대이름씨 79 66 145 셈씨 59 38 97 [1] 매인이름씨 244 136 380 일반 낱말 움직씨 3,374 6,927 10,301 그림씨 1,249 1,986 3,235 잡음씨 3 2 5 도움풀이씨 41 14 55 어찌씨 993 2,033 3,026 매김씨 78 47 125 느낌씨 75 212 287 [2] 씨끝 543 642 1,185 씨끝/토씨 안맺음씨끝 30 25 55 토씨 235 197 432 [3] 그밖 143 1,696 1,839 합계 17,377 47,289 64,666 <표11> 빈도 7 이상의 낱말수와 빈도수의 분포
빈도수 높은 빈도 낮은 빈도 (100+) (99-7)
빈도수 합계
9,349,339 844,590 269,819 99,932 1,164,831 1,826 219,733 1,139 1,535,770 4,799 5,161,319 207,994 1,458,008 63,349 1,094,221 120 1,000,152 324 1,778,118 56,936 599,099 1,809 85,360 5,186 9,043,606 20,108 1,491,610 664 8,336,749 6,182 641,686 31,443 43,229,42 1,346,401
10,193,9 369,751 1,166,65 220,872 1,540,56 5,369,31 1,521,35 1,094,34 1,000,47 1,835,05 600,908 90,546 9,063,71 1,492,27 8,342,93 673,129 44,575,8
씨갈래 별 낱말수의 분포에서 가장 두드러진 것은 역시 ‘이름씨’의 분포라 할 수 있다. 이름씨는 일반 이름씨만으로도 높은 빈도(100이상)에 속하는 낱말수의 59.86%(9,590개)를 차지할 뿐 아니라, 여기에 고유 이름씨 7.36%(641개)를 더하면 무려 67.22%에 달한다. 물론 임자씨(체언)의 거의 대부분을 차지한다. 이에 비해 풀이씨(용언)의 경우를 살펴보면, 풀이씨 전체로는 약 21%에 달하는데, 특히 움직씨에는 10,301개의 낱말이 포 함되어 높은 빈도의 낱말 중의 약 16%를 차지하고 있으며, 총 빈도는 12% 정도를 차지한다. 이에 비해, 그림씨는 3,235개로 전체 낱말의 5%, 도움풀이씨는 0.1% 미만으로 나타난다. 그림씨는 총 빈도가 낱말수에 비례하여 나타나지만, 도움풀이씨의 경우에는 낱말수에 비해 빈도가 상대적으로 매우 높은 편이다. 이것은 도움풀이씨의 문법적 기능에 기인하는 것으로 보인다. 즉, 어휘적 의미보다는 문법적 의미를 가진, 즉 문법적 기능의 수행을 주로 하는 낱말들의 빈도가 상대적으로 높다는 것을 의미한다. 이 점은 문법적 의미를 중심으로 수행하는 토 씨나 씨끝에서 전형적으로 나타난다. 이들은 낱말의 수로는 지극히 적은 수, 각각 0.67%와 1.9% 정도에 불과하면서도, 빈도 에 있어서는 각각 18.72%와 23.66%로 매우 높게 나타난다.
3.2.4.2. 빈도 구간에 따른 낱말수와 빈도수의 비율 앞에서 살펴본 낱말수와 빈도수의 분포를 각각의 비율로 표시하면 다음과 같다. 이 표는 각각의 씨갈래에 속하는 낱말들이 높은 빈도와 낮은 빈도, 즉 평균 빈도를 중심으로 어느 쪽에 얼마만한 비율로 분포하는가를 보기 위한 것이다. 이를 통해서 각 씨갈래 별로, 낱말수와 빈도수에 있어서, 높은 빈도와 낮은 빈도 중의 어느 쪽에 더 많은 비중이 놓이는가 를 살펴볼 수 있으며, 낱말수와 빈도수의 관계가 대부분 반대로 나타나, 고유 이름씨와 잘못된 분석의 예를 제외하면, 빈도수 의 거의 대부분이 평균 빈도 이상의 높은 빈도 쪽에 놓여 있음을 볼 수 있다. 다만, 낱말수에 있어서는 50% 이상이 높은 빈도에 속하는 일반 낱말 중의 ‘대이름씨, 셈씨, 매인이름씨, 잡음씨, 매김씨’와, 그와는 반대로 낮은 빈도 쪽에 낱말수의 50% 이상이 놓이는 ‘고유 이름씨, 움직씨, 그림씨, 어찌씨’ 등이 대조를 이룬다.
- 33 -
씨갈래/분포
분포 씨갈래
낱말수의 분포 높은빈도 낮은 빈도 낱말 갈래 (100+) (99-7) [1]일반 낱말 이름씨 24.76% 75.24% 고유이름씨 13.47% 86.53% 대이름씨 54.48% 45.52% 셈씨 60.82% 39.18% 매인이름씨 64.21% 35.79% 움직씨 32.75% 67.25% 그림씨 38.61% 61.39% 잡음씨 60.00% 40.00% 도움풀이씨 74.55% 25.45% 어찌씨 32.82% 67.18% 매김씨 62.40% 37.60% 느낌씨 26.13% 73.87% 씨끝 45.82% 54.18% [2] 씨끝/토씨 안맺음씨끝 54.54% 45.45% 토씨 54.40% 45.60% 평 균 26.87% 73.13% <표12> 씨갈래별 낱말수와 빈도수의 비율
빈도수의 분포 높은빈도 낮은 빈도 (100+) (99-7) 91.71% 8.29% 72.97% 27.03% 99.84% 0.16% 99.48% 0.52% 99.69% 0.31% 96.13% 3.87% 95.84% 4.16% 99.99% 0.01% 99.97% 0.03% 96.90% 3.10% 99.70% 0.30% 94.27% 5.73% 99.78% 0.22% 99.96% 0.04% 99.93% 0.07% 96.98% 3.02%
‘씨끝/토씨’의 경우를 본다면, 낱말수는 거의가 높고 낮은 빈도에 절반씩 분포하는 데 반해, 빈도수는 평균 빈도 이상의 높 은 빈도 쪽에 95% 이상이 속해 있음을 볼 수 있다.
3.2.4.3. 높은 빈도 구간의 씨갈래별 낱말수와 빈도수의 분포 어휘적 의미를 나타내는 기능을 주된 일로 삼는 낱말과, 문법적 기능을 중심으로 한 이들 낱말들의 대조적인 차이가 있음 을 앞 절에서 언급했는데, 아래의 그래프를 통해, 우리는 이와 같은 낱말의 문법적 기능과 빈도와의 상관을 확연히 볼 수 있 다.
이 막대 그래프는 각 씨갈래의 낱말들이, 평균 빈도 이상의 낱말 전체에서 차지하는 비율과, 빈도의 합이 높은 빈도의 낱말 전체에서 차지하는 비율을 상관적으로 보여 준다.46 이 비율에 나타나는 경향으로 보아, 각 낱말은 크게 몇 가지의 유형으로 나뉜다. (1). 낱말수와 빈도 사용률이 거의 비례적인 관계를 나타내는 것: 이름씨, 움직씨, 그림씨, 어찌씨 (2). 낱말수에 비해, 빈도사용률이 극단적으로 높아지는 것: 씨끝, 토씨, 매인이름씨, 대이름씨, 잡음씨, 도움풀이씨, 매김씨 (3). 낱말수와 사용률이 반비례하는 것: 고유 이름씨, 그밖(잘못된 분석 따위) (4). 셈씨는 낱말수에 비해, 상대적으로 빈도사용률이 높음 (5). 느낌씨는 낱말수에 비해, 상대적으로 빈도사용률이 낮음. 예컨대, 움직씨의 경우 두 개의 막대 중 왼쪽은 낱말수로는 고빈도어 전체의 15.92%를 차지하며, 빈도 총합으로는 12.05%를 차지함을 보여 준다. 이는 대체적으로 낱말수가 차지하는 비율과 총 빈도가 차지하는 비율이 거의 일치함을 나타 낸다. 그림씨의 경우나 어찌씨 등의 이른바 사서적인 의미적인 기능이 강한 낱말들이 모두 마찬가지의 경향을 보여 준다. 한편, 이름씨의 경우에는 기능상으로는 앞서 언급한 움직씨, 그림씨, 어찌씨 따위와 마찬가지라 할 수 있으나, 낱말수가 차 지하는 비율(59.86%)에 비해, 빈도의 총합이 차지하는 비율은 그 절반에도 미치지 못하는 것으로 나타남으로써, 우리는 이름 씨의 경우 다른 낱말에 비해 상대적으로 낱낱의 낱말의 빈도가 높지 못함(또는 고르지 못함)을 드러낸다.
46
) 다만, 이 그래프에서의 왼편 축의 %는 백분율이라는 것을 뜻하며, 가운데 지른 선을 중심으로 윗부분은 빈도수의 백분율을, 아랫 부분 은 낱말수의 백분율을 나타낸다.
- 34 -
이와는 반대의 경향을 보여 주는 것으로, 도움풀이씨, 매인이름씨, 대이름씨, 매김씨, 토씨, 씨끝(안맺음씨끝 포함) 따위는 모두 낱말수가 차지하는 비율보다도 빈도 총합의 비율이 훨씬 높게 나타난다. 도움풀이씨의 경우, 낱말 수로는 0.08%에 불과 하면서도 빈도 총합은 2.24%에 이르며, 매인이름씨도 역시 마찬가지의 경향을 보인다. 이는 앞서 살펴본 일반 이름씨와는 전 혀 다른 점이다. 이러한 경향을 극명하게 보여 주는 것이 바로 토씨와 씨끝이다. 위의 그래프에서 볼 수 있듯이, 토씨의 경우에는 낱말수는 0.67%에 불과한데도 빈도의 총합은 무려 18.72%, 씨끝의 경우에는 낱말수는 1.86%인데도 불구하고 빈도 총합에서는 무려 20.33%를 차지하고 있다. 안맺음씨끝 역시 마찬가지로 0.07%의 낱말수만으로도 3.33%의 빈도를 차지한다. 한편, 이러한 두 가지의 경향과는 또 다른 요소로는 고유 이름씨나 그밖의 낱말들을 들 수 있다. 고유 이름씨는 그 낱말수 는 7.36%나 차지하는데도 빈도 총합은 0.83%에 불과하여 상대적으로 낮은 빈도의 낱말이 몰려 있음을 알 수 있다.
3.3. 맺음말 앞에서 우리는, ‘대규모 말뭉치를 대상으로 한 낱말 빈도 조사’의 경과와 거기에서 얻어진 결과의 일부를 살펴봄으로써, (1) 토씨와 씨끝 따위의 문법적 기능 중심의 낱말(형태)가 일반적인 낱말과는 구분되어야 한다는 것, (2) 상위 일부의 낱말이 그 낱말 사용률의 대다수를 차지한다는 낱말 빈도의 일반적 경향이 대규모의 말뭉치에서도 여전히 유효하다는 사실, (3) 낱말수 와 빈도수(사용률)의 관계에서 볼 때, 각 씨갈래별로 다를 뿐 아니라, 특히 ‘토씨, 씨끝’ 이외에도 ‘도움풀이씨, 매인이름씨’, 그 리고 매김씨, 대이름씨, 셈씨 따위 역시 거의 비슷한 경향을 보인다는 사실을 확인할 수 있었다. 앞으로 이 조사에서 해결하지 못한 같은 씨갈래 낱말의 ‘중의성’의 문제를 해결하기 위한 의미 빈도의 조사를 비롯하여, 낱 말의 말뭉치 표본별 산포도, 낱말의 증가율 등을 밝혀나가게 될 것이다.
4. 한국어 교육을 위한 교육용 말뭉치의 구성 4.1. 교육용 말뭉치의 개념과 요건 4.1.1. 한국어 교육용 말뭉치의 개념 말뭉치란 연구 대상 언어의 총체적인 모습을 보여 줄 수 있는 자료의 집합체를 뜻한다. 그러므로 문자 그대로의 의미로 한 국어 교육용 말뭉치를 정의하자면 한국어를 교육하는 모든 장면에 사용되는 언어 자료의 집합체라고 할 수 있다. 그런데 한국어 교육에 사용되는 언어는 그 성격에 따라 두 가지로 나누어 볼 수 있다. 하나는 학습 대상이 되는 언어(교과 서, 시청각 자료 등에 쓰인 언어)이며 다른 하나는 학습 과정에서 만들어지는 언어(교사의 언어, 학습자의 작문, 발화 등)이다. 따라서 한국어 교육용 말뭉치도 이러한 자료의 성격에 따라 하위분류할 수 있다. 하나는 한국어 교육의 대상이 되는 표준적 인 한국어 사용을 보여 주는 말뭉치이며 다른 하나는 한국어 학습 과정에서 생산된 학습자의 작문이나 회화연습 결과 등을 담고 있는 말뭉치이다. 앞의 것을 표준 말뭉치라 한다면 뒤의 것은 일종의 오류 말뭉치라 할 수 있을 것이다. 표준 말뭉치는 학습자가 배워야 할 언어적 특성을 골고루 보여 줄 수 있어야 하며 오류 말뭉치는 학습자가 주체적 환경적 특성에 따라 범할 수 있는 잘못된 한국어 사용의 유형을 추출할 수 있도록 구성되어야 할 것이다. 본 연구는 한국어 교육용 기초 어휘 선정을 위한 연구의 하부과제로 수행되는 것인 만큼, 두 가지 유형의 말뭉치 가운데 표준적 말뭉치의 구축을 주된 목표로 삼아, 한국어 교육용 표준 말뭉치의 요건은 무엇이며 이를 충족하는 말뭉치를 구성하기 위한 방안은 무엇인가 하는 점 등을 살펴보고자 한다.
4.1.2. 한국어 교육용 표준 말뭉치의 요건
- 35 -
오류를 포함하여 언어 사용의 제반 양상을 보여 줄 것이 요구되는 일반 말뭉치와 달리 한국어 교육용 말뭉치는 맞춤법, 표 준어, 화법 등의 사항에 있어서 한국어의 표준적 용법을 잘 보여 줄 수 있어야 한다. 또한, 한국어 교육용 말뭉치는 외국인의 한국어 학습을 위한 것이므로 모국어 화자를 대상으로 하는 국어 교육용 말뭉치와 도 구별되어야 한다. 즉, 모국어 교육에서는 정확한 국어문장을 풍부하고 다양하게 사용하는 능력을 배양하는 데에 주안점이 놓이지만 외국인 학습자를 대상으로 하는 한국어 교육에서는 기본적인 의사소통의 문제부터 다루어져야 하기 때문에 교육용 말뭉치의 구성에 있어서도 이러한 차이를 고려하여 기본적이고 보편적인 국어사용 양상을 추출할 수 있는 텍스트들이 중심이 되어야 할 것이다. 이러한 차이를 반영하여 한국어 교육용 표준 말뭉치가 갖추어야 할 요건을 다음과 같이 지적할 수 있다. ① 표준적인 텍스트라야 한다 교육용으로 사용할 것이기 때문에 맞춤법뿐만 아니라 화법이나 언어예절 등 제반 어문 규범에 맞는 언어사용을 보여 주는 텍스트로 구성되어야 할 것이다. ② 보편성을 갖는 텍스트라야 한다 기초어휘를 선정하는 근거로 이용되는 말뭉치는 일상적이고 보편적인 언어사용을 보여 주는 것이라야 한다. 따라서, 너무 전문적이거나 일탈적인 언어를 보여 주는 텍스트들은 제외되어야 할 것이다. ③ 국어의 모습을 고루 보여 줄 수 있어야 한다 기본적인 의사소통을 위한 기초어휘를 선정하기 위해서는 문어뿐만 아니라 구어 혹은 구어적인 언어사용을 보여 주는 텍 스트들이 포함되어야 할 것으로 생각된다. ④ 학습과정에의 지원 한국어에 대한 언어직관이 없는 외국인이 한국어 학습을 무리없이 진행하기 위해서는 학습과정에서 사용하게 될 용어나 표현들을 이해하고 구사할 수 있어야 할 것이다. 따라서 말뭉치에도 이러한 학습자료들(사전, 교재 등)이 포함되어야 한다.
4.2. 한국어 교육용 표준 말뭉치의 구성 4.2.1. 표준 말뭉치 설계와 관련된 제반 문제 한국어 교육용 표준 말뭉치를 구성하기 위해서는 일반 말뭉치의 구성 방법론을 바탕으로 하되 앞에서 제시한 요건에 맞추 어 특정 요소를 가감하여 구축하는 것이 타당할 것으로 생각된다. 이에 따라 한국어 교육용 표준 말뭉치를 설계하는 과정에 서 예상되는 문제 혹은 유의하여야 할 사항은 다음과 같다. ① 일반성 및 난이도의 문제 일반적이고 기본적인 국어 사용의 양상을 보여 주는 텍스트로 구성되어야 한다는 점을 고려할 때 한국어 교육용 말뭉치에 서는 일반 말뭉치에서와는 달리 학술 텍스트나 신문 텍스트 등이 제외되어야 한다. 어휘적 측면에서 학술장르는 전문 용어의 사용이 두드러질 것이며, 신문은 신어나 약어, 복합어의 사용이 두드러질 것이기 때문이다. 문장에 있어서도 신문의 문장은 지면의 제약 때문에 혹은 집중도를 높이기 위해 비표준적인 문장을 사용하는 경우가 많기 때문에 교육용 표준 자료로 사용하 기에는 무리가 있을 것으로 생각되는 것이다. 반면, 아동을 대상으로 하는 동화나 잡지, 초등학교 교과서 등은 단순한 어휘사
- 36 -
용과 기본 문장의 사용이 주가 될 것으로 생각되므로 교육용 표준 말뭉치에 포함되어야 할 것이다. ② 학습과정과의 연계 교육이 이루어지는 과정에서 학습자가 가장 많이 접하게 될 국어는 학습자 사전의 풀이말이나 기존 한국어 교재의 언어가 될 것이다. 따라서 이들 텍스트들이 보여 주는 언어사용 양상도 한국어 학습 과정에 포함되어야 한다. 그러나 이들은 원칙적 으로 정형화되고 통제된 언어를 사용하고 있는 텍스트들이기 때문에 표준적인 언어를 사용한다고 하더라도 일반적인 텍스트 들과는 매우 성격이 다르다. 따라서 일반 텍스트와 이들 학습 텍스트들이 구분 없이 하나의 말뭉치로 섞이게 되면 그것에서 얻어진 결과가 실제 언어 사용의 실태와 유리된 것일 수 있다. 이러한 사실을 고려하여 학습 텍스트를 포함하되 일반 텍스트 와의 차별성을 두는 말뭉치 구성이 이루어져야 한다. ③ 표준적 언어사용을 보이는 텍스트의 선정 한국어 교육용 표준 말뭉치가 표준적 언어 사용을 보이는 텍스트로 구성되어야 한다는 것은 너무나도 당연한 사항이지만, 구어 자료를 포함한다고 할 때 여러 가지 제약을 받게 된다. 구어 자료가 보이는 비정형성과 복합성을 이 조건에 맞추어 어떻 게 조절할 것인가가 면밀히 검토되어야 할 것이다. ④ 구어말뭉치 구축의 현실적인 여건 이 문제와 관련하여서는 한국어 교육용 말뭉치로서 갖추어야 할 요건을 충족하여야 한다는 당위성의 측면과, 현재 연구진 과 여건으로는 적절한 규모와 질을 갖춘 구어 말뭉치를 구축하기가 어려운 상황이라는 현실적인 측면이 함께 고려되어야 한 다. 따라서 구어 말뭉치와 문어 말뭉치를 나누어 단계적으로 구축할 것인지, 아니면 두 말뭉치의 구축을 동시에 진행할 것인 지를 계획단계에서 결정하여야 한다. 만약 후자의 경우를 선택하게 된다면, 짧은 기간 내에 본격적인 구어 자료의 구축이 어 려운 현재의 상황을 고려하여 구어적 요소가 많이 포함되어 있는 소설의 지문이나 편지글 등으로 대체하는 정도가 가능할 것 이다.
4.2.2. 표준 말뭉치의 구조 앞에서 지적된 점들을 고려하여 한국어 교육용 표준 말뭉치를 다음과 같이 구성하였다.
<표13> 한국어 교육용 표준 말뭉치의 구성
말뭉치 텍스트의 성격 말뭉치의 크기 표본 크기
한국어 교육용 표준 말뭉치 주말뭉치 참조말뭉치 일반 텍스트 규범 텍스트 100만 어절 100만 어절 5000 어절 고정되지 않음
여기서 주말뭉치란 표준적인 언어 사용을 보이는 일반적인 텍스트로 구성된 말뭉치이며, 참조말뭉치란 1.2에서 제시한 “④ 학습과정에의 지원”이라는 요건을 충족시키기 위해 제안된 말뭉치이다. 여기에는 학습자 사전의 풀이말과 초등학교 교과서 및 한국어 학습 교재 등이 포함된다. 말뭉치의 크기를 각각 100만 어절로 정한 것은 말뭉치 구축에 투입할 수 있는 인원과 시간, 경제적인 여건 등 현실적인 제 반 문제를 고려한 최대한의 크기이며 이는 앞으로 연구가 진행되고 연구결과들이 축적됨에 따라 확대될 수 있을 것으로 생각
- 37 -
된다. 이러한 전제 하에 주말뭉치의 구축은 다음과 같은 과정을 통해 이루어졌다. ① 텍스트의 범주화 및 장르분류 ② 각 장르별 적정량 배정 ③ 텍스트 선정 ④ 텍스트 입력
4.3. 주 말뭉치의 설계 4.3.1. 텍스트의 범주화 텍스트의 범주화란 각 텍스트의 언어 외적 존재 양상과 내적 자질에 따른 분류범주의 설정을 의미하는 것이다. 여기서 언 어 외적 존재 양상에 따른 분류란 말뭉치 분석 결과를 바탕으로 하지 않더라도 직관에 의해 어느 정도 분류가 가능한 것으로 서, 텍스트 언어학에서 말하는 ‘텍스트의 통보적 특성에 따른 분류’를 의미한다. 반면, 내적 구조에 따른 분류란 어휘나 문법 적 요소의 분포, 기능 등 텍스트의 언어학적 특성에 바탕을 둔 분류로서, 말뭉치 분석 결과를 바탕으로 하여야 이루어질 수 있는 것이다.47 현대국어 문어의 내적 구조는 그 자체가 일정 정도의 말뭉치 분석 결과라도 얻어진 후에야 밝혀질 수 있는 것이기 때문에 본고에서는 텍스트의 외적 존재 양상을 중심으로 자료를 분류한다. 그러나, 내적 구조를 이루는 요소들 가운데서 산문/운문의 구별이나 주제 분야 등과 같이 언어요소에 대한 구체적 분석을 거치지 않고도 직관에 따라 그 특성이 추출될 수 있는 자질은 자료 분류의 기준에 포함하고자 한다.48 자료 분류의 기준이 될 수 있는 텍스트의 통보적 특성 즉 외적 존재 양상은 1) 전달매체 2) 연속성 3) 공공성 4) 수용자 상 정 5) 목적 등이 있으며 내적 자질로는 1) 언어관계 2) 산문성 3) 주제 4) 사실성 5) 서술방식 등이 있다 (Engwall 1994, Biber 1994). 이들 각각의 특성을 살펴보면 다음과 같다.
4.3.1.1. 텍스트 외적 자질에 의한 분류 1) 전달매체 : 텍스트가 어떤 매체를 통해 전달되는 것인가를 드러내는 자질로서 문자를 통한 전달과 음성을 통한 전달이 있으며 이에 따라 텍스트를 문어 텍스트, 구어 텍스트, 문어화된 구어 텍스트, 구어화된 문어 텍스트 등으로 나눌 수 있다. 47
) 이는 Biber(1994)에서 제시한 ‘텍스트 유형(text type)’에 따른 분류에 해당하는 것이며, 이성만(1994)에서는 ‘구조적 기준’에 의 한 분류에 해당하는 것이다.여기서 논의의 편의를 위하여 이성만 역(1994)와 Biber(1994)를 중심으로 텍스트 언어학에서의 텍스트 분류 론과 말뭉치 언어학에서의 텍스트 분류론이 보이는 용어 사용상의 차이에 대해서 언급하고자 한다. 본고의 내용과 관련하여 그 개념이 문제가 되는 용어는 ‘텍스트 유형’이 될 것이다. 이성만 역(1994)에서는 이 용어를 텍스트 분류 일반을 포괄하는 개념으로 사용하여 통 보형태, 행위영역 등의 상황적 기준과 주제의 종류, 주제 전개의 형태 그리고 텍스트의 어휘적 통사적 특징 등 텍스트의 구조적 기준이 모두 반영된 분류를 지칭하는 포괄적인 용어로 사용하는 데 반하여, Biber(1994)에서는 이 용어를 ‘텍스트 분류’를 이루는 하위 개념으 로 사용하여 ‘어휘나 통사적 요소의 분포상 등 텍스트의 내적 구조에 따른 텍스트 분류의 결과로 얻어지는 것’으로 정의하고 있다. 따라 서 이성만 역(1994)의 ‘텍스트 유형’은 Biber(1994)의 ‘텍스트 장르’와 ‘텍스트 유형’을 아우르는 포괄적인 개념이라 할 것이다. 여기서 는 Biber(1994)의 용어를 받아들여 이성만 역(1994)에서의 포괄적인 의미로 사용되는 ‘텍스트 유형’을 언급할 때는 ‘텍스트 분류’라는 용어를 사용하기로 한다. 48
) 그러나, 텍스트의 외적 존재 양상도 텍스트의 형태적 특성과 같은 언어학적 요소뿐 아니라 다양한 사회학적 변인들이 관여하여 구성되는 것이기 때문에 이들을 본격적으로 밝혀내는 것은 본 연구의 범위를 벗어나는 작업이다. 따라서, 본 연구에서는 이러한 작업에 대한 선행 연구의 결과를 참조하고 필자 나름대로의 기준을 더하여 말뭉치를 구성할 텍스트들의 분류 범주를 설정하는 데 만족하고자 한다. 완벽 한 분류를 하지는 못하더라도, 분류기준을 명확히 함으로써 향후의 연구에서 비교의 근거가 될 수 있도록 한다는 데 주안점을 두고자 하 는 것이다.
- 38 -
2) 연속성 : 텍스트가 정기적으로, 혹은 연속적으로 생산되는 것인지 아닌지를 구별하는 자질이다. 구어 텍스트이든 문어 텍스트이든 연속성을 가지는 각각의 텍스트는 연속성을 가지지 않는 텍스트와 차이를 보일 것으로 생각된다. 예를 들어 같은 드라마라 하더라도 시리즈물과 단막극은 그 응집성이나 주제의 전개 방식에 있어서 차이가 날 것이며, 같은 논설문이라 하더 라도 신문의 사설과 일반 논설문은 그 길이나 주제의 전개 방식, 문체 등의 측면에서 차이가 있을 것으로 생각된다. 3) 공공성 : 텍스트의 생산자(화자/ 필자)와 수용자(청자/ 독자)의 관계가 공적인 것이냐 사적인 것이냐를 구별하는 기준이 다. 이에 따라 일기나 편지, 일상 대화 같은 사적인 텍스트와 논설문이나 광고문, 대담과 같은 공적인 텍스트가 구별될 것이 다. 이 자질은 1)의 전달매체 자질과 더불어 텍스트의 내적 구조 즉 어휘나 통사 구조 및 문체 상의 특성을 결정하는 중요한 외적 요인이 될 것으로 생각된다. 그런데 어떤 텍스트가 이 [공공성] 자질과 관련하여 어떤 값을 부여받는가 하는 문제는 텍스트가 전달될 때의 양상보다는 텍스트가 생산될 때의 생산자의 의도나 태도에 의해 결정되는 것으로 생각된다. 따라서 문학작품은 그 속성상 발표를 전제로 하는 것이기 때문에 어떤 소설이나 시가 공식적으로 발표되거나 출판되지 않았더라도 이는 공적 텍스트로 분류하게 된다. 또, 정치 연설에 있어서 실제 연설 전에 연습을 하는 경우는 연설자 혼자 있는 상황에서 연설이 이루어지더라도 그 텍스트는 대 중적인 연설을 염두에 두고 생산된 것이기 때문에 공적 텍스트로 분류하게 되는 것이다. 반대로, 일기나 편지의 경우는 비록 그것이 출판되었더라도 출판이나 발표를 염두에 두고 생산된 것이 아니기 때문에 사적 텍스트로 분류되어야 할 것이다. 4) 수용자 상정 : 생산자(화자/필자)가 수용자(청자/독자)를 상정하거나 의식하는 상태에서 텍스트가 만들어졌는가 그렇지 않은가에 따라 텍스트의 성격이 달라지게 된다. 단적인 예로 구어에서 대화와 독백을 나누는 기준이 바로 이 [수용자 상정] 자질이 될 것이다. 이러한 요소는 텍스트의 내적 구조에도 영향을 미쳐서 경어법이나 문장구조의 차이를 보이는 주된 요인이 되는 것으로 생각된다. 또, 문어에 있어서도 편지나 안내 광고 등은 독자가 상정되지 않으면 그 텍스트의 생산자체가 이루어 질 수 없기 때문에 그렇지 않은 다른 텍스트들과는 구별됨을 지적할 수 있다. 이러한 사실을 바탕으로 [수용자 상정]을 텍스 트 분류의 한 자질로 설정하게 된다. 5) 목적 : 텍스트의 생산자가 텍스트를 만드는 목적을 의미한다. 이 자질은 분류에 적용될 때 한 번만 사용되는 것이 아니 라, 분류가 세분화됨에 따라 다른 내용으로 적용된다는 점에서 다른 자질들과 구별된다. 즉, 텍스트의 목적은 일차적으로 예 술 텍스트와 비예술 텍스트로 나눌 수 있으며, 이 가운데 비예술 텍스트는 학술 텍스트와 비학술 텍스트로, 비학술 텍스트는 다시 교양 텍스트와 실용 텍스트로 나뉘게 된다.
4.3.1.2. 텍스트 내적 자질에 의한 구분
6) 언어 관계 : 텍스트가 원래부터 대상언어로 생산된 것인지 아니면 다른 언어로 이루어진 것을 번역한 것인지를 구별하 는 자질이다. 원문에 사용된 언어의 문법구조나 표현양식에 영향을 받는 것으로 생각되는 번역문 특유의 문체나 문장구조가 실재하기 때문에 이러한 점을 고려하여 이 자질은 텍스트 분류의 기준으로 설정하게 된다. 7) 산문성 : 텍스트가 산문인지 운문인지를 구별하는 자질이다. 이 자질은 특히 예술텍스트의 하위분류에 중요한 기준이 되는 것인데, 실용텍스트에서도 광고문이나 표어 등은 운문의 특성을 보이는 경우가 많아서 그 분류에도 유용한 기준이 될 수 있다. 8) 주제 : 이 자질은 텍스트가 어떤 분야를 다루는 것인가에 따라 결정되는 자질이다. 대략 인문과학/ 사회과학/ 자연과학/ 공학/ 보건/ 예술 및 체육/ 기타 등으로 나누어 볼 수 있다. 인문과학에는 문학, 어학, 사학, 철학, 종교, 미학 등이 포함되며
- 39 -
사회과학에는 정치, 경제, 교육, 심리, 사회, 문화, 인류, 언론, 여성학 등이 포함된다. 자연과학에는 수학, 물리, 생물, 지구과학, 화학뿐만 아니라 환경학이 포함되며, 공학은 건축, 기계, 토목 등 공학의 제 분야와 정보 통신을 포함한다. 보건에는 의학, 약학, 식품위생 및 건강, 의료 등이 포함되며, 예술 및 체육에는 문학 및 미학을 제외한 제 예술분야-음악, 미술, 공연예술 등 -과 체육, 레저, 오락 등이 포함된다. 기타는 이들 분야를 제외한 나머지 분야이거나 분류가 애매한 경우를 포함한다. 9) 사실성 : 텍스트가 사실에 바탕을 둔 내용으로 이루어진 것인가, 아니면 작자의 상상에 바탕을 둔 허구적인 내용을 가지 는 것인가를 구별하는 자질이다. 사실적인 텍스트의 대표적인 것으로는 신문의 사건보도나 수기, 역사 기술 등이 해당되며, 전형적인 허구적 텍스트로는 소설이 해당할 것이다. 10) 서술방식 : 텍스트의 내용에 대한 작자의 태도에 따라 서술방식은 서술 및 묘사, 설명, 논증 등으로 나뉜다.
4.3.1.3. 범주 분류 시안 1)부터 10)까지의 자질들은 언어 자료 분류의 기준이라는 점에서는 동질적이지만, 실제 텍스트를 대상으로 하여 이들 자질 을 적용할 때 이들이 모두 동일한 자격으로 동등하게 적용되는 것은 아니다. 즉, 앞에서 지적한 Engwall (1994)의 ‘범주 → 장 르 →텍스트 → 표본’이라는 언어 자료의 위계를 받아들이면, 텍스트의 분류는 단선적으로 이루어지는 것이 아니라, 단계적으 로 이루어질 것임을 예측할 수 있다. 따라서 앞에서 제시한 10가지 자질들 가운데는 모든 텍스트에 편재하여서 범주 분류의 기준이 되는 것이 있는가 하면, 특정 범주에서만 변별력을 지니고 그 범주를 하위분류하는 기준 즉 장르 분류의 기준이 되는 것이 있다. 또, 범주 분류나 장르 분류의 기준은 될 수 없지만 개별 텍스트에 특징을 부여하는 자질이 있는 것이다. 이에 본 연구에서는 우선적으로 텍스트의 범주를 분류하는 데에 중점을 두고자 한다.49 먼저 모든 텍스트에서 발견되는 자질 가운데 1)의 [전달매체] 자질과 5)의 [목적] 자질을 적용해 보면 텍스트가 6개의 범 주로 분류된다. 이를 표로 보이면 다음과 같다. <표14> 텍스트의 범주 분류표 전달매체
문어
문어화된 구어
구어
예술
소설 수필 전기 시
희곡 시나리오
연극 영화
비예술
논설문 설명문 보고문 신문보도 일기 자서전(회고록 수기) 안내문 광고문 벽보 공고 공문 편지 광고문 표어
연설문 강의록 대담, 좌담 기록 구술 기록
연설 강의 대담 좌담 일상 대화 이야기 (구술) 독백
목적
이렇게 분류된 여섯 범주는 각 범주의 특성에 따라 산문성, 목적 등의 기준을 통해 더 세분될 수 있다. 이 가운데 문어 범 주에 대한 하위 분류를 보이면 표3-2와 같다50. 표3-2에 따르면 목적에 따라 예술 텍스트와 비예술 텍스트로 분류된 문어 텍스트는 다시 학술 텍스트와 비학술 텍스트로 분류되며, 이 가운데 비학술 텍스트는 실용성 여부에 따라 다시 교양 텍스트와 실용 텍스트로 하위 분류된다. 한편, 목적에 따른 분류와는 별도로 [산문성]의 자질에 따라 운문과 산문의 구별이 적용됨으로써 예술 텍스트에서 시가 분리되고 실용 텍 49
) 그러나 Engwall(1994)에서 제시된 자료의 분류 단계에 따라 범주분류 이후의 작업을 진행하기 위해서는 장르 구분과 연계하여 텍스트 분류가 실행되어야 한다. 이 단계에서는 일단 기존의 장르 분류를 이용하여 텍스트 분류를 수행해 나가도록 한다.
50
) 본 연구에서는 이들 가운데 문어 텍스트만을 대상으로 한다. 2장에서 언급하였듯이 교육용 표준 말뭉치에 있어서 구어의 중요도는 매우 높지만 본 연구의 현실적인 여건상 그 구어 말뭉치의 구축이 어렵기 때문에 일차적으로 문어 말뭉치를 구성하는 것으로 본 연구의 범위 를 한정하고자 한다.
- 40 -
스트에서는 광고문이나 표어의 일부가 분리된다. 이는 광고문이나 표어가 지니는 표현의 간결성과 문장구조의 일탈성을 중시 하여 운문성을 가지는 경우를 상정한 것이다. <표15> 문어 텍스트의 범주 분류표 산문성
산문
목적 예술
소설
학술
논설문
비예 교양 술 비학 술 실용
운문
수필
전기
시
설명문 보고문
논설문 설명문 보고문 일기 자서전(회고록 수기) 편지 안내문 광고문 벽보 공고 공문 편지
광고문 표어
이렇게 문어 텍스트는 [목적]과 [산문성]의 자질에 따라 여섯 개의 범주로 하위분류되며, 이 가운데 교양텍스트는 다시 [공공성]과 [수용자 상정] 자질에 의해 다음과 같이 하위 분류된다. <표 16> 비학술-교양 텍스트의 범주 분류표 공공성
공적
수용자상정
사적
수용자 상정
편지 논설문 설명문 보고문
수용자 비상정
자서전(회고록
수기)
<표Error! Reference source not found.7>에서 <표19>까지의 분류를 통해 얻어진 텍스트 범주들의 자질값을 정리하면 아래의 표와 같다. <표17> 텍스트 범주별 자질분류 표: 문어-산문 비예술산문 공적 저술
예술산문 학술산문
비학술산문 실용산문
교양산문
사적저술
전달매체
문어
문어
문어
문어
문어
산문성
+
+
+
+
+
공공성
+
+
+
+
+
독자 상정
+
+
+
+
-
예술성
+
-
-
-
-
학술성
-
+
-
-
-
실용성
-
-
+
-
-
주제 언어관계 연속성(출판형태)
인문/사회/자연/보건/예술 창작 / 번역 연속(신문 잡지
- 41 -
) / 비연속(단행본)
이들 가운데 본 연구에 포함되는 범주는 (1) 예술산문 (2) 사적저술 (3) 교양산문 (4) 실용산문이다. 운문은 그 일탈성과 간결성 때문에 표준적인 현대국어 문어의 모습을 포착하기 어렵다고 생각되어 일차적으로 제외되었다. 또, 각 텍스트의 형태 가 일정하지 않아 표본화하기 어려운 광고문이나 안내문 같은 실용산문은 제외되었다. 따라서 실용산문에는 책이나 지침서와 같이 정형화된 형태를 띤 것들만이 속하게 되어 요리나 의학 상식을 다룬 텍스트들로 구성된다. 한편, 공문이나 안내문은 편 지의 형식을 지니는 경우도 있다. 따라서 편지는 실용산문에도 속하고 사적저술에도 속할 수 있는 텍스트이다. 그러나 실용산 문이 제외됨에 따라 편지의 경우는 실용적 목적을 가지는 공문이나 통지문 등은 제외하고 사적 저술의 성격을 지니는 것만을 택하여 일기, 회고록 등의 사적저술과 함께 묶었다. 이와 같이 분류된 각 범주에 나머지 분류 자질을 적용하고 이를 기존의 텍스트 장르 분류와 연결시켜보면 표3-5와 같다. <표18> 텍스트 범주의 하위 분류표: 문어-산문 내적 자질
외적 자질
사실성 주관성 서술방식 예술산문 사적저술 교양산문 실용산문 학술산문
허구 서사 소설 -
사실 주관 서사 수필 수기·기행문 -
서사
객관 설명 -
논증
전기·보고문 해설서 비평·논설 지침, 정보서 평전·보고문 논문·이론서
앞에서 제시한 텍스트의 자질 가운데 범주 구분의 기준으로 사용되지 않은 것은 [연속성], [언어관계], [주제] 등이다. 이들 은 모든 텍스트가 다 지니는 자질이지만, 본 연구에서는 범주분류의 자질로는 선택하지 않았다. 이 가운데 [연속성] 자질은 앞선 말뭉치 구축 작업들에서는 텍스트 범주구분의 중요한 기준으로 제시되었던 것이다. 즉, 영어의 Brown Corpus, LOB Corpus나 국어의 ‘연세말뭉치’,『조선어 빈도수사전』의 말뭉치 등은 모두 신문, 잡지 등을 소설, 논문, 편지 등등의 텍스트 장 르와 동일한 분류선상에 놓고 하나의 분류범주로 설정하여 자료량을 배정하고 있다. 이러한 처리의 바탕에는 이들 연속간행 물이 한 사회의 출판 양태의 측면에서 매우 큰 비중을 차지하는 범주라는 인식이 깔려 있다. 그러나, 언어학적으로 보았을 때 신문, 잡지 등은 하나의 단일한 텍스트라기보다는 논설, 설명, 정보, 보고, 수필, 편지, 소설, 시 등 다양한 텍스트로 구성된 복 합적인 자료이며, 거기에서 드러나는 언어사실은 지면이나 일정 등의 조건으로 인해 다른 출판물에 비해 많은 제약을 받고 있다.51 따라서 이들을 따로 하나의 자료 범주로 설정하기보다는 각 범주의 하위범주를 구성하는 것으로 처리하는 것이 타당 할 것으로 생각된다. 즉, 각 텍스트를 연속성을 지니는 부류(연속 간행물)와 그렇지 않은 부류(단행본)를 구별하여 비교분석함 으로써 동일한 범주의 텍스트가 이 [연속성]자질에 따라 어떤 변이형을 보이는가를 고찰하는 것이 언어학적으로 더 의미있는 결과를 도출해 낼 수 있으리라고 생각되는 것이다. 이런 처리 방식은 번역물과 창작물을 구별하는 [언어관계] 자질, 그리고 인문, 사회, 자연 등 주제를 구별하는 [주제] 자질에도 해당되는 것으로 생각된다.
4.3.2. 주말뭉치의 텍스트 범주 구성 앞에서 살펴 본 바와 같은 표의 텍스트 범주를 바탕으로 하고 표준 말뭉치가 가져야할 요건을 고려하면 다음과 같은 자료 표집 분야가 설정된다.
51
) 약어의 빈번한 사용 및 조사 어미 생략의 양상 등이 그 대표적인 경우가 될 것이다.
- 42 -
<표19> 주말뭉치의 범주 및 장르 구성
범주 분류
장르 분류 소설
예술산문
수필
사적저술
교양산문
실용산문
수기·기행 전기·보고(르뽀) 주 교양해설 제 분 류 논설·비평 지침·정보
인문 사회 자연 공학 보건 예술
이 표에서 주목되는 것은 학술산문이 제외된 점이다. 학술산문은 전문용어가 많이 사용될 것이며, 문장 구조나 문법 요소 의 사용이 비교적 획일적일 것으로 생각되어 표준 말뭉치의 요건에 맞지 않는다고 생각되어 제외한 것이다. 그러나, 향후 교 육 단계별로 세분화된 자료를 추출하기 위하여 말뭉치를 구성하게 된다면, 고급 수준의 학습자를 대상으로 하는 경우에는 학 술 산문이 포함되는 것이 바람직할 것이다. 한편, 범주 및 장르 분류의 기준으로 사용되지 않은 텍스트의 자질 가운데 [연속성], [언어관계], [주제] 자질에 대해서, 본 연구에서는 [연속성]과 [언어관계] 두 자질에 일정한 제약을 두었다. 즉 [연속성] 자질과 관련하여서는 신문 텍스트를 제외하 였고, [언어관계] 자질과 관련하여서는 번역 텍스트를 제외한 것이다. 이는 앞에서도 언급하였듯이, 신문 텍스트의 경우 어휘 적인 측면에서는 약어, 고유명사, 신어, 전문 용어 등이 많이 쓰여서, 기본적인 어휘사용 양상을 왜곡할 여지가 있으며, 문장 구조에 있어서도 시간이나 지면의 제약으로 인해 일반적인 구조라 하기 어려운 문장들이 사용될 가능성이 높기 때문이다. 또 한, 번역 텍스트의 경우, 대명사, 지시어, 시상요소 등의 어휘 사용이나 피·사동 등의 문장 구조에 있어서 원문 언어의 영향 을 받는 경우가 많을 것으로 예상되기 때문이다. 또, [주제] 자질의 경우에 종합적이고 다양한 내용을 가지는 예술산문이나 사적 저술, 전기물 등의 경우에는 주제에 따른 분류가 무의미하다고 생각되었기 때문에 이들 장르(범주)의 경우에 주제를 고려하지 않고, 교양해설, 논설·비평, 지침·정보 등의 경우에만 여러 가지 주제 분야가 균형잡힌 구성을 이루도록 하였다.
4.3.3. 주말뭉치의 장르별 분량 배정 위의 표를 바탕으로 본 연구에서는 말뭉치를 구성하는 텍스트의 범주에 따른 분량을 다음과 같이 정하였다. 이러한 분량 배정은 ① 될 수 있으면 고른 비율로 각 장르를 포괄한다. ② 현실적으로 텍스트 확보 가능성을 고려한다 라는 두 가지 원칙 에 따라 이루어진 것이다.
- 43 -
<표20> 주말뭉치의 장르별-주제별 분량 배정
장르분류 소설 수필 수기·기행 전기·보고(르뽀) 교양해설 논설·비평 지침·정보 합계
분량(어절) 20만 15만 15만 15만 15만 15만 5만 100만
주제분류 종합 인문 사회 자연 공학 보건 예술 합계
분량(어절) 65만 6만 6만 6만 6만 6만 6만 100만
4.3.4. 주말뭉치의 구축 4.3.4.1. 텍스트의 선정 텍스트를 선정하는 과정에서는 다음과 같은 점에 유의하였다. ① 표준적인 텍스트를 선택한다 : 맞춤법 및 표준어 규정에 맞는 텍스트로 구성되어야 하므로 될 수 있으면 1988년 이후 에 출판된 텍스트를 선택하였다. ② 일반적인 텍스트를 선택한다 : 번역 텍스트나 신문기사를 재출판한 텍스트는 제외하였다. 또한, 소설류의 경우, 내용에 있어서 역사소설, 과학소설 등 배제하였다. ③ 기본적인 텍스트를 선택한다: 쉽고 평이한 텍스트를 선택한다. 따라서 소설류의 경우 동화나 우화가 다수 포함되도록 하였으며 전기, 기행, 교양 해설 등에 있어서도 아동을 대상으로 하는 텍스트의 선정을 권장한다.
4.3.4.2. 주말뭉치 이상과 같은 기준에 따라 다음과 같은 주말뭉치가 구축되었다. <표21> 주말뭉치의 구성 내역
장르별 분류 소설 수필 수기, 기행 전기, 보고 교양 해설 논설, 비평 정보, 지침 합계
크기 203,658 148,792 149,371 142,186 153,231 156,609 53,747 1,007,594
주제별 분류 종합 인문 사회 자연 공학 의학 예술
크기 644,007 86,663 97,419 33,620 32,951 33,737 79,197 1,007,594
4.3.4.3. 말뭉치 구성 텍스트 목록 지은이 제목 출판사 연도 -------------------------------------------------------------------------------------------------------------강계순/역 아벨라르와엘로이즈 880000
- 44 -
강기희, 강봉수, 강소천 강신항,정량완 강원용 강정규 고은 고은 고은 고은외 곽재구 곽재구, 교육문예창작회 권이구,강지현공역 권정생 그레이업 그린 기준성, 김경민 김구 김병익 김병익 김상삼 김성도,+9 김열규(외)지음 김영희, 김용락 김용옥 김용옥 김용운 김용국, 김원일 김이관 김정욱, 김종철 김준엽, 김지하 김창완 김하기 김향숙 김현 김현희 김형국, 김형석 김형석 김호년 나탈리 배비트, 다케다 다이줄 데니스 단치거 레이먼드 스멀리언 로버트 슬레이터 로버트 템플, 로빈 쿡, 마광수 마이크 쉘던 민중문화운동연합 박경리 박노해, 박대선 박병호 박병호 박상규 박상우 박완서
병원정보 소프트 강봉수 할머니의 미용식이요법 나는겁쟁이다 거울앞에서 저문이닫히기전에[강원용수상집] 병아리의꿈 환멸을찾아서 성.고은엣세이(인간은슬프려고태어났다) 이중섭그예술과생애 강좌,민족문학 아기참새찌꾸 내가 사랑한 사람 내가 사랑한 세상 빵점부대돌돌이 누어인 바닷가아이들 키호테 신부 사람의 먹거리 겨울허수아비도사는일에는연습이필요하다 백범일지 전망을위한성찰 전망을위한성찰 엄마의목소리 10월의이야기 죽음의사색 아이를 잘 만드는 여자 공부도 요령이다 동양학어떻게할것인가 동양학어떻게할것인가 재미있는 수의 세계1 삶의결삶의질 감추어진비밀 위기의 환경 어떻게 구할 것인가 시와역사적상상력[김종철평론집] 長征 3 밥-김지하이야기모음 소금장수의재주 완전한만남(김하기소설집) 그림자도시 한국문학의위상[그전개와좌표] 이제여자가되고싶어요1(내영혼의눈물) 그 사람 장욱진 잠들지않은영혼을위하여[김형석수상집] 잠들지않은영혼을위하여[김형석수상집] 한국의명당 트리갭의 샘물 한줌의 흙 아빠의 임신일기 이 책의 제목은 무엇인가 컴퓨터 영웅들 그림으로 보는 중국의 과학과 문명 돌연변이 나는야한여자가좋다[마광수에세이] 조지 오엘-감춰진 얼굴 전망과건설 거리의악사[오늘의산문집20] 우리들의 사람 우리들의 분노 대학과국가발전 한국의법[교양국사총서10] 한국의법[교양국사총서10] 고향을지키는아이들 샤갈의마을에내리는눈 가을에만난사람
- 45 -
신구미디어 정일출판사 현암사 창작과비평사 민음사
국민서관 도서출판푸른나무 창작과비평사
도서출판성림 서문당 문학과지성 아동교육문화연구회 국민서관
19920420 19880515 19670000 19821125 19760000 731110 730000 900410 19920210 19901030 880000 19881205
19930312 19890000 19870000 870000 19910410 19820200 89000
민음사
19850000 850000
세계사 기독교문화사
19931225 19930906
문학과지성사
19781200
창작사
문학과지성사 고려원 문학세계사 동학사
84000 19871201 901120 921010 19771000 19910620 19790000 79000 19890000
199108
890120 동녘
교육출판사 세종대왕기념사업회 창작과비평사 제3기획
19880000 77000 1992.2. 19680410 19741200 741200 19810410 921110 19901125
박완서 그많던싱아는누가다먹었을까 박은희, 아름다운 性과 사랑을 위하여 박종홍 한국의사상적방향[그몇가지의고찰] 박현채 민중과경제[정우교양신서7] 정우사 버지니아 울프, 세월 서울대학교학생생활연구소편 학과 선택의 길잡이<인문 사회 예체능계열> , 서정주 나의문학자서전 민음사 서정주 나의문학자서전 서정주, 未堂산문 손봉호 나는누구인가:현대인과기독교의만남을위하여 샘터 손석희 풀종다리의노래(손석희아나운서의삶의이야기) 손춘익 작은어릿광대의꿈 창작과비평사 송건호 한국민족주의의탐구[송건호평론선][오늘의사상신서1] 한길사 송건호 한국민족주의의탐구[송건호평론선][오늘의사상신서1] 스튜아트 보일/존 아딜, 지구의 마지막 선택 신경림 강따라아리랑찾아 신지식 가려진별들 삼성미디어 안병욱 세계 지식인의 수난사 안석강 나루터삼총사 창작과비평사 안정효 은마는오지않는다 알베르 까뮈.장 그르니에 편지( 김용환 역) 양귀자 나는소망한다내게금지된것을 양희은, 이루어질 수 있는 사랑 오규원. 예술의이해 서울예대출판부 오월편지부역 산디니스타,니카라구아 오정희 불의강[오정희소설집] 문학과지성사 오창환, 1991.10 재미있는 철학노트, 오화섭 이조그만정열을 삼중당 요시프 뻬레취 물리나라 여행기 논리야놀자 사계절 위기철 유달영 인생노우트 수도문화사 윤금초 가장작은것으로부터의사랑 신원문화사 윤기현 서울로간허수아비 도서출판인간 윤영춘 행복은너의것[윤영춘에세이집] 휘문출판사 윤정모 들(상) 이경덕옮김 사랑과전쟁의낮과밤 이계진 뉴스를말씀드리겠습니다.딸꾹! 이관기/역 신문제국의흥망 이광출 강요된통만두 서울기획 이규호 사람됨의뜻 제일출판사 이기성, 컴퓨터는 깡통이다 이낙운, 카피, 이처럼 쓰라 이대복 통일교원리비평과문선명그실상과허상 이문열 변경1[이문열장편소설:불임의세월] 이문열 사색(이문열사색집) 이범선 오늘이하루를 대한기독교계명협회 이병용 법창여화 이상일 축제와마당극[조선일보선서2] 이상현 공포의서울 삼성미디어 이슬기 돈의여행 지경사 이어령 흙속에저바람속에[이것이한국이다] 현암사 이영호 열두컷의낡은필름 오늘 이영희 살며사랑하며 서문당 이오덕 이아이들을어찌할것인가 청년사 이윤복 저하늘에도슬픔이 글벗사 이은상 산찾아물따라 이인화 내가누구인지말할수있는자는누구인가 이재황/역 종교는필요한가 이종은, 파브르 곤충기(1.신기한 쇠똥구리) 이주홍 피리부는소년 삼성미디어 이지영 정은진/, 젊은 엄마의 생활 아이디어 이진/, 서울대 기숙사
- 46 -
921015 680330 19780000
19750000 750000 19870000 931120 19810601 19770000 770000 920225 19910120 19861101 901120 199107 920801 19890000 880000 19771000 19730000 19930220 19581220 19920930 19821210 19660330 920805 870000 911115 880000 19931005 19670000
870000 890000 910701 19680210 650000 860930 19900625 19890731 19630000 19910915 19730000 19770000 19920825 661025 920305 870000 19910121
이창배 가장은외롭다 이철호 거울속의가을남자 이철환 과천종합청사불은꺼지지않는다 이철환 과천종합청사불은꺼지지않는다 이현주 날개달린아저씨 이호 정상은우연히오지않는다(정세영과'현대자동차') 임두빈 세계관으로서의미술관 장기표 해방의논리와자주사상;국민여러분께드리는글 장기표 해방의논리와자주사상;국민여러분께드리는글 장우원 문화부가 가려뽑은 인물이야기 1 전국교직원노동조합(유시춘) 닫힌교문을열며 전규태 한국인의미의식[그전통과정한의앙금] 전산초 가정간호(건강한샐활을위하여) 전택부 강아지의항변 전혜린 그리고아무말도하지않았다. 정길환 가끔은코끝이찡할정도의잔재미 정성호/역 백년동안의사랑 정진국/역 사진의역사 정진권 푸르른나무들에저붉은해를[정진권수필집] 정혜자 가슴이따뜻한사람과만나고싶다 제임스 글리크 CHAOS 제임스 미치너, 소설 조동일 판소리의이해 조동일 우리학문의길 조석준, 민물고기를 찾아서 조양욱, 일본 리포트 조연현 외로움속에서[수상집] 조헌영, 한방이야기 주석균 농민을위하여[정우교양신서9] 진대현, 초보자와 함께하는 경리노트 첸 카이커, 어느 영화 감독의 청춘 최몽룡역 인류의선사시대 최선우옮김 칠레혁명과인민연합 최성수 가지많은나무가큰그늘을만든다 최성욱편저 정신은어떻게나타나는가 카톨릭철학교재편찬위원회 젊은이들을위한철학 칼 I. 신더만, 과학자의 기쁨과 영광 크루이로프, 보석상자 투키디데스, 펠로폰네소스 상 소설 횔더린 페터 헤르틀링, 한국현대아동문학가협회편 다섯게으름장이가사는마을 한기찬, 재미있는 법률여행 민중과지식인 한완상 함석헌 두려워말고외치라[함석헌전집11] 헤르만 헤세, 의자와의 대화 현원복 하이테크 달걀 혜서원편집부편, 新건강상식 3000 황석영 무기의그늘(하) A.셧클리프 외, 에피소드 과학사(물리 이야기) , F.카프카 저/김창활 역 사랑의 형이상학(카프카의 명상일기) F.클렘, 기술의 역사 O 헨리, 꼼치 S.M.슈바르츠/김남, 1905년 혁명-녹두신서14 V.M.DHLMAN, 생체시계, 가을에 만난 사람 아무도 어른이 되지 않는다 어머니에게 사랑을
4.4. 결론
- 47 -
문학아카데미 한겨레 법지사 창작과비평사 범조사 친구
문리사 향린사 을지서적
일지사 미완
19900318 19930618 19920000 920000 19830310 930110 19880000 19880000 880000 900201 19780100 680820 19670515 670811 19921020 880000 870000 19720000 19900915
창작과비평사
19780000 930620
문원각
19680910
정우사
19790000
내일을여는책 이문출판사 이문출판사
870000 870000 19930720 19880000 19880000
대일출판사
19870110
한길사
780000 19840000
920620 19930701
1986.1
4.4.1. 요약 지금까지 논의된 사항을 정리하면 다음과 같다. ① 본 연구에서는 한국어 교육용 말뭉치를 그 사용 목적과 언어적 특성에 따라 표준 말뭉치와 오류 말뭉치로 분류하고 그 가운데 표준 말뭉치를 통하여 교육용 기초 어휘 선정의 준거를 제시하도록 하는 것을 목적으로 한다. ② 표준 말뭉치는 일반 말뭉치가 갖추어야 할 요건 외에 교육용 자료의 추출원으로서 몇 가지 제약을 갖는다. 그것은 대상 언어의 다양한 모습을 보여 주되, 표준적이고 모범적인 언어사용 양상이 추출되는 말뭉치라고 할 수 있다. 따라서 다소 규범 적이고 통제된 텍스트로 구성되어야 할 것이다. 또한, 국어에 대한 직관이 없는 외국인 학습자를 염두에 두는 것이기 때문에 비교적 평이하고 기본적인 국어의 모습을 보 여 줄 수 있어야 한다. ③ 표준 말뭉치는 일반적인 텍스트로 구성되는 주말뭉치와 교육용 텍스트로 구성되는 참조 말뭉치로 이루어진다. 본 연구 에서는 산문에 한하여 주말뭉치를 구성하는 것을 목표로 하였다. ④ 주말뭉치는 텍스트의 내적 자질과 외적 자질의 조합에 의해 범주화되며, 각 범주는 다시 장르로 나뉜다. 주말뭉치를 이 루는 텍스트 범주는 예술산문, 사적 저술, 교양산문, 실용산문이며, 이들은 서술방식, 사실성, 주관성 등의 자질에 의해 소설, 수필, 수기류, 교양 해설, 논설·비평, 정보·지침 등의 장르로 나뉜다.
4.4.2. 과제 앞으로의 연구를 통해 보완되어야 할 사항은 다음과 같다. ① 주말뭉치에 있어서 구어 혹은 문어화된 구어 분야가 포함되어야 하며 그에 따른 구어의 범주 분류, 구어와 문어의 비율 결정 등이 이루어져야 한다. ② 참조 말뭉치의 구축이 이어져야 한다. 교과서의 경우 단일한 교과서가 있는 일부 교과목을 제외하면 많은 텍스트 가운 데 일부를 선택하여야 하는데, 그 기준이 제시되어야 하며, 사전 풀이말의 경우, 표제어의 특성에 따라 다른 유형의 풀이말이 가능하므로, 사전 뜻풀이의 언어구조에 대한 예비적 조사 작업이 있은 뒤에 참조 말뭉치에 포함하는 작업이 진행되어야 한다. ③ 앞에서 지적한 바와 같은 말뭉치 구축의 실제 문제와 관련된 과제와 별도로, 한국어 교수 방법론이나 교수 요목의 개발 과 궤를 같이하여, 학습자의 요구와 단계에 맞는 한국어 교육의 전문화, 세분화를 지원해 줄 수 있도록 다양한 성격, 다양한 크기의 말뭉치 개발이 이루어져야 한다.
- 48 -
5. 어휘 빈도 정보에 기반을 둔 기본 어휘의 설정 요소 5.1. 한국어 교육의 단계 우선 평가를 하는 기준은 일단 한국에서의 생활, 한국인과의 교류, 한국에 대한 광범위한 정보 획득 능력 제고 등의 사회 현실적 목적이라는 테두리를 중심으로 세워 보는 방안을 생각해 볼 수 있다. 왜냐하면 다른 언어의 등급 판별 기준에 ‘다소 고도의 문법, 일상생활에 도움이 되는’처럼 불분명한 잣대가 생기는 까닭이 근본적으로는 자국어를 외국인이 사용할 때에 어 떤 행위 유형과 생활 태도를 가져야 할 것인가에 대한 깊은 검토 없이 등급을 매겨 놓은 데에서 발생했다고 보기 때문이다. 그런 점에서 외국인들이 한국 사회에서 실질적으로 어떠한 행위를 필연적으로 하게 되는가, 그리고 요구받게 되는가 등을 중 심으로 가장 기본적인 단계(초급), 본격적인 단계(중급), 높은 수준의 단계(고급) 등으로 수준을 분류해 보기로 한다. 1. 초급(가장 기본적 단계) ⅰ) 기본적인 대인 관계 유지……① 인사를 나누기, ② 난처한 일이 생겼을 때 한국인에게 도움 청하기, ③ 전화 로 매우 단순한 용건 처리 ⅱ) 기본적인 경제 활동……① 물건을 구입하고 계산을 치르기, ② 구입한 불량 상품 반품 처리♣52 ⅲ) 기본적인 교통 상황에 적응……① 모르는 길 물어 가기(안내자 없이), ② 한국어판 지도 사용, ③ 대중 교통 수단 이용과 행선지 표현, 택시 합승하기, ④ 간단한 여행(숙박업소 이용)♣ ⅳ) 언어에 대한 지식……① 한글 해득(아직 맞춤법이 서투를 수 있음), ② 자신의 이름과 연락처를 적어 줄 수 있 는 능력, ③ 한국어 사전 사용법 숙지 ⅴ) 기본적인 공공 시설 이용……① 간단한 민원 처리, ② 각종 수리 의뢰♣, ③ 병원, 약국 이용♣ ⅵ) 기본적인 문화 활동……① 신문 제목 이해♣, ② 간단한 수필 (사전을 보며) 어느 정도 읽음♣ 2. 중급(본격적인 단계) ⅰ) 기본적인 대인 관계 유지……① 남들을 소개해 주기, ② 자신의 고향이나 집안 내력 등을 자세히 설명, ③ 남 의 오해를 당사자로서 혹은 제삼자로서 풀어 주는 능력, ④ 전화로 복잡한 용건 처리, ⑤ 한국인에게 논리적 으로 따지고 들 수 있는 능력, ⑥ 농담 섞은 대화♣ ⅱ) 기본적인 경제 활동……① 업무 출장 등♣ ⅲ) 기본적인 교통 상황에 적응……① 먼 여행(민박 이용, 자기 운전 여행) ⅳ) 언어에 대한 지식……① 자신과 같은 모어 사용자들에게 한국어에 대한 설명, ② 한자의 기본적 구조 이해, 서 툴러도 옥편 사용법을 앎, ③ 한국어 문법의 주요 뼈대 숙지, ④ 단순한 통역, ⑤ 속담을 적절히 구사♣, ⑥ 어느 정도 빠른 말도 이해♣, ⑦ 사실 중심의 한국어 문장을 모국어로 번역♣ ⅴ) 기본적인 공공 시설 이용……① 우편 이용, ② 비교적 복잡한 민원 처리, ③ 사건의 목격자로 신고나 증언 ④ 한국어 미학습자를 안내하며 공공 시설을 이용, ⑤ 각종 구두 공지 사항 이해♣ ⅵ) 기본적인 문화 활동……① 신문 구독, ② 중단편 문학 읽음, ③ 텔레비전 뉴스 시청, ④ 텔레비전 드라마나 영 화 이해♣, ⑤ 비교적 간단한 토론 참여♣, ⑥ 신문 사설 수준 이해♣ 3. 고급(높은 수준의 단계)
52
). ♣표는 약간 더 높은 수준의 능력이 필요한 경우를 뜻한다.
- 49 -
ⅰ) 대학 강의 수강 ⅱ) 자신의 전문적 분야를 자세히 설명 ⅲ) 감성적인 한국어를 모국어로 번역 ⅳ) 신문 충분히 이해 ⅴ) 보통 연극 이해 ⅵ) 통역 ⅶ) 강연이나 설교, 강의 ⅷ) 일부 방언 이해 ⅸ) 한국인과 논쟁 ⅹ) 매우 현학적인 말과 글 이해 및 사용 ?) 동시 통역 ?) 재판과 같은 법률적 분쟁에 가담 이상의 한국어 능력 분류 체계는 전적으로 외국인들이 한국어를 사용하면서 구사하게 될 가능성이 있는 각종 사회적 활동 과 행위(혹은 언어 행위)에 해당한다. 이렇게 크게 나눈 3개 등급을 다시 한번 그 난이도에 따라 각각 두 부분으로 나누면 모 두 여섯 개의 등급이 구분된다. 난이도의 구분은 초급과 중급의 경우는 ♣표로 더 어렵다고 판단되는 항목을 표시하였으며, 고급에서는 (ⅰ)부터 (ⅴ)까지가 좀 쉬운 편이고, (ⅵ)부터 (?)까지는 더 어려운 언어 구사 능력이 필요한 것들이다. 이상의 항 목들은 한국어를 사용하거나 배우는 사람들의 사회적 행태를 더 세밀히 조사함으로써 더욱 정교화할 수 있을 것이다.53
5.2. 한국어 교육용 기초 어휘의 빈도 구간상의 분포 이미 앞서 살펴본 바와 같이, 현대 한국어의 말뭉치 분석을 통하여, 기본 어휘를 추출하는 데에 있어서, 어휘의 수를 얼마 로 한정하는가에 있어서는, 이제까지의 연구 결과와 서상규(1998)에 근거하여, “통제할 수 있는” 어휘수까지로 일단 범위를 한 정할 수 있을 것이다. 이 숫자를 잠정적으로 최고 빈도 5,000개로 한정할 경우, 토씨와 씨끝을 포함하는 경우에 83%에서, 이 들을 제외하는 경우(즉, 일반 어휘만으로 구성하는 경우)에 81.3%의 사용률을 보임을 확인할 수 있었기 때문이다. 또한 어휘의 증가율이란 관점에서 볼 때에도 이 구간에서 이미 통제할 수 있는 범위를 벗어나기 시작한다는 것을 다음의 그림을 통해서 알 수 있다. 이것은 빈도 7 이상의 62,807개의 어휘에 이르기까지의 어휘의 분포를 “누적빈도율”, 즉 사용률을 2%씩 늘려가면서, 어휘의 종(Type)의 수가 얼마나 늘어가는가를 보이는 것이다. 오른쪽의 어휘증가율은 바로 윗 구간에서 아 랫 구간에 이르는 동안에 늘어난 어휘종의 수의 증가율54을 추출한 것이다.
누적빈도율 2.00 4.00 6.00 8.00
어휘종수 0 1 2 2
어휘증가율 0.00000 0.00159 0.00159 0.00000
53
). 이 난이도에는 어휘의 빈도나 문법 구조의 복잡도 등은 원칙적으로 배려하지 않았다. 왜냐하면 외국어 사용자들은 순수한 언어적인 복 잡성으로 말미암아 어려움을 느끼는 것보다, 사고 방식의 복잡성, 문화적인 격차, 행위 규범의 이질성 등에서 더욱 곤란을 겪기 마련이 기 때문이다. 그런 어려움에 비하여 언어 형식에서 비롯되는 어려움은 훨씬 극복이 용이하다. 54 ) 계산식은 =((뒷 구간의 어휘종의 수-앞구간의 어휘종의 수)/전체어휘종의 수62807)*100이다.
- 50 -
어휘증가율 70.00000 60.00000 50.00000 40.00000
어휘증가율
30.00000 20.00000 10.00000
- 51 -
92.00
82.00
72.00
62.00
0.00000 52.00
0.43307
42.00
1,457
32.00
80.00
22.00
0.00159 0.00159 0.00159 0.00159 0.00159 0.00159 0.00000 0.00159 0.00159 0.00318 0.00318 0.00318 0.00318 0.00318 0.00637 0.00796 0.00955 0.01274 0.01911 0.02229 0.02866 0.03344 0.04299 0.05254 0.06369 0.07642 0.09235 0.10508 0.12260 0.14648 0.17992 0.22450 0.26908 0.33913
12.00
3 4 5 6 7 8 8 9 10 12 14 16 18 20 24 29 35 43 55 69 87 108 135 168 208 256 314 380 457 549 662 803 972 1,185
2.00
12.00 14.00 16.00 18.00 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00 40.00 42.00 44.00 46.00 48.00 50.00 52.00 54.00 56.00 58.00 60.00 62.00 64.00 66.00 68.00 70.01 72.00 74.00 76.00 78.00
84.00 86.00 88.00 90.00 92.00 94.00 96.00 98.00 100.00
2,242 2,833 3,636 4,775 6,459 9,062 13,483 22,709 62,807
0.70534 0.94098 1.27852 1.81349 2.68123 4.14444 7.03902 14.68945 63.84320
앞의 그림에서도 나타난 바와 같이, 사용률(누적빈도율) 86%에 이르기까지는 매우 완만하게 어휘종의 수가 증가하다가, 88%에 이르면서 급격하게 어휘종이 늘어난다. 증가 곡선이 상승하기 시작하는 지점을 어느 곳으로 잡느냐에 따라서, 기본 어 휘의 수가 달라지겠지만, 적어도 위의 표와 그림을 볼 때에, 검정색으로 표시되어 있는, 사용률 78∼90% 사이의 어느 지점이 우리가 한국어 교육을 위해 통제할 수 있는 구간의 범위가 되는 것만은 확실하다고 볼 수 있다. 위의 표에서 누적 빈도율이 90%인 지점, 즉 4,775개의 어휘종이 속한 구간만을 떼어서 이것을 전체로 하여, 같은 방식으로 분석하면, 다음과 같은 그림을 얻을 수 있으며, 여기에서는 위의 표에서는 단지 완만하게만 보이던 구간에서의 어휘 증가율의 추이를 좀더 확실히 관찰할 수 있다. 어휘증가율 25
20
15 어휘증가율 10
5
98
92
86
80
74
68
62
56
50
44
38
32
26
20
14
8
2
0
<그림1> 누적빈도90%까지의 어휘 구간에서의 어휘 증가율의 추이
그러므로 본 연구에서는 일단 한국어 교육을 위한 기본 어휘 선정 작업을 위한, 기초 자료로서 추출된 약 5,000개의 어휘 목록을 다음 절에서 보이기로 한다. 그렇다면, 이 범위에 속한 어휘들은 어떤 구성으로 되어 있을까? 다음의 두 개의 표는, 토씨와 씨끝을 포함하지 아니한 경 우의 품사별 어휘수와 빈도수의 분포를 보인 것이다.
- 52 -
<표22> 한국어 교육용 기초 어휘 후보 목록(5001) B의 품사별 “어휘수”의 분포
품사 고유이름씨 그림씨 느낌씨 대이름씨 도움풀이씨 매김씨
어휘수 94 332 32 46 36 48
비율(%) 1.88 6.64 0.64 0.92 0.72 0.96
품사 매인이름씨 셈씨 어찌씨 움직씨 이름씨 잡음씨 합계
어휘수 145 40 414 1,122 2,689 3 5,001
비율(%) 2,90 0.80 8.28 22.44 53.77 0.06 100
<표23> 한국어 교육용 기초 어휘 후보 목록(5001) B의 품사별 “빈도수”의 분포
- 53 -
한편, 씨끝과 토씨를 포함하여 5,000개를 구성하였을 경우의, 품사별 어휘수와 빈도수의 분포를 보이면 각각 다음과 같다. <표24> 한국어 교육용 기초 어휘 후보 목록(5000) A의 품사별 어휘수의 분포
고유이름씨 그림씨 느낌씨 대이름씨 도움풀이씨 매김씨 매인이름씨 셈씨
80 303 28 46 35 46 142 38
1.60 6.06 0.56 0.92 0.70 0.92 2.84 0 76
씨끝 안맺음씨끝 어찌씨 움직씨 이름씨 잡음씨 토씨 합계
262 15 392 1031 2447 3 132 5000
5.24 0.30 7.84 20.62 48.94 0.06 2.64 100 00
<표25> 한국어 교육용 기초 어휘 후보 목록(5000) A의 품사별 빈도수의 분포
고유이름씨 그림씨 느낌씨 대이름씨 도움풀이씨 매김씨 매인이름씨 셈씨
141583 1225243 73322 1156629 997833 590476 1508470 214469
0.36 3.09 0.19 2.92 2.52 1.49 3.81 0 54
씨끝 8972221 안맺음씨끝 1483602 어찌씨 1627183 움직씨 4581595 이름씨 7639104 잡음씨 1094221 토씨 8308048 합계 39613999
- 54 -
22.65 3.75 4.11 11.57 19.28 2.76 20.97 100 00
6. 기초 어휘의 검증 6.1. 기초 어휘 후보군의 분포 먼저 이 연구에서는, 연세 말뭉치의 어휘 빈도 전체에서 상위 90%의 빈도를 점유하는 어휘를 “기초 어휘 후보군”으로 설 정하였다. 이는 앞의 2.3.2에서도 살펴본 바와 같이, 대개의 언어에서도 85∼90%의 범위에서 기초 어휘의 범위를 설정하는 것과 맥을 같이한다. 기초 어휘 후보 목록을 검증하기 위한 첫번째의 절차에서, 우리는 전체 연세 말뭉치의 어휘 빈도 자료 중에서, 누적 빈도 점유율(사용률) 90% 이상의 범위에 속하는 어휘를 추출하였는데, 아래의 표에서 보는 바와 같이, 모두 4,779개의 어휘가 1차 적으로 추출되었다. <표 26 > 연세 말뭉치 90% 사용률 구간의 어휘의 분포
<씨갈래>
어휘 종수
고유이름씨
어휘 종수의 비율
빈도수의 합
빈도의 비율
75
1.57%
138,454
0.35%
그림씨
293
6.13%
1,219,594
3.06%
느낌씨
27
0.56%
72,696
0.18%
대이름씨
47
0.98%
1,158,178
2.91%
도움풀이씨
35
0.73%
997,878
2.51%
매김씨
45
0.94%
589,838
1.48%
140
2.93%
1,512,002
3.80%
셈씨
37
0.77%
213,859
0.54%
씨끝
250
5.23%
8,964,677
22.52%
어찌씨
381
7.97%
1,620,176
4.07%
움직씨
992
20.76%
4,557,215
11.45%
이름씨
2,311
48.36%
7,550,057
18.97%
토씨
128
2.68%
8,636,440
21.69%
합계
4,779
100.00%
39,808,887
100.00%
매인이름씨
6.2. 검증 자료 앞에서 제시된 “기초 어휘 후보군”55을 검증하고, 보완하기 위해서, 다음과 같은 자료의 조사 결과와 대비하기로 하였다.56
6.2.1. 한국어 교재 8종의 어휘 사용 분포의 조사 결과57 1) 이화여자대학교(E) 1권, 2권 2) 연세대학교 한국어(Y) 1 - 6 3) 고려대학교 한국어(K) 1 - 6 55
) 이하, “기초 어휘 후보군” 또는 “후보군”으로 줄여서 표현함. ) 이 자료의 대비를 위한 자료의 입력과 분석에는, 언어정보개발연구원의 김한샘 양(연세대 대학원)이 매우 큰 도움을 주었다. 이 자리를 빌어 사의를 표한다.
56
- 55 -
4) 한국외국어대학교(F) 한국어 1, 2 5) 가나다 외국인을 위한 한국어(A)1, 2, 3 * 6) 서울대학교 한국어(S) 1, 2, 3 7) Korean though English(문화부)(M) 1, 2, 3 8) 시사한국어, 외국인을 위한 한국어(Q) 1, 2 이들 교재의 분석을 통하여 추출된 어휘는 총 9,836 단어인데, 빈도수가 아닌, 교재의 중복도를 볼 수 있는 자료이다.
6.2.2. 조선어 분류 기초 어휘집(1998) 野間 秀樹(1998.3.27.)의 『조선어 분류 기초 어휘집』(일본 동경외국어대학 조선어학연구실)의, 한국어 교육을 위한 기존 기초 어휘표와의 대조를 시도하였다. 이 자료에는, 모두 5,535개의 어휘를 대상으로 하여, 최중요어 791, 중요어 1,899개, 일 반어 2,845로 나누어 그 중요도 구분의 표시가 붙어 있다.
6.2.3. 초중등 학교 교과서의 어휘 사용 조사표58 ○ 박붕배(1975), 초등교육에 있어서 우리말 기본 학습 어휘에 관한 조사 연구, 서울교대논문집 8, 25-166ㅉ. (국어, 산수, 사회, 자연, 바른생활) ○ 임지룡(1989), 국어의 기초어휘에 대한 연구, 국어교육연구 23집, 경북대 국어교육연구회 (국어교과서 상위 고빈도) ○ 서정국(1975-78), 중학교 국어 교과에 쓰인 어휘의 조사 연구(1-4), 강릉교대 논문집 7,8,9,10. (중학 국어 1-1, 중학 국어 1-2, 중학 국어 2-1, 중학 국어 2-2) ○ 김희진(1990), 중학교 교육용 어휘에 관한 연구, 국어교육 71,72, 349-409ㅉ. ○ 이응백(1972), 국민학교 학습용 기본어휘연구, 국어교육 18-20, 한국교육연구회,. ○ 이응백(1975), 국민학교 입문기 학습용 기본어휘연구, 국어교육32, 183-246ㅉ. ○ 이충우(1994), 한국어 교육용어휘 연구, 국학자료원, 283ㅉ. (중학교 교육용 한자어, 중학교 교육용 고유어, 중학교 교과 전문, 국민학교 교육용 외래어, 국민학교 교 육용 기타어휘, 국민학교 교육용 한자어, 국민학교 교과 전문, 국민학교 고유어) ○ 안승덕, 김재윤(1975), 국민학교 국어 교과서의 어휘 조사 연구, 청주교대논문집11, 125-181ㅉ.
6.2.4. 한국어 교재의 어휘 빈도59 ○ 김명순 편(1986), 한국어 어휘와 품사의 빈도에 관한 연구 -외국어로서의 한국어 교재를 중심으로-, 연세대 교육대학원 석사논문, 연세대 교육대학원. 1). MYONGDO'S KOREAN 2). Korean by B.NAM PARK 3). Korean 1 by C.H. Park & K.D. PAK 4). An Introductory Course in Korean
57
) 이 조사 결과의 실제 내용은, 별권으로 묶은 “국내 주요 한국어 교재 8종의 어휘 사용 실태 조사”를 참조 바람. ) 아래의 표에서는 이들 각 자료의 빈도표의 빈도 합을 사용하며, “교과서”로 표시함.
58
- 56 -
6.2.5. 문영호 외, 『조선어 빈도수 사전』(1993, 과학백과사전종합출판사)의 어휘 빈도표 『조선어 빈도수 사전』(1993)의 경우에는, 빈도 81 이상의 1,920개의 어휘 목록만을 취했는데, 이는 이 자료 전체의 68.8%의 사용률에 해당한다. 또한 이 자료에는 “토”(토씨, 씨끝)는 별도로 처리되어 있어, 검증 자료에는 이들을 포함하지 아 니하였다. 먼저, 이들 자료에서 사용된 어휘의 분포와 대조한 결과, 다음과 같은 합집합과 교집합의 어휘 목록을 얻을 수 있었다.
6.3. 검증 자료와 기초 어휘의 합집합 먼저 앞에서 추출한 연세 말뭉치의 “기초 어휘 후보군” 중에서, 각 검증 자료들(교과서, 조선어 빈도수사전, 한국어 교재) 가운데 하나에라도 나온 어휘 목록을 추출한 결과, 다음과 같은 결과를 얻을 수 있었다. 아마도, 이들 관련 영역에서의 자료 에 사용된 1차적 합집합을 이용한다면, 4,779개의 광범위한 어휘 속에서, 제1수준의 기초 어휘를 추출해 나갈 수 있을 것이다.
6.3.1. 합집합의 어휘 목록 아래의 ID는 연세 말뭉치를 대상으로 한 어휘 빈도 조사표(서상규 1998 참조)에서의 표제어 고유 번호를, ①은 연세 말뭉 치에서의 사용 빈도를, ②는 “교육용 말뭉치”의 어휘 빈도를, ③은 초중등 교과서의 어휘 빈도 총합을, ④는 『조선어 빈도수 사전』(1993)에서의 빈도수를, ⑤는 김명순(1986)의 한국어 교재의 어휘 사용 조사 결과를, ⑥은 노마 히데키 교수의 『조선 어 기초 어휘 분류표』(1998)의 어휘 중요도 표시를, ⑦은 한국어 교재 8종의 어휘 중복도를, ⑧은 한국어 교재 8종에 출현하 는 등급(수준)을 나타낸다. -----------------------------------------------------------------------------------------------------------------------ID 올림말 씨갈래 ①빈도1 ②빈도2 ③교과서 ④빈도사전 ⑤교재1 ⑥분류어휘 ⑦교재 빈도 ⑧교재 등급 -----------------------------------------------------------------------------------------------------------------------296 가 이름씨 15059 2331 2 0 0 2 가 토씨 1415850 22523 793 137 -8 1 1430 가게 이름씨 3010 74 16 0 0 2 -8 1 3598 가구 이름씨 965 27 1 0 0 1 -2 2 1558 가까이 어찌씨 2758 93 1 0 0 -4 2 862 가깝다 그림씨 5438 209 5 156 9 2 -8 1 3421 가꾸다 움직씨 1034 60 18 0 2 1 -1 4 1510 가끔 어찌씨 2839 138 6 83 5 2 -4 1 1503 가난하다 그림씨 2857 96 1 0 0 -3 3 4048 가늘다 그림씨 819 32 0 82 2 1 -1 2 954 가능하다 그림씨 4858 15 0 90 0 1 -3 3 49 가다 움직씨 75320 2331 256 4769 0 2 -7 1 1702 가득 어찌씨 2497 123 3 0 0 1 -3 2 4083 가락 이름씨 810 28 1 0 0 -1 4 4017 가루 이름씨 827 25 2 0 1 1 3636 가르다 움직씨 950 62 1 117 0 1 -1 4 976 가르치다(敎) 움직씨 4756 216 5 121 6 2 -6 1 1288 가리다 움직씨 3406 122 7 0 0 0 -3 4 1551 가리키다 움직씨 2769 99 5 105 0 1 -2 3 1369 가만히 어찌씨 3142 111 4 0 1 -3 2 2366 가방 이름씨 1668 61 6 0 2 2 -8 1 1491 가볍다 그림씨 2878 135 4 151 0 2 -2 1 335 가슴 이름씨 13881 447 5 740 3 2 -3 2 4244 가엾다 그림씨 773 23 3 0 0 1 951 가운데 이름씨 4885 418 7 399 1 2 -4 2 59
) 아래 표에서는 “한국어 교재”로 표시함.
- 57 -
1273 289 3452 1382 636 371 677 122 834 785 2118 2665 4142 4237 2688 1666 2137 935 4674 1504 3527 3583 2844 3301 4507 1686 588 1051 463 2724 3081 3227 2756 1146 356 1480 44 204 749 533 263 3761 4317 664 361 4084 1612 4590 482 2384 517 1743 1328 3291 1003 2341 2019 2794 1386 1139 2093 1046 155 624 1628 1018 1122 1293 1734 15
가을 가장 가져가다 가져오다 가족 가지 가지 가지다 가치 각 간단하다 간부 간절하다 간호원 갇히다 갈다 갈등 감 감격 감다 감동 감사 감사하다 감옥 감자 감추다 갑자기 값 강 강력하다 강물 강아지 강의 강하다 갖다 갖추다 같다 같이 같이 개 개 개구리 개울 개인 거기 거꾸로 거두다 거듭 거리 거울 거의 거짓말 거치다 거칠다 걱정 걱정하다 건강 건강하다 건너다 건물 건설 걷다 걸다 걸리다 걸어가다 걸음 걸치다 검다 겁 것
이름씨 어찌씨 움직씨 움직씨 이름씨 매인이름씨 이름씨 움직씨 이름씨 매김씨 그림씨 이름씨 그림씨 이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 움직씨 이름씨 이름씨 움직씨 어찌씨 이름씨 이름씨 그림씨 이름씨 이름씨 이름씨 그림씨 움직씨 움직씨 그림씨 어찌씨 토씨 매인이름씨 이름씨 이름씨 이름씨 이름씨 대이름씨 어찌씨 움직씨 어찌씨 이름씨 이름씨 어찌씨 이름씨 움직씨 그림씨 이름씨 움직씨 이름씨 그림씨 움직씨 이름씨 이름씨 움직씨 움직씨 움직씨 움직씨 이름씨 움직씨 그림씨 이름씨 매인이름씨
3452 15263 1023 3107 7453 12816 6958 33779 5639 5888 1905 1415 794 774 1405 2579 1885 4969 676 2857 991 972 1302 1086 712 2534 8148 4375 10489 1372 1179 1118 1354 3909 13151 2895 90935 20940 6172 9119 16804 906 756 7075 12983 810 2677 692 10096 1652 9488 2414 3277 1092 4610 1698 2019 1332 3095 3944 1945 4390 26239 7600 2640 4535 4035 3383 2434 496684
327 1005 30 104 273 1502 744 1502 272 107 49 47 27 18 57 88 60 154 25 154 53 48 41 44 24 82 304 101 314 39 87 37 70 200 658 145 3074 765 282 252 677 9 40 234 446 37 72 29 305 113 493 106 130 68 184 43 142 54 128 150 72 239 637 282 50 123 158 139 78 21185
15 38 14 13 12 0 68 59 0 4 2 0 0 1 1 2 0 2 0 3 0 3 1 1 0 1 6 6 5 0 3 50 0 0 20 3 133 50 2 0 181 3 2 0 1 1 2 2 7 1 4 3 0 1 10 1 3 2 5 0 0 16 8 11 3 2 0 3 1 340
- 58 -
190 484 0 0 0 613 0 0 104 115 0 292 83 0 0 0 108 0 106 0 0 0 0 0 0 109 232 264 0 89 0 0 0 143 88 186 6324 0 0 599 0 0 100 352 0 148 0 0 0 0 0 97 0 192 0 82 0 0 0 1610 0 0 98 0 512 165 176 0 18118
9 1 1 6 3 0 3 0 0 0 1 0 0 0 0 0 0 0 0 4 2 0 5 0 3 0 0 7 9 0 0 0 2 0 1 0 41 0 0 0 0 0 0 0 5 0 0 0 4 0 0 0 0 0 3 1 1 0 6 2 0 5 11 12 1 0 0 3 0 0
2 2 2 2 1 2 1 1 1
-7 -4 -5 -3 -7 -5 -6 -2
1 2 2 2 1 1 3 1 4
-3
2
-1
*
-1 -5 -2 -1 -1 -1 -1 -1 -5 -2 -2 -1 -6 -7 -4 -2
4 3 4 4 * 4 4 2 1 4 3 3 2 1 1 4
-3 -3 -3 -5 -1 -5
1 3 3 2 4 1
-6 -7 -5 -2
1 1 2 3
-2 -8
3 1
-4 -1 -4 -3
2 3 2 2
-5 -5 -3 -3 -4 -7 -1 -7 -6 -7 -3 -3
2 2 2 2 2 2 3 1 1 1 2 3
-1 -1 -4
3 1 1
0 1 1 1 1 2 2
2 2
1 2 1 2 2 2
1 2
0 1 2 2 1 0 2 2 2 1 1 2 2
0 1 1 2
2728 192 1098 1050 1243 972 550 2961 910 994 4404 4563 1449 612 1474 4377 950 2917 887 1093 1317 2303 889 1728 2205 3063 4300 836 10 472 427 1885 4195 2215 1634 1197 1994 4044 3169 4445 1941 3398 4313 1437 1168 3565 850 1794 4102 369 1352 4002 3086 1850 207 3790 729 1462 2675 1770 1889 1067 1993 1632 3337 3711 3400 2321 2810 4430
겉 게 겨우 겨울 겪다 견디다 결과 결심 결코 결혼 결혼식 겹치다 경기 경제 경제적 경주 경찰 경찰서 경험 곁 계급 계산 계속 계시다 계시다 계절 계통 계획 고 고 고개 고기 고등 고등학교 고르다 고맙다 고생 고생하다 고양이 고유 고장 고전 고추 고치다 고통 고프다 고향 곡 곡식 곧 골목 골목길 곰 곱다 곳 공 공 공간 공격 공기 공동 공부 공부하다 공사 공산당 공산주의 공식 공업 공원 공작
이름씨 토씨 어찌씨 이름씨 움직씨 움직씨 이름씨 이름씨 어찌씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 움직씨 이름씨 이름씨 이름씨 씨끝 토씨 이름씨 이름씨 이름씨 이름씨 움직씨 그림씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 그림씨 이름씨 이름씨 이름씨 어찌씨 이름씨 이름씨 이름씨 그림씨 이름씨 셈씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨
1369 21839 4175 4379 3548 4776 8857 1243 5110 4644 736 700 2969 7688 2913 742 4886 1265 5281 4186 3301 1734 5248 2444 1824 1189 762 5629 759097 10349 11390 2207 782 1817 2631 3721 2050 820 1145 727 2121 1042 758 2994 3820 979 5513 2344 805 12871 3203 830 1178 2250 20670 896 6329 2939 1409 2375 2200 4282 2053 2633 1070 923 1041 1714 1323 731
44 10827 171 218 149 177 394 44 265 302 29 24 83 351 36 15 144 23 260 128 233 163 238 184 94 87 30 188 29216 1809 321 87 42 57 112 115 56 20 85 34 97 36 15 135 221 36 221 48 54 508 74 27 108 108 658 10 129 109 61 137 101 377 78 33 39 20 37 40 39 14
0 1 2 10 8 3 0 0 0 0 0 2 3 0 0 1 1 2 0 2 0 21 3 11 14 1 0 0 893 3 7 6 1 0 11 24 4 1 33 0 25 0 0 13 0 0 0 1 4 6 2 2 7 17 88 0 21 0 0 5 1 20 11 1 9 0 0 0 4 1
- 59 -
92 0 127 179 139 135 300 120 116 0 0 0 0 864 225 0 0 0 243 211 227 195 0 0 273 0 85 472 0 0 0 161 0 0 0 96 87 0 0 0 0 0 0 141 109 0 110 0 0 261 0 0 0 132 0 0 116 96 0 0 150 0 0 112 702 99 561 0 0
0 0 1 11 0 0 0 0 0 3 1 0 0 1 0 1 0 0 0 0 0 0 4 0 18 1 0 2 2 0 2 3 0 1 1 11 0 0 1 1 1 3 3 0 0 4 29 1 1 23 0 0 2 0 0 1 0 0 0 0 0 8 14 2 0 0 0 0 0 0
2
-3 -2 -4 -5 -1 -3 -3 -2 -1 -3 -3 -2 -4 -1 -2 -4 -3
2 3 3 1 4 4 3 3 * 1 2 4 3 4 * 3 2
-2 -2 -1 -1 -4
3 4 4 2 2
1
-7
1
1
-4
2
-1 -6 -1 -3 -6 -5 -3 -2 -5 -2 -4 -1 -1 -6 -1 -6 -6 -3 -2 -5 -2
3 1 4 2 2 1 3 3 1 4 2 * * 2 4 1 1 2 3 2 3
-4 -3 -8
3 3 1
-2
4
-5
2
-2 -7 -3
1 1 3
-1
*
-6 -1
2 *
1 2 1 1 1 1 1 0 1
1 1 1 1 0 1
2 1 2 2
1 1 1 1 0
2 0 2
1 1 2 2 2 1 1 2
0
2 1
883 3637 3293 4520 4260 1224 3563 3961 2084 878 328 3241 1983 2942 4049 773 4706 479 1368 2730 4279 2266 3422 3279 783 2264 3822 395 2607 2716 974 2144 2530 2514 2377 1678 1668 4051 1549 2232 2391 4591 1553 903 760 3935 1526 572 4419 1633 4405 1620 1588 1724 3350 1767 1967 3511 2904 2909 3955 3564 2304 1778 576 2931 4289 3202 2105 2352
공장 공주 공중 공화국 과 과연 과일 과자 과제 과학 관계 관광 관련 관료 관습 관심 관찰 관하다 괜찮다 괜히 괴다 괴롭다 괴롭히다 교과서 교수 교실(敎室) 교양 교육 교장 교통 교회 구경 구경하다 구두 구르다 구름 구멍 구분하다 구석 구성 구실 구역 구체적 구하다 국 국군 국내 국민 국어 국제 국토 국회 군대 군인 군중 굳다 굴 굴다 굵다 굶다 굽다 굽히다 궁금하다 권리 귀 귀엽다 귀중하 귀찮다 규모 규정
이름씨 이름씨 이름씨 이름씨 토씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 그림씨 어찌씨 움직씨 그림씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 이름씨 움직씨 그림씨 움직씨 움직씨 움직씨 그림씨 이름씨 이름씨 그림씨 그림씨 그림씨 이름씨 이름씨
5310 950 1089 709 770 3624 980 843 1951 5361 14050 1111 2066 1254 819 6004 670 10169 3144 1367 765 1765 1034 1097 5893 1768 885 12161 1460 1383 4758 1877 1512 1523 1657 2546 2576 819 2774 1799 1644 692 2767 5170 6095 851 2810 8504 733 2632 736 2658 2709 2459 1067 2379 2083 997 1271 1267 846 980 1733 2359 8391 1260 764 1129 1919 1685
137 24 69 21 7479 142 60 43 91 344 437 15 87 38 46 254 69 452 88 30 32 86 33 29 189 98 30 300 38 35 109 97 55 82 59 141 143 16 77 132 61 30 92 157 117 18 83 174 11 45 35 29 84 75 17 84 71 71 42 36 38 19 41 113 241 61 26 36 62 93
30 9 2 0 282 0 23 4 0 0 11 0 0 0 0 0 15 1 5 0 1 0 1 1 0 15 0 1 4 5 1 23 10 0 1 20 5 1 1 0 1 0 0 21 1 36 0 9 1 0 0 0 3 10 0 0 4 1 0 1 3 2 2 0 3 4 0 0 0 0
- 60 -
0 0 0 492 88 0 0 99 482 590 0 183 0 0 249 0 199 0 0 0 92 0 0 0 0 0 499 0 0 0 0 0 0 0 0 0 0 108 186 0 90 393 0 0 0 82 0 0 233 0 98 0 119 374 0 0 0 89 87 0 0 0 100 0 0 157 0 119 159
1 0 2 0 0 0 1 2 0 0 0 2 0 2 1 0 0 0 13 2 0 0 0 2 2 8 1 1 0 13 0 1 0 4 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 2 1 0 1 0 0 4 0 0 0 3 0 0 0 0 3 0 0 1 0 0
1 0
-2
2
-8 -3 -5 -3 -1 -1 -2 -1 -1
1 4 1 1 * 4 3 1 *
-1 -4
3 2
-2 -6 -3
3 1 2
-3 -2 -4 -4
3 4 1 2
-1 -2
* 3
-5 -3 -6 -8 -7 -1 -4 -3
1 1 1 1 1 4 2 2
-2 -1 -3 -1 -2 -4 -5
2 4 4 4 4 2 1
1 1 2
-3 -2 -1 -2 -1
3 3 3 3 4
1 0
-4 -2
3 3
1
-1 -1 -1 -5 -1 -1 -3 -3 -2 -3
4 2 * 2 2 3 4 3 4 1 2
-4
3
-1
4
2 2 2 2 1 1
1
1 2 2 2 2 1 2 1 2 2 1 1 1 1
1 2
1 1 1 2 1 1 2 2
2660 18 440 58 607 2258 507 564 638 232 2261 59 1516 871 2799 180 753 694 584 195 506 154 47 884 1121 1776 67 648 1156 698 1725 2948 901 2087 1894 707 1463 2089 2625 2421 3439 2729 1751 580 1315 2561 2320 3268 3641 1631 2112 3158 4011 264 1447 1116 1905 353 1591 2378 2889 1460 2811 1336 2925 1757 592 3908 2017 1901
규칙 그 그 그것 그냥 그늘 그대로 그래 그래도 그래서 그래요 그러나 그러니 그러니까 그러다 그러다 그러면 그러므로 그러하다 그런데 그럼 그렇게 그렇다 그렇다 그렇지만 그릇 그리고 그리다 그리하다 그림 그림자 그립다 그만 그만두다 그만큼 그저 그치다 극 극장 근로자 근무 근본 근처(近處) 글 글쎄 글씨 글자 긁다 금년 금방 급하다 급히 긋다 기 기계 기관 기구 기다리다 기대 기도 기둥 기록 기록하다 기르다 기름 기본 기분 기뻐하다 기쁘다 기쁨
이름씨 대이름씨 매김씨 대이름씨 어찌씨 이름씨 어찌씨 느낌씨 어찌씨 어찌씨 느낌씨 어찌씨 어찌씨 어찌씨 어찌씨 움직씨 어찌씨 어찌씨 그림씨 어찌씨 느낌씨 어찌씨 그림씨 움직씨 어찌씨 이름씨 어찌씨 움직씨 움직씨 이름씨 이름씨 그림씨 어찌씨 움직씨 어찌씨 어찌씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 느낌씨 이름씨 이름씨 움직씨 이름씨 어찌씨 그림씨 어찌씨 움직씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 움직씨 그림씨 이름씨
1419 405215 11081 67895 7814 1774 9641 8672 7414 18637 1771 67427 2821 5387 1330 23040 6136 6741 8246 21670 9656 26458 81129 5306 4040 2360 57683 7251 3857 6718 2454 1250 5178 1950 2196 6617 2938 1947 1444 1612 1028 1368 2405 8312 3305 1492 1715 1101 949 2635 1910 1151 829 16733 2973 4095 2177 13237 2704 1657 1279 2942 1322 3246 1263 2397 8053 861 2024 2184
66 9300 5401 2678 251 54 394 300 231 960 38 2812 119 189 32 179 262 303 377 875 191 654 2776 2776 186 86 2159 325 179 404 96 76 198 53 2 197 104 255 69 9 35 75 100 412 54 53 93 26 33 91 45 36 29 7129 244 121 92 9 114 356 61 211 39 106 57 124 210 56 143 140
9 68 67 14 0 9 1 26 5 19 3 37 3 9 0 1 5 5 1 27 4 3 13 1 8 2 75 70 0 74 52 0 5 1 1 0 1 2 0 0 0 0 1 35 0 16 3 0 0 1 2 2 3 5 7 0 2 14 0 0 2 8 0 20 1 0 2 13 18 0
- 61 -
0 0 4549 1111 101 85 345 399 85 0 0 1358 121 0 0 3317 0 390 734 0 81 0 0 0 0 102 0 0 444 218 100 100 221 0 0 118 91 0 0 210 0 200 0 227 128 0 86 0 0 0 112 102 0 0 533 0 0 358 135 0 0 96 0 164 163 545 271 0 213 156
0 0 45 15 0 0 2 7 4 12 7 12 1 1 6 8 9 0 0 14 0 0 0 0 1 0 20 16 0 22 0 0 5 1 0 8 2 1 4 0 4 0 3 0 20 0 5 1 1 0 1 0 0 0 0 1 0 16 0 1 0 2 1 0 1 0 5 0 2 2
0 1 2 2
-3 -2 -7 -7 -5 -2 -1 -4 -2 -6
3 1 1 1 2 2 3 2 3 1
-2
1
-3 -1
1 3
-5
1
-1 -4 -6 -6
2 2 1 1
2 2 2
-4 -5 -4 -8
1 2 1 2
2 1 1 1 2
-7 -2 -4 -3 -6
1 4 3 2 2
1 0
-3 -2
4 2
2
-6 -2
1 3
1
-2 -2 -5 -3 -2 -4 -3 -4 -3 -1
3 2 2 2 4 1 2 2 3 *
1
-2
2
2
-7 -2 -1 -1 -2
1 3 4 * 4
-4 -4 -1 -7 -1 -5 -1
3 2 4 2 2 2 4
1 1 1 1 2 1 0 1 2 1 1 2 0 2
1 2 2 1 2 0 1 0 1 0
1 1 0 1 2 2 2 2
3614 869 1123 1904 1845 1247 1935 1798 3800 2313 1012 2678 152 3731 574 1849 2490 136 4469 3392 4536 601 1643 4493 4110 857 94 1305 3635 1826 2880 2477 2365 2435 3088 2008 1432 1165 4071 3041 3993 841 2679 2878 3656 1000 1017 1963 2564 3124 518 1162 3687 690 2286 2149 4450 2059 646 2553 2277 2566 1541 3465 2951 701 3642 2578 3532 3401
기세 기술 기억 기운 기울이다 기자 기차 기초 기침 기호 기회 긴장 길 길가 길다 길이 김 김 김치 깃 깃발 깊다 깊이 깊이 까다 까닭 까지 까지는 까지만 까지의 깎다 깔다 깔리다 깜짝 깨끗이 깨끗하다 깨다 깨닫다 깨물다 깨어나다 깨우다 꺼내다 꺼지다 꺾다 껍질 께 께서 께서는 꼬리 꼬마 꼭 꼴 꽂다 꽃 꽉 꾸다 꾸리다 꾸미다 꿈 끄다 끄덕이다 끈 끊다 끊어지다 끊임없이 끌다 끌려가다 끌리다 끓다 끓이다
이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 이름씨 매인이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 어찌씨 이름씨 움직씨 이름씨 토씨 토씨 토씨 토씨 움직씨 움직씨 움직씨 어찌씨 어찌씨 그림씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 이름씨 토씨 토씨 토씨 이름씨 이름씨 어찌씨 이름씨 움직씨 이름씨 어찌씨 움직씨 움직씨 움직씨 이름씨 움직씨 움직씨 이름씨 움직씨 움직씨 어찌씨 움직씨 움직씨 움직씨 움직씨 움직씨
959 5395 4024 2179 2259 3528 2129 2332 893 1719 4571 1408 26820 916 8441 2252 1545 30164 721 1044 705 7860 2616 716 803 5470 44084 3330 951 2292 1286 1554 1669 1595 1176 2035 3006 3833 813 1199 833 5559 1408 1287 943 4615 4537 2087 1490 1163 9487 3838 931 6785 1747 1873 726 1979 7254 1498 1755 1489 2789 1018 1248 6672 949 1483 990 1041
10 272 271 64 120 49 52 117 31 29 188 65 974 28 354 70 24 239 35 42 24 365 133 27 18 151 1681 126 42 110 38 96 68 72 84 80 121 197 24 45 27 221 53 65 47 169 155 54 75 45 318 80 40 302 51 83 34 78 392 27 62 28 85 36 14 215 19 41 38 57
0 0 0 2 2 0 16 1 4 0 0 0 67 5 19 64 4 2 0 1 1 0 1 0 1 5 20 1 1 8 2 3 1 8 10 7 1 0 1 0 2 6 1 3 1 23 38 31 4 11 23 0 1 31 2 1 0 4 2 4 2 4 1 2 0 4 5 1 1 0
- 62 -
0 937 154 0 0 111 0 521 0 0 93 224 0 0 311 0 0 0 0 0 0 716 332 116 116 96 0 0 0 0 0 83 0 0 0 122 127 153 0 0 0 312 0 112 80 0 0 0 86 0 332 94 0 499 92 0 394 0 250 213 0 0 97 0 318 460 0 0 213 0
2 0 1 1 0 0 2 0 1 2 2 0 17 1 2 0 0 0 2 0 0 4 0 0 0 0 19 0 0 0 0 0 0 2 0 1 0 0 1 1 0 1 0 0 0 5 6 0 1 0 6 0 0 7 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1
2 1 1
-3 -3 -1 -2 -3 -7 -1 -5 -2 -5 -1 -6
3 3 4 4 3 1 4 2 4 2 4 1
2 0 0 0 2 0 1 2
-5 -2
1 3
-7 -1
1 *
-3
2
1 1
-1 -2 -3
3 3 1
2 1
-6 -1 -1 -2 -3 -6 -3 -3 -1
2 2 * 2 2 1 3 4 4
-5 -4 -1 -2 -3 -5 -2
3 3 4 3 2 1 1
-3 -1 -6
3 3 2
-1 -7 -2 -4 -1 -3 -3 -6 -2
2 1 3 2 4 4 2 1 3
-4 -1
2 2
1
-3
3
1 0
-1 -4 -4
4 2 2
1 2 1 1 1 2
1 2 1 1
1
1 2 1 1 2 0 1 1 2 2 0 1 2 1
410 561 2114 1653 930 3979 2626 33 1110 117 194 673 126 205 2340 3076 4371 1435 529 3119 1074 557 1492 105 706 1283 310 847 2968 133 2600 2113 2288 2166 2721 3823 4238 2373 2300 251 1206 399 3429 373 2849 535 4030 1582 1488 3034 3525 990 76 79 3271 1574 142 2409 4392 997 3962 2242 926 295 1383 1927 2179 521 908 877
끝 끝나다 끝내 끝내다 끼다 끼우다 끼치다 나 나 나 나가다 나누다 나다 나라 나란히 나르다 나리 나머지 나무 나비 나쁘다 나서다 나아가다 나오다 나이 나중 나타나다 나타내다 낙 날 날개 날다 날리다 날씨 날아가다 날아오다 날짜 날카롭다 낡다 남 남기다 남다 남북(南北) 남자 남쪽 남편 낫다 낮 낮다 낯 낱말 낳다 내 내 내년 내놓다 내다 내다보다 내던지다 내려가다 내려놓다 내려다보다 내려오다 내리다 내밀다 내부 내세우다 내용 내일 냄새
이름씨 움직씨 어찌씨 움직씨 움직씨 움직씨 움직씨 대이름씨 이름씨 토씨 움직씨 움직씨 움직씨 이름씨 어찌씨 움직씨 이름씨 이름씨 이름씨 이름씨 그림씨 움직씨 움직씨 움직씨 이름씨 이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 움직씨 움직씨 이름씨 그림씨 그림씨 이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 그림씨 이름씨 이름씨 움직씨 대이름씨 이름씨 이름씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 이름씨 움직씨 이름씨 이름씨 이름씨
11834 8689 1909 2608 4995 838 1444 137244 4132 34922 21763 6979 32749 20850 1699 1182 743 2997 9234 1166 4261 8809 2876 37597 6627 3423 14412 5529 1241 30420 1464 1909 1746 1860 1374 885 774 1661 1736 17463 3694 12107 1032 12736 1298 9095 823 2718 2884 1202 992 4656 52091 50648 1100 2727 28431 1627 738 4639 843 1789 5012 15061 3097 2140 1847 9396 5123 5367
398 367 77 77 139 42 40 6388 1020 1378 686 274 1020 696 53 36 38 130 562 64 164 305 137 1231 267 156 602 230 25 794 124 794 52 91 70 42 38 73 103 440 201 440 53 458 69 313 68 151 151 22 22 224 1487 1034 19 66 718 3 29 135 22 58 129 599 121 126 83 319 118 178
17 17 1 1 4 1 0 138 14 49 29 32 62 86 3 17 2 0 78 2 12 10 0 47 11 1 7 22 0 91 29 11 5 20 33 4 1 1 1 7 1 12 1 9 10 0 1 4 8 1 10 7 59 6 2 3 66 1 1 16 1 1 7 30 3 7 0 5 3 0
- 63 -
0 264 0 163 123 0 0 2550 0 0 1565 231 1794 3194 0 89 0 83 927 0 116 905 84 1491 197 0 442 165 0 0 0 123 0 0 0 0 97 205 0 136 368 0 135 0 201 0 145 180 135 0 173 1424 0 0 296 0 110 0 195 0 0 122 871 189 117 146 352 0 166
0 4 0 0 1 0 1 0 0 0 8 0 10 11 0 0 0 0 5 4 1 0 0 10 3 0 0 1 2 0 0 0 0 13 0 0 0 0 1 0 2 6 0 0 0 2 0 11 1 0 2 3 0 0 2 1 8 0 1 2 0 0 0 7 1 0 0 0 15 0
2
-2 -7
1 1
-5 -4
2 2
-1
3
-6
1
-8 -2 -4 -7 -1 -1
1 3 2 1 * 4
-3 -5 -1 -8 -2
3 1 2 1 2
-7 -5
1 1
-2
2
-1 -5
4 2
-2 -1 -6 -2
2 4 1 2
-2 -1 -1 -4 -4 -6
2 4 4 3 2 2
-8 -4 -7 -5 -5 -4 -2 -1 -2 -1 -6 -6 -1 -6 -1
1 1 1 2 1 1 4 2 3 1 1 1 3 1 3
-1
2
2 0
-1 -8 -1
2 1 4
1 2 2
-6 -8 -5
4 1 2
0 0 1 2
2 2 2 1 1 0 1 2 1 2 1 0 2 2
2 1 2
1 1
1 2 0 2 1 1 2
2 2 2 0 2 0 0
0
291 375 1255 2515 1033 1499 651 2001 3455 2676 547 966 4409 88 640 4528 1103 1527 623 2717 1700 909 618 2666 2131 430 4633 1402 3411 2155 3094 1820 591 2111 3791 2405 170 1100 596 243 1230 4597 1615 2914 100 1454 632 1166 752 1069 253 6 870 979 2369 3805 3646 906 1192 3728 132 511 365 2116 1222 2525 446 4169 118 652
너 너무 너희 널리 넓다 넘기다 넘다 넘어가다 넘어지다 넘치다 넣다 네 네 년 노래 노래하다 노력 노릇 노인 녹다 논 놀다 놀라다 놀리다 놀이 놈 농가 농민 농부 농사 농업 농촌 높다 높이 높이 높이다 놓다 놓이다 누 누구 누나 누렇다 누르다(壓) 누이 눈 눈길 눈물 눈치 눕다 느껴지다 느끼다 는 늘 늘다 늘어나다 늘어놓다 늙은이 능력 늦다 늦다 다 다 다 다가가다 다가오다 다녀오다 다니다 다람쥐 다르다 다리
대이름씨 어찌씨 대이름씨 어찌씨 그림씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 대이름씨 셈씨 매인이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 어찌씨 이름씨 움직씨 움직씨 움직씨 대이름씨 대이름씨 이름씨 그림씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 움직씨 토씨 어찌씨 움직씨 움직씨 움직씨 이름씨 이름씨 그림씨 움직씨 어찌씨 이름씨 토씨 움직씨 움직씨 움직씨 움직씨 이름씨 그림씨 이름씨
15234 12675 3518 1522 4450 2865 7187 2047 1022 1409 8877 4798 735 7385 707 4151 2808 7609 1383 2500 5120 7635 1415 1894 11291 685 3070 1037 1868 1173 2307 8058 1911 896 1629 24247 4171 7972 17751 3610 691 2671 1266 39309 2958 7501 3832 6161 4277 17346 1142681 5393 4744 1664 892 946 5158 3745 917 30429 9577 12933 1906 3629 1515 10905 788 34892 7187
596 434 75 60 211 101 260 69 41 71 493 314 179 1821 395 49 219 99 290 54 94 238 262 44 119 229 19 135 138 62 62 90 386 91 65 91 903 179 47 712 122 28 77 28 1198 64 264 87 203 5 785 30654 353 353 44 12 27 172 42 104 44003 155 1018 56 123 36 474 24 1616 314
38 5 12 0 14 3 1 0 7 0 203 18 1 18 25 2 1 1 1 0 28 67 13 1 10 4 1 0 1 15 0 1 14 10 2 0 58 4 10 24 8 2 8 0 13 0 3 0 2 1 5 807 1 0 2 3 0 0 1 4 33 11 2 0 5 2 14 24 43 18
- 64 -
483 164 0 163 286 113 319 99 0 280 0 0 0 497 0 226 0 0 86 119 181 352 0 0 0 0 430 0 223 213 326 971 305 142 638 1652 140 199 1282 0 0 126 0 0 174 98 89 159 0 601 298 0 186 0 120 246 0 0 0 0 0 133 196 0 490 0 1254 0
4 9 2 0 1 0 1 0 1 0 0 0 0 0 0 0 0 0 5 0 1 6 0 0 2 0 0 0 0 0 0 0 4 0 0 0 4 0 0 17 0 2 0 2 12 0 1 2 1 0 0 0 3 1 0 0 0 0 0 0 0 0 0 0 0 4 10 1 15 2
2 2 1
-4 -7 -1 -1 -8 -1 -3 -2 -5 -1 -7 -1 -2 -7 -7
1 1 1 4 1 4 3 3 2 4 1 1 2 1 1
-2 -1 -2 -2 -2 -8 -4 -2 -2 -1 -1
2 * 4 2 4 1 2 3 2 3 *
-3 -2
3 3
-3 -7 -3
3 1 2
-7 -3
2 3
-8 -6 -2
1 1 3
-8
1
1 0
-3 -2 -4
2 3 2
2
-3
2
-3 -3 -1 -1
3 3 3 4
-3 -6 -1
3 1 2
-5
1
-2 -2 -5
2 3 1
-7 -4
1 1
2 2 1 2 2 2 1 2 1 2
1
2
0 2
2 2 0 0
0 0 2 2
1 2 0 2
1705 1301 108 3584 2476 203 4680 2731 3341 1367 2816 1564 931 3911 1906 1411 2127 3557 649 1190 3251 1506 2410 1762 2998 2393 661 2057 2501 2422 1149 1590 3309 724 2861 4677 2579 628 343 1285 645 467 1937 710 2554 1053 1034 644 1361 524 1353 891 3694 2270 1720 2837 943 1662 72 545 3765 1489 1233 864 109 1280 2247 2198 3025 403
다방 다섯 다시 다시금 다양하다 다음 다지다 다치다 다투다 다하다 다행 닦다 단 단단하다 단위 단체 닫다 닫히다 달 달다 달라다 달라지다 달래다 달려가다 달려들다 달려오다 달리다 달아나다 닭 닮다 담 담다 담당 담배 답 답하다 당기다 당시 당신 닿다 대 대 대개 대다 대단히 대답 대답하다 대로 대로 대로 대문 대신 대원 대장 대중 대책 대통령 대표 대하다 대학 대한 대화 대회 댁 더 더구나 더러 더럽다 더우기 더욱
이름씨 셈씨 어찌씨 어찌씨 그림씨 이름씨 움직씨 움직씨 움직씨 움직씨 이름씨 움직씨 이름씨 그림씨 이름씨 이름씨 움직씨 움직씨 이름씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 이름씨 움직씨 이름씨 움직씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 대이름씨 움직씨 매인이름씨 이름씨 어찌씨 움직씨 어찌씨 이름씨 움직씨 매인이름씨 이름씨 토씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 어찌씨 어찌씨 토씨 그림씨 어찌씨 어찌씨
2493 3348 37406 972 1555 20992 675 1367 1069 3149 1320 2745 4982 860 2177 3054 1898 982 7204 3751 1107 2854 1623 2389 1226 1642 7108 1985 1532 1611 3899 2708 1083 6354 1293 676 1482 7526 13682 3416 7273 10423 2128 6592 1496 4369 4444 7304 3165 9328 3200 5231 929 1762 2464 1306 4928 2583 52735 8915 905 2883 3588 5425 36880 3433 1788 1834 1211 12000
25 70 1387 31 74 1009 25 43 42 117 43 210 111 15 78 68 57 38 193 193 146 65 84 77 32 31 334 71 67 65 121 121 42 120 46 9 59 422 557 121 231 334 68 334 123 233 129 181 71 353 101 203 8 33 111 25 186 80 2651 453 17 158 39 87 1614 111 57 102 35 475
0 5 39 0 0 270 0 9 3 4 0 1 19 1 18 0 1 1 15 12 1 4 1 8 1 7 24 11 4 4 7 3 0 1 6 1 3 0 1 11 9 9 3 7 1 2 10 1 1 12 6 2 1 1 0 0 3 0 52 1 5 0 3 10 40 2 1 2 0 13
- 65 -
0 0 1190 82 95 113 130 0 132 0 136 0 0 197 131 0 0 0 0 0 81 0 0 0 89 0 178 88 0 0 187 119 181 0 0 106 106 0 126 104 0 0 0 0 366 0 612 0 0 0 123 0 0 569 194 98 103 2741 231 0 0 106 0 0 0 0 0 106 1175
14 0 8 0 0 0 0 0 0 0 2 1 0 0 22 0 2 0 2 0 0 0 0 0 0 1 3 0 0 1 0 0 0 2 0 0 0 1 0 0 0 0 0 0 7 0 2 0 0 0 0 0 0 0 0 0 1 0 1 5 0 4 2 0 0 0 0 0 0 0
1 2 2
-5 -6 -6
1 1 1
-3 -8 -2 -4 -4
3 1 3 2 3
-1 -6 -1 -1
4 2 4 *
-2 -6 -5 -6 -5 -2 -1 -2
4 1 3 1 1 2 2 4
-1 -3 -1 -2 -3 -1 -5 -2 -8 -1 -1 -4 -1 -5 -1 -1 -3 -3 -1 -1 -1 -6
2 2 2 1 2 * 2 4 1 2 3 2 3 2 4 3 2 4 2 1 2 1
-2
3
-2 -4
3 2
-3 -1 -3 -4 -2 -2
4 * 3 3 3 1
-5 -3 -7 -7 -2
2 3 1 1 3
2
-5
1
1
-4
2
2 1 0 1 2 1 1 2 1 2 1 0 0
2 1 2 1 1 1
1 0 1 1 0 1 0 2
1
1 1 1 1 2
2 2
4657 2612 3489 907 2681 2892 1827 3700 1761 4779 920 400 21 2533 1610 2555 1478 3852 4459 2213 2035 3831 744 1417 4245 1829 1765 1502 3672 212 581 634 582 2875 464 2615 4755 1731 1911 372 1062 286 759 2054 1436 1045 732 693 2167 2658 4295 4157 4087 2401 28 2291 3697 112 2043 252 2474 3798 2285 633 2827 3133 4283 1270 3741 175
더위 더하다 덕분 던지다 덜 덥다 덮다 덮이다 데 데려가다 데리다 도 도 도구 도덕 도둑 도로 도망 도망가다 도망치다 도무지 도서관 도시 도움 도장 도착하다 독 독립 독서 돈 돌 돌다 돌리다 돌보다 돌아가다 돌아다니다 돌아다보다 돌아보다 돌아서다 돌아오다 돕다 동 동네 동무 동물 동생 동시 동안 동양 동작 동쪽(東-) 동포 동화 돼지 되다 되도록 되찾다 두 두 두다 두드리다 두들기다 두르다 둘 둘러보다 둘러싸다 둘레 둘째 둥글다 뒤
이름씨 움직씨 이름씨 움직씨 어찌씨 그림씨 움직씨 움직씨 이름씨 움직씨 움직씨 이름씨 토씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 어찌씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 어찌씨 움직씨 매김씨 셈씨 움직씨 움직씨 움직씨 움직씨 셈씨 움직씨 움직씨 이름씨 셈씨 그림씨 이름씨
680 1454 1008 5156 1407 1278 2292 927 2391 656 5055 12070 267509 1507 2679 1496 2899 880 724 1819 2001 884 6191 3043 773 2288 2385 2860 935 20372 8263 7465 8253 1288 10482 1452 661 2438 2170 12799 4312 15577 6096 1988 2995 4396 6278 6743 1859 1421 763 792 810 1631 166949 1744 928 36699 1997 17404 1556 894 1749 7476 1315 1160 765 3459 914 23639
13 68 54 176 46 74 121 53 887 29 181 179 10391 106 89 56 110 13 26 40 41 25 342 164 17 56 70 170 19 644 276 276 271 69 287 54 66 66 49 443 212 213 152 68 185 123 58 840 109 57 42 52 60 28 5797 19 37 1352 490 1352 94 27 55 299 60 35 31 111 45 948
1 15 1 8 0 6 1 2 34 3 15 5 354 1 0 3 2 2 9 2 1 0 0 6 1 0 0 4 0 34 12 8 4 2 11 4 1 4 2 34 38 4 33 24 17 37 1 14 0 0 9 4 1 10 185 1 3 39 13 31 1 1 4 12 1 2 6 4 3 27
- 66 -
0 0 0 194 0 0 176 0 0 0 182 0 0 81 0 90 0 0 0 0 0 262 95 0 0 0 176 0 172 115 487 718 0 317 0 0 274 156 330 134 0 82 1598 0 160 0 0 0 96 0 0 0 94 0 0 0 1613 0 92 0 90 192 0 0 0 0 0 0
0 0 2 0 1 11 1 0 0 0 2 0 0 0 0 1 0 0 0 0 0 4 1 0 0 4 4 0 1 6 1 4 3 1 6 0 0 1 0 15 3 0 0 0 0 7 0 0 1 0 0 2 0 3 0 0 0 2 0 3 1 0 0 14 1 0 0 0 0 0
0 1 1 2 2 1
2
-3 -1 -1 -2 -4 -6 -2
3 4 3 2 1 1 3
-5 -1 -3 -1 -1
1 * 3 1 4
-5 -2
2 2
-1 -1 -3 -7 -6 -4 -5 -7 -1 -1 -4 -7 -1 -3 -3 -2 -5 -1
2 * 4 1 2 3 3 1 * 3 3 1 1 2 2 3 1 3
-5 -7 -1 -4
1 1 2 2
-3 -8 -1 -6 -1 -3
3 1 4 1 3 4
-2 -7
2 1
-7 -4 -2
1 2 2
-3 -2
1 3
-1
4
-8
1
1 1 1
1 1 1 2 1 1
2 0 2 2 2 1 0 2
0 2 1 1 1 1 2 1 2
1 1 1 2 2
2 2 0 1 0 1 0
1
1692 1403 1009 269 896 4301 66 1965 388 222 741 341 1870 1231 3092 231 182 957 1843 2621 374 2956 1693 163 1278 3634 1939 700 1282 439 68 1637 3832 2058 1511 74 351 3272 2466 970 2471 955 3504 444 3946 1384 91 391 2696 370 2081 3273 4735 3927 2294 4622 2491 4671 671 4368 2606 1604 541 2398 3214 383 2265 3659 4763 1825
드디어 드러나다 드리다 듣다 들 들 들다 들르다 들리다 들어가다 들어서다 들어오다 들여다보다 들이다 들판 등 등 따다 따뜻하다 따라가다 따라서 따라오다 따로 따르다 따지다 딱하다 딴 딸 땀 땅 때 때다 때때로 때로는 때리다 때문 떠나다 떠돌다 떠들다 떠오르다 떡 떨다 떨어뜨리다 떨어지다 떨치다 떼다 또 또는 또다시 또한 똑같다 똑같이 똑똑하다 똑바로 뚜렷하다 뚝 뚫다 뚫리다 뛰다 뛰어가다 뛰어들다 뜨겁다 뜨다 뜯다 뜰 뜻 뜻밖 띄우다 띠 띠다
어찌씨 움직씨 움직씨 움직씨 이름씨 토씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 이름씨 매인이름씨 이름씨 움직씨 그림씨 움직씨 어찌씨 움직씨 어찌씨 움직씨 움직씨 그림씨 매김씨 이름씨 이름씨 이름씨 이름씨 움직씨 어찌씨 어찌씨 움직씨 매인이름씨 움직씨 움직씨 움직씨 움직씨 이름씨 움직씨 움직씨 움직씨 움직씨 움직씨 어찌씨 어찌씨 어찌씨 어찌씨 그림씨 어찌씨 그림씨 어찌씨 그림씨 어찌씨 움직씨 움직씨 움직씨 움직씨 움직씨 그림씨 움직씨 움직씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨
2525 3068 4588 16353 5219 329206 58141 2086 12360 19681 6205 13771 2223 3595 1174 18681 22856 4838 2265 1449 12722 1246 2525 25391 3444 952 2125 6682 3428 11084 55417 2625 884 1981 2838 52266 13275 1099 1564 4781 1560 4856 999 10971 849 3096 45002 12257 1400 12830 1953 1099 664 855 1740 687 1544 678 6992 744 1461 2692 8963 1634 1124 12436 1766 942 659 2294
88 90 170 696 14009 1965 14009 33 433 641 152 320 70 103 60 453 919 122 124 52 541 26 84 1039 124 23 60 204 119 495 2435 2435 53 15 129 2734 512 31 63 179 41 182 42 466 39 101 1880 453 47 597 134 25 16 44 61 20 62 24 194 21 45 112 247 61 32 606 32 28 75 75
1 0 20 65 410 2 55 1 9 24 5 20 2 11 3 0 12 13 7 4 4 5 2 7 0 1 3 0 6 9 161 1 0 2 3 5 3 0 0 4 2 2 6 22 0 2 132 10 0 0 10 4 4 0 2 0 0 1 26 16 1 0 31 2 2 2 0 3 1 1
- 67 -
0 117 272 596 0 0 0 0 778 359 417 138 289 0 767 0 0 111 87 202 0 0 0 84 0 0 323 216 747 2371 0 0 0 117 0 702 143 0 214 0 0 0 394 150 128 1330 157 229 738 0 0 0 92 101 0 182 0 304 0 0 309 0 103 0 399 82 0 0 118
0 0 5 20 0 0 11 0 5 10 0 6 0 1 0 0 0 0 7 1 0 0 3 0 0 0 0 2 2 0 0 0 1 0 0 24 9 0 1 0 0 2 0 3 0 0 26 0 0 0 0 0 0 0 0 1 0 0 3 0 0 0 0 0 0 5 0 0 4 0
-2
3
0
-7 -7 -5 -2 -4 -5 -4 -6 -1 -6 -1
1 1 1 3 1 2 2 1 3 1 3
0 1 2 1 2
-2 -1 -1 -3 -6
4 3 2 3 1
1
-1
4
2 0 0 1 2
-1 -4 -2 -2 -2 -6 -2 -3 -5 -1
2 3 4 * 4 1 2 3 1 *
-1
4
-5 -1 -2 -1 -6 -1 -2 -5 -1 -2 -6 -1
1 4 2 4 2 4 2 2 4 4 1 4
-1 -5 -1 -3 -4 -2 -1 -1 -1 -1 -2
4 2 3 2 1 4 4 4 * 2 2
-5 -3
1 1
2
-2 -4
3 2
0 1 1
-1
4
2 2 2 1 1
1 2
1 2 1 2
2 1 2 1 2 1 1
1 1
0 2
2 1 1
202 959 362 415 603 2915 1406 16 350 352 225 387 1 565 2204 360 1213 2085 1306 3674 1385 1546 1523 1455 563 448 149 2777 1359 2375 819 812 610 1481 1597 1148 1496 1272 4786 1127 1548 246 64 218 3122 176 2969 4233 3576 2604 798 735 585 4547 2370 495 123 342 43 166 2027 665 2985 2106 71 1464 1159 398 3370 1335
라 라 라고 라는 라도 라디오 랑 로 로는 로부터 로서 로써 를 마 마누라 마다 마당 마디 마련 마련되다 마련하다 마루 마르다 마리 마시다 마을 마음 마음대로 마저 마주 마지막 마찬가지 마치 마치다 마침 마침내 막 막 막걸리 막다 막히다 만 만(only) 만나다 만도 만들다 만들어지다 만세 만원 만으로 만은 만을 만이 만족 만지다 만큼 많다 많이 말 말다 말리다 말씀 말씀드리다 말씀하다 말하다 맑다 맛 맞다 맞이하다 맞추다
이름씨 토씨 토씨 토씨 토씨 이름씨 토씨 토씨 토씨 토씨 토씨 토씨 토씨 이름씨 이름씨 토씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 움직씨 이름씨 움직씨 이름씨 이름씨 어찌씨 토씨 어찌씨 이름씨 이름씨 어찌씨 움직씨 어찌씨 어찌씨 어찌씨 이름씨 이름씨 움직씨 움직씨 셈씨 토씨 움직씨 토씨 움직씨 움직씨 이름씨 이름씨 토씨 토씨 토씨 토씨 이름씨 움직씨 매인이름씨 그림씨 어찌씨 이름씨 움직씨 움직씨 이름씨 움직씨 움직씨 움직씨 그림씨 이름씨 움직씨 움직씨 움직씨
21009 4822 12969 11683 7858 1266 3064 478004 13348 13255 19274 12362 1729667 8664 1825 13003 3676 1951 3330 934 3096 2779 2814 2958 8684 10816 27202 1344 3169 1659 5718 5761 7772 2894 2700 3904 2872 3454 655 4022 2776 17633 61993 19833 1164 23621 1241 775 976 1462 5824 6256 8212 703 1664 9835 33779 13696 96304 24708 2009 7063 1231 1918 53041 2938 3845 12132 1056 3248
2699 174 1566 2086 237 54 80 8159 207 423 409 124 25212 113 24 558 229 57 142 31 92 76 151 261 293 367 1139 3 120 37 264 278 353 353 73 196 99 184 8 184 91 1948 350 668 25 1380 64 17 20 77 202 262 368 66 59 258 1741 606 3643 3643 79 263 26 63 1725 151 150 478 50 124
3 1 27 1 1 8 2 197 2 2 1 0 1295 2 0 9 21 1 0 1 2 2 3 56 3 81 15 2 1 1 0 0 1 8 4 0 5 9 0 11 1 0 21 13 2 118 3 3 0 2 1 3 2 0 3 7 87 49 90 19 4 44 1 30 98 4 8 17 3 11
- 68 -
0 0 0 0 0 0 0 0 0 0 0 0 121 0 0 0 459 0 0 0 0 0 117 470 1227 0 0 115 241 174 232 100 0 122 0 0 0 292 109 0 0 594 0 973 0 0 0 0 0 0 0 113 0 177 1472 494 0 0 152 0 0 1159 134 138 971 144 119
0 0 0 0 0 2 0 10 0 0 0 1 167 0 0 0 0 0 0 0 0 0 1 4 8 3 7 0 0 0 0 0 0 0 0 1 0 0 1 0 0 3 21 12 0 0 0 3 1 0 0 0 0 0 0 3 63 7 0 6 0 0 0 0 5 1 3 0 0 0
2
-4
2
-3 -4 -1 -1
1 3 3 *
1 2
-4 -2 -3 -7 -8 -1 -8 -4 -3 -1 -3 -3 -1 -3 -4 -2 -2 -3 -3 -1 -5 -3
3 2 1 1 1 3 2 2 4 4 1 3 4 2 2 2 4 3 3 4 2 1
2
-8
1
2
-7
1
1 1
-1 -1
3 3
0 2
-2 -1 -2 -7 -6 -2 -5 -2 -2 -2 -4 -6 -6 -4 -7 -1 -2
4 2 3 1 1 1 1 2 1 1 1 1 2 1 2 4 3
0 2 0
1 1 1 2 2 1 2 1 0 2 1 1 1 1 0
2
2 1 2
2 1 2 2 0 1
1835 917 1475 4406 1891 936 2040 2305 1795 282 4172 2480 165 4148 2142 445 2372 779 1446 1184 2434 3638 1001 642 2457 3229 386 528 1640 197 4218 767 4143 241 674 179 2560 87 2399 270 1485 285 3582 977 897 2910 2259 3529 4206 4228 560 583 1737 4098 717 1322 2620 1457 2637 4437 186 1191 215 4354 2312 187 1405 2662 2327 2022
맡기다 맡다 매다 매달다 매달리다 매우 매일 맨 맺다 머리 머리카락 머무르다 먹다 먹이 먹이다 먼저 먼지 멀다 멀리 멈추다 메다 메우다 며칠 면 면 면적 명 명 명령 몇 몇 모 모금 모두 모두 모든 모래 모르다 모순 모습 모시다 모양 모여들다 모으다 모이다 모임 모자 모조리 모처럼 모퉁이 목 목소리 목숨 목욕 목적 목표 몫 몰다 몰래 몰려오다 몸 몹시 못 못 못하다 못하다 무겁다 무게 무기 무너지다
움직씨 움직씨 움직씨 움직씨 움직씨 어찌씨 어찌씨 매김씨 움직씨 이름씨 이름씨 움직씨 움직씨 이름씨 움직씨 어찌씨 이름씨 그림씨 어찌씨 움직씨 움직씨 움직씨 이름씨 이름씨 토씨 이름씨 매인이름씨 이름씨 이름씨 매김씨 이름씨 이름씨 이름씨 어찌씨 이름씨 매김씨 이름씨 움직씨 이름씨 이름씨 움직씨 이름씨 움직씨 움직씨 움직씨 이름씨 이름씨 어찌씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 어찌씨 움직씨 이름씨 어찌씨 어찌씨 이름씨 그림씨 움직씨 그림씨 이름씨 이름씨 움직씨
2283 5092 2909 736 2198 4967 1998 1733 2343 15630 788 1550 24796 793 1881 10939 1663 5940 2975 3773 1597 950 4615 7348 1574 1118 12386 9244 2620 21490 778 6048 794 17835 6978 23177 1493 47150 1633 16324 2889 15580 973 4756 5217 1267 1774 991 781 776 8691 8248 2424 807 6443 3292 1450 2955 1436 730 22616 3751 20167 748 1720 22513 3066 1419 1710 2015
87 163 125 19 96 355 75 74 103 591 35 72 1145 95 95 409 80 112 154 169 57 45 117 5370 195 26 380 53 105 892 21 104 26 682 321 916 54 1515 91 619 72 441 35 212 188 28 62 32 26 31 241 247 77 76 206 116 58 115 69 16 646 119 573 27 57 1692 125 58 69 104
0 3 4 3 0 13 1 4 2 12 1 2 104 18 3 41 0 9 2 6 5 1 16 15 1 0 0 20 0 122 6 11 2 94 19 6 2 17 2 12 8 66 2 25 29 0 20 2 1 1 1 12 3 2 0 0 13 2 11 1 9 2 20 1 6 13 3 7 3 3
- 69 -
84 247 0 0 90 353 0 0 184 1026 0 0 898 0 0 420 103 295 0 259 0 0 226 0 0 93 122 0 172 0 0 0 0 1251 0 1199 0 356 228 0 0 108 230 198 0 0 0 0 0 529 94 0 236 230 0 97 0 0 747 263 1516 0 0 984 213 0 0 0
1 0 0 0 0 0 0 0 0 1 0 0 19 0 0 1 0 4 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 9 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 2 1 1 0 0 0 0 0 0 0
1 1 1 0 1
1 2 0 1 2 1 2 2 1 1 0 2 0
-4 -3 -6 -1 -1 -3 -3 -2 -1 -7 -3 -1 -8 -1 -3 -5 -3 -6 -1 -3 -2 -1 -7 -1 -1 -1 -1 -5
2 2 2 4 * 1 1 4 * 1 2 4 1 * 2 1 3 1 2 2 3 3 1 4 4 4 * 1
-7 -1 -1
1 4 *
-4 -2 -3 -8 -1 -1 -4 -5
1 3 3 1 * 3 2 2
-6 -4 -4 -5 -1 -1 -2 -5 -5 -3 -1 -1 -2 -2 -1 -2
2 2 2 1 4 4 4 1 2 4 2 4 4 4 2 3
-6 -3 -1 -5 -3
1 1 4 1 1
-6 -2 -2 -1
1 2 4 3
1
0
1
2 2 2 1 0 1 1 1 2 1 1 2
2
1 2
0 1
4006 1982 1581 774 266 1802 164 1355 4119 2224 206 1188 2061 2469 147 558 429 593 228 3355 865 2934 4529 4508 311 4532 390 4261 2343 1539 3277 1600 188 4614 1900 1442 2558 1507 3567 2964 569 1787 1332 443 2569 1036 2310 4061 570 544 4381 434 1204 1714 1019 3801 714 1239 3148 919 458 433 4809 272 2656 1246 1358 2506 1915 3206
무늬 무대 무릎 무섭다 무슨 무어 무엇 무척 묵묵히 묶다 문 문득 문명 문자 문제 문학 문화 묻다 물 물가 물건 물결 물고기 물끄러미 물다 물러가다 물론 물리치다 물음 물질 물체 뭐 뭐 미끄러지다 미래 미리 미술 미안하다 미워하다 미처 민족 민주 민주주의 믿다 밀 밀다 밀리다 밉다 및 밑 밑바닥 바 바 바깥 바꾸다 바늘 바다 바닥 바닷가 바라다 바라보다 바람 바래다 바로 바르다 바쁘다 바위 바지 바치다 바퀴
이름씨 이름씨 이름씨 그림씨 매김씨 대이름씨 대이름씨 어찌씨 어찌씨 움직씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 어찌씨 움직씨 움직씨 어찌씨 움직씨 이름씨 이름씨 이름씨 느낌씨 대이름씨 움직씨 이름씨 어찌씨 이름씨 그림씨 움직씨 어찌씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 움직씨 그림씨 어찌씨 이름씨 이름씨 매인이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 움직씨 어찌씨 그림씨 그림씨 이름씨 이름씨 움직씨 이름씨
830 2067 2719 5980 16648 2327 24930 3183 800 1806 20838 3753 1978 1561 27511 8729 11330 8036 18980 1064 5414 1259 707 712 14396 706 12284 770 1696 2794 1098 2697 22443 688 2185 2988 1494 2854 979 1242 8574 2348 3251 10999 1488 4438 1724 817 8568 8953 741 11204 3698 2476 4535 893 6537 3562 1154 5069 10638 11225 649 16123 1424 3537 3174 1529 2161 1127
40 115 78 234 546 21 1250 115 19 48 453 110 81 84 1141 591 501 473 1034 35 212 44 103 20 1034 19 574 23 79 134 86 99 119 43 170 116 100 53 8 30 469 57 122 522 218 218 62 42 250 390 24 361 48 88 198 47 306 87 52 240 390 336 38 862 240 118 121 61 103 73
4 0 1 9 19 3 47 5 0 23 2 0 0 0 3 0 0 22 78 0 42 1 0 1 10 1 0 2 1 12 29 1 3 5 0 6 3 2 1 0 0 0 0 0 1 14 0 2 0 7 2 0 1 1 12 6 15 1 7 2 13 28 1 5 5 11 7 1 4 2
- 70 -
0 100 0 194 0 0 0 0 0 80 0 0 0 0 1356 194 319 0 791 0 0 156 0 0 152 0 271 0 0 102 94 0 0 0 81 0 0 96 0 90 1024 153 315 230 0 240 82 0 310 831 0 126 0 0 104 0 278 219 0 218 537 602 0 380 0 82 83 92 360 0
0 0 0 0 0 0 0 0 1 0 9 1 1 3 2 0 9 13 6 1 7 0 1 0 0 0 3 0 0 0 0 0 0 1 0 0 0 13 0 0 0 0 0 0 0 1 0 2 0 6 0 0 0 0 2 1 5 2 0 0 0 0 0 6 0 12 3 0 0 0
1
-3 -2 -2 -6 -7
2 2 3 2 1
-8 -5 -1 -1 -8 -2 -1
1 2 * 4 1 4 *
1 2 1 2 1 2
-3 -3 -4 -8 -6 -3 -7
1 2 2 1 1 2 1
1
-2
2
0 0 2 0
-5
3
-4
3
-1
3
-1 -5
4 1
-2 -3 -6 -2 -5 -1 -3 -2
2 4 2 3 1 2 4 3
-3 -5
4 2
-3 -4 -3
2 2 2
-4
1
-1 -1 -7 -2 -7 -2 -3 -4 -1 -8
4 2 1 2 1 2 2 2 4 1
-6 -3 -8 -2 -5 -1 -1
1 2 1 * 1 4 4
1 2
2
1 2
1
0
2 0 1 1
2 1 0 2 1 0 2 1 2 1 1 2 2 2 1 1 1 1 2 2 1 2 1 2 1
437 2647 2060 3561 2412 240 503 474 2124 1354 2358 4594 1044 2140 4117 101 1265 527 1008 2882 1988 2556 3332 859 2086 3848 4274 1867 1218 838 1854 248 4144 689 4502 213 2838 3855 337 1856 2919 3127 958 1237 332 807 219 4483 1441 4329 2249 181 1064 2158 3095 3066 3252 3947 1333 2536 3107 2236 621 1303 4650 1167 1109 2677 3395 2986
박 박다 박사 박수 박히다 밖 밖에 반 반갑다 반대(反對) 반대하다 반도(半島) 반드시 반장(班長) 반짝이다 받다 받아들이다 발 발견하다 발길 발달 발달하다 발자국 발전 발전하다 발표 발표되다 발표하다 밝다 밝히다 밟다 밤 밤중 밥 밥상 방 방금 방바닥 방법 방송 방침 방학 방향 밭 배 배우다 백 백두산 백성(百姓) 백화점 버릇 버리다 버스 버티 번 번지다 번쩍 번호 벌다 벌떡 벌레 벌리다 벌써 벌어지다 벗 벗다 벗어나다 베다 베풀다 벼
이름씨 움직씨 이름씨 이름씨 움직씨 이름씨 토씨 이름씨 그림씨 이름씨 움직씨 이름씨 어찌씨 이름씨 움직씨 움직씨 움직씨 이름씨 움직씨 이름씨 이름씨 움직씨 이름씨 이름씨 움직씨 이름씨 움직씨 움직씨 그림씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 셈씨 고유이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 이름씨 움직씨 어찌씨 이름씨 움직씨 어찌씨 이름씨 움직씨 어찌씨 움직씨 이름씨 움직씨 움직씨 움직씨 움직씨 이름씨
11142 1431 1979 981 1621 17905 9695 10324 1899 3196 1678 692 4404 1882 801 38934 3472 9245 4590 1284 2059 1495 1072 5454 1951 881 767 2230 3651 5614 2249 17527 794 6787 713 20341 1305 878 13835 2247 1264 1162 4826 3577 13897 5787 19765 718 2991 754 1787 22925 4303 1866 1173 1188 1107 849 3250 1506 1170 1794 7614 3343 682 3827 4140 1409 1044 1231
114 114 125 33 63 550 470 320 57 187 61 32 221 35 34 1680 170 286 129 29 76 26 31 208 46 121 9 56 172 189 81 524 17 207 12 454 28 14 576 160 13 42 185 109 482 241 232 3 109 32 66 1258 108 42 808 47 54 27 110 41 36 65 208 121 102 102 201 65 50 18
1 6 1 1 1 21 4 40 7 2 0 0 1 1 2 27 0 14 1 0 0 0 2 0 0 0 0 0 4 1 2 6 3 9 1 22 0 1 11 2 0 17 24 11 41 5 10 2 0 0 1 9 16 0 16 1 4 3 0 1 5 1 10 2 1 3 0 18 1 26
- 71 -
0 0 0 0 0 0 0 0 127 320 0 118 155 0 0 1038 98 0 0 97 0 0 95 0 0 308 0 0 222 308 0 0 0 181 0 0 176 0 798 146 248 0 268 0 0 277 92 0 0 0 0 364 0 0 0 0 0 0 90 0 0 879 242 157 83 147 108 0 0 0
0 0 0 0 0 0 0 0 2 0 2 9 1 0 0 15 0 0 0 0 2 1 0 1 1 0 1 2 0 0 0 6 0 3 0 0 2 1 0 0 0 8 0 3 0 8 1 0 1 5 1 4 9 2 0 0 0 2 0 0 1 0 6 0 1 0 0 0 0 0
0
-1 -1 -2
3 4 2
-8 -2 -7 -6
1 2 1 1
-3
3
-2
2
-2 -8
3 1
-5 -2
1 4
-1 -1
3 *
-2
3
-2 -3 -2 -3 -7
3 2 4 3 1
-7
1
-7 -3 -1 -4 -3 -1 -6 -2 -3 -7 -7 -4 -3
1 2 4 3 3 4 1 2 3 1 1 1 2
-7 -2 -7 -6
1 3 2 1
-7 -1
1 *
-3 -2 -1 -2 -2 -7
2 2 3 2 4 1
-1 -5 -1 -1 -1
* 1 4 4 *
1 2
2 2 0 2
2 0 2
2
2
2 0 1 2 1 2 2 1 2 1
2
0
2 2 2 0 1 1 0 2 1 1 1 2 0 0 1 0
822 1530 3285 867 789 726 1077 4334 426 863 725 3856 412 805 31 224 3447 4062 3549 113 3627 4494 2537 2459 3183 2432 1831 3207 2268 1137 3211 3244 3316 2174 2698 1710 1790 2211 3540 314 1363 915 2782 3274 1329 782 3788 4817 1543 952 1902 3819 4262 3474 2654 162 2990 1164 3248 1747 777 3870 1060 1896 3603 1814 377 1796 3624 685
벽(壁) 변 변소 변하다 변화(變化) 별 별로 별안간 병 병원 보 보고 보내다 보다 보다 보다 보도 보따리 보리 보이다 보장(保障) 보조 보통 보호 보호하다 복도 복잡하다 본래 볼 봄 봉투 뵈다 부근(附近) 부끄럽다 부담 부대 부드럽다 부딪치다 부럽다 부르다 부리다 부모 부모님 부문(部門) 부부 부분 부서지다 부수다 부엌 부인 부자 부지런히 부처님 부치다 부탁 부터 부하(部下) 북 북쪽 북한 분 분단 분명하다 분석 분수 분야 불 불교 불길 불다
이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 어찌씨 어찌씨 이름씨 이름씨 이름씨 토씨 움직씨 어찌씨 움직씨 토씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 그림씨 어찌씨 이름씨 이름씨 이름씨 움직씨 이름씨 그림씨 이름씨 이름씨 그림씨 움직씨 그림씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 어찌씨 이름씨 움직씨 이름씨 토씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨
5706 2806 1095 5401 5860 6349 4255 753 11424 5437 6354 878 11741 5794 145582 19375 1025 817 985 36493 956 716 1506 1570 1139 1598 2287 1126 1764 3946 1125 1110 1078 1853 1399 2483 2346 1821 989 14324 3159 5099 1340 1099 3273 5898 897 648 2780 4884 2182 887 770 1014 1425 25667 1230 3836 1109 2408 5953 874 4323 2195 964 2311 12594 2338 957 6866
158 46 30 254 336 118 162 2 324 191 3764 59 593 7 3467 279 39 30 30 1175 41 16 134 86 24 50 56 46 48 237 37 21 28 62 57 51 128 79 42 747 110 229 21 50 151 354 48 21 92 236 77 29 4 37 49 965 36 60 55 42 565 56 95 87 16 125 379 58 32 379
3 14 2 8 13 16 0 1 7 9 6 1 34 0 530 29 0 3 2 47 0 0 2 0 3 1 2 2 2 8 3 2 0 3 0 3 2 0 2 41 2 0 1 0 0 12 1 3 2 0 2 3 0 0 1 21 0 4 9 25 50 15 0 0 14 0 22 0 0 25
- 72 -
0 0 0 227 104 0 0 0 0 0 0 0 593 383 0 0 0 0 540 296 94 0 91 0 0 163 0 0 482 0 0 0 97 0 0 0 100 81 593 0 131 0 563 0 120 0 0 88 132 0 0 0 0 99 0 0 0 0 0 0 0 114 94 0 129 451 0 266 269
2 0 0 1 0 0 2 0 2 3 0 0 3 0 2 0 1 0 0 13 0 0 0 0 0 2 1 0 0 16 0 0 3 0 1 0 1 0 1 9 0 0 2 0 2 1 0 0 5 4 0 1 1 6 4 9 3 3 7 0 0 0 2 0 0 0 0 2 0 3
1 0 1 1 2 2
-5
2
-3
2
-1 -6 -7
* 1 1
-1 -5 -5 -6 -3 -1 -1
3 1 1 1 1 4 4
0 2
-7
2
2
-1 -7
* 1
-2 -2 -7 -1
4 2 1 4
-7 -3
1 1
-4 -3
2 4
-2 -2 -5 -5 -1 -1 -7
3 4 2 1 4 1 1
-1 -3 -1
4 4 4
-4 -4 -3 -1 -1 -4 -1 -1
1 1 2 4 4 1 2 1
-4
1
-2 -7
3 1
1
-1 -1 -1 -5 -2
* * 3 1 4
1
-5
1
4 2
2 0 2
0 0 2 2 1 2 0 2
2 1 2 1 1 1 0 2
1 2
0 1 1 2 1
0
2316 1732 1586 790 3275 737 2351 313 1391 1852 4023 1084 1236 1774 1879 1241 3128 3036 2407 2522 1786 4484 1912 1090 2437 1797 2240 3096 4533 696 2062 1444 406 2190 1946 4035 848 2791 1570 3037 2788 2128 4307 2431 1397 1661 2090 442 571 1027 2428 1605 271 3707 860 35 438 2725 1557 2217 630 3480 160 987 3194 2911 249 3208 940 159
불쌍하다 불안 붉다 붙다 붙들다 붙이다 붙잡다 비 비교 비교하다 비닐 비로소 비록 비롯하다 비밀 비슷하다 비싸다 비용 비우다 비추다 비치다 비키다 비판 비하다 비행기 빌다 빌리다 빚 빚다 빛 빛나다 빠르다 빠지다 빨갛다 빨다 빨래 빨리 빵 빼다 빼앗기다 빼앗다 뻗다 뻗치다 뼈 뽑다 뿌리 뿌리다 사 사건 사고 사과 사나이 사다 사단 사라지다 사람 사랑 사무 사무실 사방 사상 사슴 사실 사업(事業) 사용 사의 사이 사장님 사진 사회
그림씨 이름씨 그림씨 움직씨 움직씨 움직씨 움직씨 이름씨 이름씨 움직씨 이름씨 어찌씨 어찌씨 움직씨 이름씨 그림씨 그림씨 이름씨 움직씨 움직씨 움직씨 움직씨 이름씨 움직씨 이름씨 움직씨 움직씨 이름씨 움직씨 이름씨 움직씨 그림씨 움직씨 그림씨 움직씨 이름씨 어찌씨 이름씨 움직씨 움직씨 움직씨 움직씨 움직씨 이름씨 움직씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨
1718 2438 2711 5847 1099 6231 1686 14355 3092 2250 825 4210 3579 2368 2216 3561 1162 1202 1628 1518 2349 718 2167 4192 1591 2336 1790 1173 706 6733 1978 2978 11945 1839 2109 822 5525 1335 2731 1201 1337 1898 760 1600 3086 2592 1947 11011 8528 4485 1603 2688 16192 925 5454 134868 11100 1372 2759 1816 7524 1012 25801 4675 1133 1267 17520 1126 4947 25968
47 106 118 229 24 247 56 311 106 50 46 164 179 68 90 83 44 41 33 93 91 15 132 177 102 86 78 42 42 286 98 135 414 115 104 47 202 52 142 54 56 58 10 74 103 83 83 457 304 203 78 44 457 4 244 5742 700 54 67 70 198 15 1104 87 448 22 580 7 183 1175
4 0 3 15 1 22 4 26 41 1 7 0 0 3 2 3 1 0 0 6 0 3 0 2 31 4 0 0 1 9 1 11 6 10 0 2 28 2 4 2 3 5 0 0 2 6 10 1 0 0 5 0 34 0 2 261 1 0 1 1 0 1 1 0 1 0 14 0 4 1
- 73 -
0 149 226 299 0 231 0 0 0 0 0 99 101 751 104 0 0 88 0 0 111 0 86 159 0 0 0 0 0 718 407 161 281 103 0 0 571 0 88 0 116 84 117 92 160 264 0 0 319 0 0 109 134 106 141 3823 518 0 95 0 1314 0 0 859 0 0 0 0 177 607
0 0 2 0 0 1 0 11 1 0 0 0 0 0 2 4 10 0 2 0 0 0 0 1 5 3 1 3 0 2 0 4 0 0 2 3 7 0 0 0 0 0 0 0 0 2 0 0 0 2 0 0 13 0 0 17 4 1 3 1 1 0 0 0 0 2 0 1 9 0
1 0 1 2 2 0 2 1 0 1 1 0 1 2 2
-2 -1 -1 -4 -1 -4 -1 -8
4 * 4 3 * 2 * 1
-4
3
-3 -3 -2 -4 -4 -8 -4
4 4 4 3 2 1 3
-1
3
-2 -1 -2 -6 -2 -8 -1 -2 -1 -2 -6 -6 -6 -3 -3 -7 -6 -5
1 4 3 1 4 2 * 4 3 3 1 2 1 2 1 1 1 2
-3
3
-1 -3 -2 -1 -4 -1 -6 -8
3 2 3 3 1 4 2 1
-8
1
-3 -8 -3
3 1 1
-7 -1 -1 -1 -3
1 4 4 3 2
-4 -6 -7 -4
2 2 1 3
1 1 1 1 1 2 1 2 1 0 2 0 2 1 0 1 1 2 1 1 1 1 0 2 2 2 1 1 1 1 2
2 1
1 1 2 1 2 2 2 2
2710 2494 334 832 104 1855 2218 1277 1621 1041 590 711 1014 4077 3269 2632 4608 595 1958 3782 2495 4485 2853 1723 657 2368 818 2865 742 3224 1024 1365 416 1115 4736 1451 3006 731 120 1185 90 380 835 4207 1173 4319 259 3578 3985 150 4579 172 2888 455 3708 1443 294 3774 3865 2276 407 1264 2359 462 424 1544 4382 1198 1655 945
사회주의 사흘 산 살 살다 살리다 살림 살아가다 살펴보다 살피다 삶 삼 삼다 삼십 삼촌 삼키다 삽 상 상관 상업 상자 상점 상징 상처 상태 상하다(傷~) 새 새 새 새기다 새끼 새로 새롭다 새벽 새우다 색 색깔 생(生) 생각 생각되다 생각하다 생기다 생명 생물 생산 생선 생활 생활하다 서 서 서기 서다 서두르다 서로 서른 서양 서울 서쪽 섞다 섞이다 선 선거 선물 선생 선생님 선수 선전 설 설명 설명하다
이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 움직씨 움직씨 움직씨 이름씨 셈씨 움직씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 매김씨 매인이름씨 이름씨 움직씨 이름씨 어찌씨 그림씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 토씨 이름씨 움직씨 움직씨 어찌씨 셈씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨
1390 1541 13883 5651 37601 2248 1816 3446 2657 4422 8071 6569 4562 812 1101 1438 689 7985 2096 899 1541 718 1297 2460 7121 1665 5723 1293 6205 1119 4505 3155 11678 4104 664 2962 1223 6298 34054 3769 45238 12515 5632 781 3808 756 16951 975 837 27166 695 23832 1280 10677 925 2981 15076 901 875 1756 11900 3474 1677 10505 11491 2780 741 3718 2604 4918
32 38 459 2016 2016 100 57 147 79 203 738 188 188 12 157 42 12 160 63 35 111 22 77 85 375 39 237 58 253 64 136 116 662 120 16 86 57 127 1872 112 1160 666 322 45 150 19 865 22 744 763 20 763 57 431 18 145 378 44 93 66 232 87 81 378 608 94 24 68 220 109
0 2 41 3 72 3 3 5 49 6 0 1 0 1 0 0 2 1 0 0 15 6 0 1 0 0 18 0 10 1 2 19 2 0 7 8 3 0 46 1 53 16 1 9 0 3 3 1 4 3 0 8 0 55 2 0 7 6 3 1 6 0 4 0 90 13 0 0 1 0
- 74 -
477 0 123 0 658 100 0 0 0 149 110 156 0 0 0 0 0 0 0 244 0 0 0 0 318 0 446 100 0 0 135 160 812 258 0 134 0 161 199 0 0 560 231 0 798 0 1706 0 0 0 0 1332 0 0 0 0 0 0 103 0 0 139 0 0 146 0 88 0 176 0
0 1 21 0 5 1 0 0 0 0 0 0 1 3 1 2 0 0 2 0 0 7 2 0 0 2 4 0 0 0 0 2 0 0 0 4 0 0 1 0 16 2 1 2 0 2 0 0 0 5 2 9 1 0 0 1 0 4 1 0 0 0 0 61 26 17 0 1 1 1
-1 -4 -7 -8 -7 -2 -2
4 2 1 1 1 2 4
-1 -3 -4 -2
* 4 4 1 4
-2
3
-1 -5 -1
4 2 4
-3
2
-1 -2 -3
4 2 4
0 0
-3 -2 -1 -2 -1 -3 -1 -5 -2 -8 -5
1 2 3 4 2 3 3 2 3 1 2
2
-5
1
2
-5 -3 -3
1 2 3
-6 -6
1 2
-3
1
-5 -5 -4 -3 -4 -6
1 2 3 2 3 1
-1
3
-2 -2 -8 -8
3 3 1 1
-4
2
-1 -6
1 2
1 2 0 2
1 1 2 1 1 1 0 1 1 2 0 0 1 1 1 2 1 0 1 2 1
0 1 1 2
2 1 2
2
1 0 2 1 1 1 2
821 2916 2529 1749 1862 513 2512 292 3691 4609 2531 1334 276 608 3552 1372 2804 4461 2814 1087 2147 293 3507 3339 861 96 2011 1153 3407 2783 81 2703 1360 146 1347 964 4188 4192 2318 30 85 3523 2586 1483 3326 2221 2995 3138 3619 1501 3676 2185 3842 1916 512 3061 2510 4766 327 890 1495 1565 843 573 3331 1535 2817 201 1984 191
성격 성공 성과 성적 성질 세 세 세계 세계관 세금 세기 세다 세상 세우다 세워지다 세월 세째 세차다 세포 셈 셋 소 소금 소나무 소년 소리 소리치다 소식 소원 소중하다 속 속도(速度) 속하다 손 손가락 손님 손수건 손해 솟다 수 수 수건 수녀 수단(手段) 수도 수많다 수술 수업 수염 수준 수지 수출 수화기 숙이다 순간 순경 순서 순수 술 숨(呼吸) 숨다 숲 쉬다 쉽다 스승 슬프다 승리 시 시각 시간
이름씨 이름씨 이름씨 이름씨 이름씨 매김씨 셈씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 움직씨 이름씨 셈씨 그림씨 이름씨 이름씨 셈씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 그림씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 매인이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 그림씨 이름씨 그림씨 이름씨 이름씨 이름씨 이름씨
5716 1266 1514 2407 2242 9549 1524 15164 930 689 1512 3250 15892 7797 984 3132 1328 724 1321 4200 1874 15135 998 1070 5440 41609 2034 3885 1039 1340 50298 1395 3168 27583 3221 4810 784 783 1716 148135 48343 993 1480 2891 1075 1814 1227 1158 958 2862 934 1841 882 2161 9577 1190 1527 659 14108 5234 2874 2741 5556 8472 1073 2802 1320 21035 2066 22015
203 95 73 87 55 384 122 749 56 22 276 384 692 329 1 135 1 18 69 106 103 433 69 68 254 1258 81 97 54 41 1868 105 101 913 133 131 27 27 58 8211 410 57 4 133 40 118 48 69 32 92 10 27 14 56 320 57 44 53 240 157 157 171 258 473 68 180 61 1671 100 1036
0 0 0 0 13 12 1 3 0 2 1 21 4 16 1 0 1 0 0 5 7 4 1 2 3 41 4 14 1 1 59 0 0 30 7 8 1 1 0 0 295 2 0 0 7 0 0 0 3 0 0 0 1 2 0 12 1 2 1 0 14 4 12 3 0 3 0 45 17 33
- 75 -
170 101 562 0 0 0 182 0 109 0 0 0 134 363 0 246 0 119 0 0 0 0 0 83 160 252 0 87 0 0 0 389 0 0 80 157 0 0 171 3137 0 0 191 0 165 0 0 0 175 0 0 0 108 0 0 0 0 0 302 0 147 137 185 0 82 702 0 0 0
6 0 1 1 0 1 0 5 0 0 0 0 4 1 0 0 0 0 1 0 16 0 2 4 1 5 0 1 2 0 1 0 2 5 1 1 1 0 0 0 0 2 1 0 3 0 1 4 0 0 1 2 0 0 1 1 0 0 2 1 0 2 5 6 4 0 0 0 0 0
-5 -1 -1 -2 -1 -1 -6 -3
2 3 3 2 * 1 1 2
-2 -1 -3
3 3 3
-3
2
-2 -1
4 4
-2 -8 -1 -1 -5 -1 -6 -2 -3 -5
1 1 3 4 1 2 2 3 4 1
-1 -7
4 1
-7 -2 -2 -1 -3 -1 -1
1 1 4 4 1 4 1
0 1
-2 -1 -2 -8 -2 -2
3 4 2 1 2 4
1
-2
3
0 1 0
-2 -2 -1 -1
3 4 2 4
2 1 1
-6
1
-1 -2 -8 -7 -1 -6
3 3 1 1 3 1
-2 -1 -6
1 4 1
1 1 1 0 1 2 1 1 2 2 2 1
0 0 2 2 1 1 2 0 1 1 2 1 0 2
1 1 0 1 1 1 1
2 2 0 2 1
2
1847 1387 3616 1936 2686 476 1599 1881 2376 2426 1088 189 810 1120 3897 746 1593 423 1281 2342 4386 2926 2262 1821 4069 278 3018 4362 2460 2551 542 3483 1623 4540 3468 2920 1696 1128 4311 2603 2334 4054 2243 2735 4139 801 1750 4140 2778 1540 1132 532 4719 641 2065 1073 1082 3898 1566 1930 1822 2079 1917 1683 121 4627 1413 1908 2831 2582
시계 시골 시끄럽다 시내 시달리다 시대 시민 시설 시원하다 시작 시작되다 시작하다 시장 시절 시조 시키다 시험 식 식구(食口) 식당 식모 식물 식민지 식사 식품 신 신고 신나다 신념 신다 신문 신문사 신부 신자(信者) 신호 신화 싣다 실 실례 실로 실리다 실은 실천 실험 실현 싫다 심다 심심하다 심장 심정(心情) 심하다 십 싱싱하다 싶다 싸다 싸우다 싸움 싹 쌀 쌓다 쌓이다 썩다 쏘다 쏟아지다 쓰다 쓰다듬다 쓰러지다 쓰이다 쓸다 쓸쓸하다
이름씨 이름씨 그림씨 이름씨 움직씨 이름씨 이름씨 이름씨 그림씨 이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 어찌씨 움직씨 어찌씨 이름씨 이름씨 이름씨 그림씨 움직씨 그림씨 이름씨 이름씨 그림씨 셈씨 그림씨 그림씨 움직씨 움직씨 이름씨 이름씨 이름씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 그림씨
2253 3095 959 2129 1406 10225 2699 2212 1659 1604 4194 22325 5768 4054 865 6180 2701 11493 3432 1697 740 1263 1771 2302 814 15801 1217 746 1570 1499 8959 1011 2653 704 1018 1264 2517 4012 759 1463 1707 819 1789 1364 795 5817 2407 795 1344 2794 3983 9123 668 7371 1974 4262 4214 865 2740 2137 2302 1954 2158 2537 33843 686 3052 2175 1313 1481
93 139 29 68 70 696 114 41 48 543 137 589 177 249 30 455 121 193 146 44 3 54 76 111 40 365 46 54 43 74 229 50 222 9 72 55 118 111 19 43 71 20 68 116 62 183 94 18 76 71 161 92 23 950 103 166 144 27 74 100 101 54 55 100 1514 37 66 128 32 65
10 5 2 3 2 0 0 0 4 6 3 26 12 0 0 4 1 15 6 0 0 33 0 0 0 7 1 1 0 9 13 1 0 0 4 0 12 4 0 0 2 0 0 1 0 9 11 4 0 0 2 5 1 28 5 13 6 14 4 17 2 2 7 1 153 4 4 1 8 2
- 76 -
0 88 0 0 0 303 0 93 91 871 0 0 0 119 0 1313 117 0 110 0 0 0 135 180 0 0 0 0 172 93 0 0 0 0 0 0 210 0 0 0 0 0 168 186 695 177 104 0 229 174 152 0 0 952 169 643 219 0 109 186 0 0 174 86 0 92 0 0 0
6 2 0 10 0 3 2 0 7 1 5 5 2 0 2 10 1 0 0 1 2 0 0 3 1 0 0 0 0 1 2 0 4 2 0 1 0 0 7 3 0 1 0 0 0 4 0 0 0 0 2 16 0 9 0 1 0 0 3 0 0 0 0 2 0 0 0 0 0 0
1 2 1 0 0 1 1
-7 -5 -5 -6 -1 -2 -3 -2 -1 -1
1 1 2 1 * 3 3 3 1 1
-7 -7 -2 -1 -7 -6 -1
1 1 3 4 1 1 3
-8
1
-1 -5 -2 -2
3 1 4 3
1
-1 -7 -8 -2 -3
* 1 1 3 3
1
-2
2
1 2
-3 -3 -4 -2 -3
2 2 1 4 4
-1 -1 -3 -4 -4 -6 -1
* 4 4 1 3 2 3
-6 -3 -1
2 1 2
-1 -5
3 2
-1 -2 -1 -2 -3 -2 -3 -7
* 3 3 2 2 4 4 1
-3 -3 -1 -1
3 3 2 *
1 2 1 2 2 1 0 2 1
2 1 1 2 1 1 1
2
1 1 1 2 1 1 1 1 2 1 2 2 2 1 1 1 1 1 1 2 1 2 0 1
4211 359 552 1703 868 734 4475 1679 1320 1274 3362 2390 3803 3913 394 4714 619 656 40 1671 505 559 738 625 366 1614 948 675 161 1177 3995 169 4347 786 490 1340 457 830 469 856 2759 1235 139 143 2333 3139 1145 556 4589 3514 2762 174 36 103 1170 60 1078 1913 816 3240 116 4150 1294 4767 4730 317 2754 1736 2749 2784
씌우다 씨 씩 씻다 아 아 아가 아가씨 아기 아까 아깝다 아끼다 아나운서 아낙네 아내 아뇨 아니 아니 아니다 아니하다 아들 아래 아름답다 아마 아무 아무것 아무렇다 아무리 아버지 아빠 아우 아이 아이구 아저씨 아주 아주머니 아직 아직도 아침 아프다 아홉 악 안 안 안개 안경 안다 안되다 안심하다 안전 안타깝다 앉다 않다 않다 알 알다 알리다 알맞다 알아보다 압력 앞 앞두다 앞서다 앞세우다 앞장 애 애기 애쓰다 애인 야
움직씨 이름씨 토씨 움직씨 느낌씨 토씨 이름씨 이름씨 이름씨 어찌씨 그림씨 움직씨 이름씨 이름씨 이름씨 느낌씨 느낌씨 어찌씨 잡음씨 움직씨 이름씨 이름씨 그림씨 어찌씨 대이름씨 대이름씨 그림씨 어찌씨 이름씨 이름씨 이름씨 이름씨 느낌씨 이름씨 어찌씨 이름씨 어찌씨 어찌씨 이름씨 그림씨 셈씨 이름씨 어찌씨 이름씨 이름씨 이름씨 움직씨 움직씨 움직씨 이름씨 그림씨 움직씨 도움풀이씨 움직씨 이름씨 움직씨 움직씨 그림씨 움직씨 이름씨 이름씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 움직씨 이름씨 느낌씨
780 13012 10249 2497 5400 6271 720 2544 3295 3452 1062 1648 893 860 12188 669 7627 7157 102336 2569 9657 8701 6228 7578 12927 2676 4887 6976 25799 3788 833 24297 750 5884 9923 3243 10640 5666 10390 5471 1354 3581 29681 28269 1708 1158 3913 8820 693 996 1353 23662 130493 37985 3815 66535 4255 2167 5728 1112 35465 793 3382 659 665 14263 1355 2429 1356 1339
40 312 262 173 231 7163 29 52 190 47 20 75 91 24 579 2 3965 190 190 65 430 331 608 226 254 54 234 269 872 308 43 1528 5 312 578 103 400 153 425 225 51 132 1080 809 53 47 1080 231 16 37 50 645 6750 6750 2251 2251 288 54 61 44 1189 24 163 16 14 268 20 92 31 422
9 2 72 3 4 16 4 21 24 1 1 5 0 0 0 1 3 4 27 17 6 6 11 3 1 1 1 3 84 0 2 35 0 290 8 23 3 6 19 11 2 3 9 14 0 2 2 2 3 1 1 18 2 30 3 51 9 183 99 0 37 1 1 1 0 1 0 2 0 8
- 77 -
0 0 0 0 0 0 0 0 0 94 0 120 0 0 0 0 0 0 2908 0 356 323 334 133 0 0 153 179 541 0 0 520 0 145 0 124 0 0 445 184 0 0 0 0 84 0 427 150 0 91 81 792 1402 0 163 2033 174
101 1781 0 119 0 91 0 0 0 0 0
0 0 1 0 23 0 3 3 0 4 0 0 1 2 2 0 1 0 33 0 19 5 1 5 0 0 0 0 14 4 0 0 3 0 0 2 0 0 5 16 4 0 7 0 0 0 1 0 1 0 0 7 0 24 0 23 2 0 0 0 16 0 0 0 0 0 2 0 1 1
-2 -2 -1 -4 -4
3 1 1 1 1
-5 -5 -5 -2 -4 -2
1 1 2 3 3 3
-7
1
-4 -7
2 1
2 2 2 2 2 2
-7 -5 -5 -4
1 1 1 2
1 2 1 0 2
-5 -8
3 1
-7 -3 -4 -7 -4 -7
1 2 1 1 1 1
-8 -8 -4
1 1 1
-7 -5 -2 -5 -4 -1 -3
1 1 2 1 3 3 3
-3 -7
4 1
-2 -2 -7 -5 -4 -2 -2 -8
1 2 1 2 3 3 4 1
-1 -2 -2 -1 -3 -4 -3
* 4 3 1 4 2 3
2 2 1
1 1 1 1 0 2 1 2
2 2 2 2 1 2 2 2 2 2 1 1 1
1 0 2 2 0 2 1 0 0 2 0
2 1 1 1
141 3310 912 1584 1420 2542 2091 411 3814 1842 2918 2023 340 4601 913 173 3428 978 1256 198 4628 962 151 183 1020 466 1021 620 1209 156 1055 1468 1158 3322 3381 546 1179 1178 1212 1830 3318 902 702 1745 417 131 2818 1287 679 449 3992 465 2670 2587 4522 26 2907 1268 214 11 56 615 1445 1259 1651 3097 51 589 153 1150
야 야단(惹端) 약 약간 약속 약속하다 약하다 양 양복 양식 양쪽 얘 얘기 어 어깨 어느 어느덧 어둠 어둡다 어디 어때 어떠하다 어떤 어떻게 어떻다 어렵다 어른 어리다 어린이 어머니 어서 어울리다 어제 어젯밤 어지럽다 어쩌다 어쩌면 어찌 언니 언덕 언제 언제 언제나 언젠가 얻다 얼굴 얼다 얼른 얼마 얼마나 얼음 엄마 업다 업무 업적 없다 없애다 없어지다 없이 에 에게 에게는 에게도 에게서 에까지 에나 에는 에다 에도 에만
토씨 이름씨 이름씨 이름씨 이름씨 움직씨 그림씨 이름씨 이름씨 이름씨 이름씨 대이름씨 이름씨 느낌씨 이름씨 매김씨 어찌씨 이름씨 그림씨 대이름씨 느낌씨 그림씨 매김씨 어찌씨 그림씨 그림씨 이름씨 그림씨 이름씨 이름씨 어찌씨 움직씨 이름씨 이름씨 그림씨 움직씨 어찌씨 어찌씨 이름씨 이름씨 대이름씨 어찌씨 어찌씨 어찌씨 움직씨 이름씨 움직씨 어찌씨 이름씨 어찌씨 이름씨 이름씨 움직씨 이름씨 이름씨 그림씨 움직씨 움직씨 어찌씨 토씨 토씨 토씨 토씨 토씨 토씨 토씨 토씨 토씨 토씨 토씨
29372 1083 5107 2712 3035 1504 1946 11773 888 2267 1265 2015 13803 690 5104 23731 1033 4755 3507 21462 686 4814 27087 22777 4534 10434 4524 7624 3682 26213 4355 2926 3846 1076 1049 8880 3784 3788 3678 2288 1077 5174 6657 2412 11669 30552 1320 3408 6913 10757 835 10462 1411 1479 709 180527 1268 3463 20247 748804 70819 7678 2977 3493 2613 1173 73564 8089 26752 3890
682 46 165 116 141 20 86 367 29 135 80 97 420 33625 156 1053 25 96 145 614 7 183 1339 34 929 498 190 392 88 846 5557 104 123 29 29 145 153 135 107 126 67 90 338 69 496 822 30 110 170 509 59 737 44 158 51 7417 86 96 524 30891 3150 437 161 137 101 37 3373 286 1170 142
34 3 7 0 3 0 3 21 0 0 10 1 0 4 0 65 3 1 1 22 0 21 57 91 0 4 9 4 49 98 13 1 2 1 3 0 0 4 33 3 6 4 18 1 11 18 1 16 21 15 34 17 0 0 0 72 1 2 1 966 80 3 2 1 5 1 197 7 42 1
- 78 -
0 81 0 131 90 0 0 0 89 0 0 0 0 0 211 359 0 116 133 0 0 518 0 1503 406 0 0 214 754 0 0 0 0 0 125 0 165 0 0 0 160 465 0 464 776 105 94 0 226 0 81 81 0 0 5645 186 0 303 0 0 0 0 0 0 0 0 0
1 1 0 1 11 1 1 0 1 2 0 0 2 0 3 13 0 0 0 0 1 32 9 0 13 5 2 2 0 24 0 0 6 0 0 0 1 2 1 2 0 4 0 0 0 4 1 1 0 2 0 8 0 2 1 53 0 0 0 85 109 0 0 0 0 0 0 0 0 0
1 2 1 2 2 1 0 1 2 2 2
2
1 2 2 2 2 1 1 1 2 2 0 2 0 0 0 2 1
2 2 1 1 2 1 1 1
2 0
-5 -2 -7 -3 -5 -3 -3 -3
1 3 1 2 2 3 2 2
-2 -1 -2 -7 -1 -2 -4 -8
1 2 3 1 * 3 1 1
-1 -7
1 1
-6 -8 -5 -6 -1 -8 -4 -6 -7 -1 -1
1 1 2 2 3 1 1 2 1 2 3
-1 -1 -8 -1 -6
4 3 1 4 1
-3 -4 -6 -3 -5 -7 -5 -2 -1
3 3 1 2 2 1 1 2 *
-2 -1 -7 -3
3 4 1 3
-3 -1
1 1
1
24 148 421 237 2932 2436 230 808 3906 3001 284 2381 1550 1289 4615 1923 140 1066 3205 1811 914 378 441 1152 852 697 1482 2108 4063 2797 4514 4803 840 363 880 3784 3463 1257 4303 4652 2423 3569 3820 4029 2734 944 1208 501 4791 1981 3902 995 4248 3059 3413 2056 803 2939 303 261 55 1076 2296 491 2780 1229 2972 1477 1381 597
에서 에서는 에서도 여 여간(如干) 여관 여기 여기다 여기저기 여덟 여러 여러가지 여러분 여름 여보 여섯 여자 여전히 여학생 여행 역 역사 역시 역할 연 연구 연기 연락 연설 연습 연탄 연필 열 열다 열리다 열매 열쇠 열심히 열흘 엷다 염려 영광 영문 영웅 영원히 영향 영화 옆 예방 예쁘다 예상 예술 예외 예의 예정 옛 옛날 오 오 오늘 오다 오래 오랫동안 오르다 오른쪽 오빠 오전 오직 오후 오히려
토씨 토씨 토씨 씨끝 어찌씨 이름씨 대이름씨 움직씨 어찌씨 셈씨 매김씨 이름씨 대이름씨 이름씨 느낌씨 셈씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 셈씨 움직씨 움직씨 이름씨 이름씨 어찌씨 이름씨 그림씨 이름씨 이름씨 이름씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨 그림씨 이름씨 이름씨 이름씨 이름씨 이름씨 매김씨 이름씨 느낌씨 셈씨 이름씨 움직씨 어찌씨 이름씨 움직씨 이름씨 이름씨 이름씨 어찌씨 이름씨 어찌씨
208739 27482 11606 17962 1260 1592 18938 5783 862 1225 15582 1654 2771 3404 688 2151 29480 4296 1129 2313 5100 12544 11024 3886 5512 6721 2892 1914 817 1332 711 650 5577 12964 5354 899 1019 3495 762 682 1611 978 887 824 1365 4925 3685 9734 654 2068 864 4642 773 1191 1037 1986 5805 1256 14721 16917 71775 4256 1739 9895 1343 3613 1241 2905 3108 7969
9220 1151 541 144 52 19 739 739 68 37 672 67 217 183 26 62 704 162 55 153 83 563 404 189 79 386 74 33 33 50 12 23 356 356 199 40 43 172 7 30 67 40 32 37 67 191 85 333 58 165 47 300 38 17 21 92 295 1769 2055 503 2055 214 111 363 50 96 23 126 86 334
267 46 4 252 2 0 7 2 3 2 122 2 4 19 0 5 10 1 0 2 0 0 1 0 7 0 1 0 0 1 1 16 33 9 7 7 0 11 1 1 0 0 0 0 0 0 0 20 2 36 1 0 0 0 0 0 12 6 1 50 191 1 1 8 2 14 2 0 6 0
- 79 -
0 0 130 0 0 792 219 0 0 1277 0 0 174 0 0 0 0 0 0 0 0 255 563 0 475 0 0 184 143 0 0 124 296 0 0 0 0 0 0 0 155 0 335 99 191 0 365 0 0 0 374 0 0 0 87 803 0 0 1281 355 0 763 0 219 0 219 0 112
98 0 0 0 0 1 20 0 0 6 9 1 0 15 3 8 5 1 5 2 1 8 1 0 0 0 0 2 0 1 0 6 0 3 1 0 2 0 0 0 1 0 2 0 0 1 8 3 0 6 0 0 1 2 2 2 2 0 0 19 0 0 0 4 0 2 1 0 4 2
-4
1
-2 -3
1 4
-6 -4 -4 -3 -7 -2 -5 -8 -2 -2 -6 -3 -5 -5 -2 -1 -1 -2 -3 -1 -3
1 1 1 1 1 3 1 1 3 1 1 1 1 3 4 4 3 2 1 4 1
-4 -6 -6 -5 -1 -4 -6 -3
1 1 1 2 * 2 1 2
-1 -1 -1
3 4 4
-2 -8 -9 -1 -7
4 1 1 4 1
-2 -1 -2 -3 -4
4 2 3 2 1
-8 -8 -3
1 1 1
-3
2
-7 -5 -2 -8 -3
1 1 4 1 4
0 1 1 1 2 2 2 1 2 2 1 2 2 2 1 1 0 2 2 1 1 1 2 2 2 1 2 1 0 0 1 1
2 2 2
0 1 2 1 2 2 2 2 2 2 2 1 2 1
1601 2005 3492 1934 800 1351 658 2394 965 1042 555 20 2045 616 3894 2468 1022 670 4376 223 1812 929 1357 2663 1556 2498 1571 2900 2567 1752 3459 1865 2708 1425 2016 4645 45 3498 4096 4402 2424 4038 509 2905 2513 4476 447 982 1585 3654 688 336 733 4278 2884 543 1583 1160 1942 1635 1201 488 3259 2935 127 2203 2672 3377 1388 1366
온 온갖 온도 온통 올라가다 올라오다 올리다 올해 옮기다 옳다 옷 와 와도 와의 완전 완전하다 완전히 왕(王) 왕조 왜 왜냐하면 외 외국 외부 외치다 왼쪽 요구 요란하다 요새 요인 요즈음 욕 욕심 용기 용서 우뚝 우리 우리 우물 우산 우습다 우유 운동 운동장 운영 운전수 울다 울리다 울음 울타리 움직이다 웃다 웃음 웅크리다 워낙 원 원리 원인 원장 원칙 원하다(願~) 월 웬 웬일 위 위대하다 위원 위원장 위원회 위치
매김씨 매김씨 이름씨 어찌씨 움직씨 움직씨 움직씨 이름씨 움직씨 그림씨 이름씨 토씨 토씨 토씨 이름씨 그림씨 어찌씨 이름씨 이름씨 어찌씨 어찌씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 그림씨 이름씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨 어찌씨 대이름씨 이름씨 이름씨 이름씨 그림씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 이름씨 움직씨 움직씨 이름씨 움직씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 매김씨 이름씨 이름씨 그림씨 이름씨 이름씨 이름씨 이름씨
2694 2040 1006 2130 5824 3205 7113 1638 4809 4418 8822 286123 1997 7665 867 1563 4518 6999 743 19529 2313 4996 3176 1418 2762 1537 2730 1274 1489 2405 1020 2232 1391 3026 2027 683 90045 1003 808 737 1608 822 9585 1271 1524 720 10856 4713 2712 944 6796 13843 6276 766 1284 8955 2717 3842 2118 2627 3705 10052 1104 1259 32465 1827 1411 1051 3095 3151
89 89 80 83 235 59 259 43 230 213 398 5108 40 124 53 59 197 145 18 593 181 99 107 85 139 59 182 12 20 74 45 56 41 125 34 13 4534 56 31 30 49 146 421 56 34 12 407 149 97 47 343 358 178 13 45 230 169 223 26 110 179 409 26 29 1175 52 27 10 41 185
5 1 13 1 16 1 15 8 6 0 28 235 1 1 0 0 0 0 0 21 0 4 3 4 1 10 0 1 0 0 1 1 1 5 0 2 264 3 3 2 0 1 14 11 0 0 22 4 2 1 33 35 3 1 0 153 0 0 9 0 0 23 1 2 73 0 0 0 0 0
- 80 -
751 266 159 0 183 0 972 306 337 559 303 0 0 157 121 172 0 0 335 135 281 0 0 0 0 1235 103 0 0 0 0 0 0 87 0 7766 0 0 0 0 0 1059 0 87 0 392 0 88 0 297 521 0 0 0 208 139 0 330 0 373 162 0 0 1248 93 122 336 116
0 0 0 0 1 0 0 0 1 0 7 0 0 0 0 0 1 1 2 0 0 2 1 0 1 3 0 0 6 2 0 0 1 1 0 0 0 0 2 0 1 0 3 0 0 2 6 0 1 0 1 6 0 1 2 0 0 0 0 2 3 0 3 1 0 0 0 0 0 2
1 1 1 0
-2 -2 -1 -1 -4 -1 -1 -6 -3 -1 -8 -8
3 4 4 * 1 1 3 1 2 4 1 1
-1 -1 -2
4 4 2
2
-7
1
1 2
-5
1
-2 -7
3 1
-1 -1 -1 -2 -2 -3
3 * 3 4 3 3
-7 -1 -2 -8 -3 -5 -7 -3
1 3 3 1 3 1 1 1
-4 -3 -1 -1 -3 -6
1 3 3 * 3 1
1 2
-1 -6
* 1
1
-1
4
-5 -3 -4 -8 -2
1 3 3 1 4
-2
3
2 1 1 1
1
2 1 1
1 1 1 2 0 1 1 2 1 0
2 1
2 2 1
0 1 0 1 1 0
1
89 2785 3007 3382 2360 3356 1893 1970 3408 281 1735 3319 876 168 1308 1016 2565 526 1412 7 1238 4435 2543 2074 504 792 2429 1310 1618 184 77 39 321 1071 452 484 1346 200 1362 1520 498 722 3210 2713 2361 1248 250 185 209 1290 613 916 2741 392 405 2454 2739 1707 4079 302 598 2177 2098 397 687 1611 4541 4624 277 1279
위하다 위험 위험하다 위협 유리 유리창 유명하다 육 육군 은 은행 은혜 을 을까 음식 음악 읍 읍시다 응 의 의견 의논하다 의도 의무 의미 의사 의의 의자 의지 의하다(依~) 이 이 이 이 이 이 이거 이것 이기다 이끌다 이나 이다 이동 이따금 이라도 이란 이러하다 이런 이렇게 이렇다 이루다 이루어지다 이룩하다 이르다 이름 이리 이리하다 이마 이모 이미 이번 이불 이사 이상 이상하다 이성 이슬 이십 이야기 이야기하다
움직씨 이름씨 그림씨 이름씨 이름씨 이름씨 그림씨 셈씨 이름씨 토씨 이름씨 이름씨 토씨 씨끝 이름씨 이름씨 이름씨 씨끝 느낌씨 토씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 대이름씨 매김씨 셈씨 씨끝 이름씨 토씨 대이름씨 대이름씨 움직씨 움직씨 토씨 움직씨 이름씨 어찌씨 토씨 토씨 그림씨 매김씨 어찌씨 그림씨 움직씨 움직씨 움직씨 움직씨 이름씨 어찌씨 움직씨 이름씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨 그림씨 이름씨 이름씨 셈씨 이름씨 움직씨
45949 1339 1223 1049 1677 1064 2198 2081 1039 15648 2432 1077 5376 24339 3327 4558 1490 9287 3054 989277 3568 731 1504 1962 9680 5837 1603 3325 2665 22691 51904 124826 14176 4266 10722 10082 3228 21046 3161 2817 9772 6368 1126 1386 1676 3528 17490 22651 20464 1290 7688 5099 1360 12197 11971 1577 1362 2491 812 14883 7965 1851 1941 12140 6843 2678 704 687 15869 3440
2038 82 48 44 91 39 56 46 12 23681 104 29 43240 185 151 155 22 13 82 42066 110 14 53 73 462 245 42 87 144 1046 33699 37831 5735 265 1850 417 83 1182 129 101 1928 265 48 48 291 166 654 1191 685 407 415 232 46 542 744 46 25 86 8 590 172 107 69 653 155 259 29 5 720 108
36 0 1 0 10 1 1 0 1 732 0 1 1693 2 9 1 2 5 12 760 1 11 0 0 0 7 0 1 0 0 92 18 1 53 7 1004 3 27 21 0 15 13 0 0 1 1 6 5 22 0 3 1 1 5 10 4 0 0 0 0 9 1 2 4 7 0 0 2 114 16
- 81 -
3965 125 0 88 98 0 0 0 0 0 0 0 0 90 0 0 94 127 0 147 129 281 0 283 0 82 1052 7788 0 0 0 0 0 513 0 279 0 218 108 89 0 0 0 0 0 1260 601 143 510 0 443 0 163 150 0 357 106 0 0 369 172 0 84 0 810 0
0 2 0 0 0 0 12 2 0 0 2 1 0 0 14 4 2 0 0 0 2 0 0 0 2 0 1 7 2 0 0 47 2 70 0 90 1 15 2 2 2 270 0 2 0 0 1 0 0 7 3 0 0 0 5 0 0 2 1 0 7 3 1 0 0 2 0 5 2 0
1 2
-2 -1 -5 -1
2 2 2 *
-5 -4
1 1
-1 -1 -7 -1
1 4 1 3
-6 -7 -1
1 1 4
-3 -8 -1 -3 -1 -1 -3 -6 -3 -8 -1
2 1 4 3 * 4 3 1 4 1 4
-3 -7 -7 -4 -8 -5 -3
1 1 1 2 1 2 4
-3 -1
1 3
-2 -5 -3 -2 -3
2 2 1 3 3
-1 -8 -4
1 1 1
-1 -2 -1 -6 -1 -1 -1 -6
1 3 3 1 3 2 4 2
-1 -2 -5 -3
4 1 1 1
2
2 0
1 2
1
0 2 0 0 2 1 1 2 2
2 2 1
0 0
1 2 2 2 1 1 2
1 2 1 1
0 2
1810 2461 1163 1587 2726 208 1232 3806 1719 2380 2761 3302 171 1715 2977 1784 981 3513 4553 872 1331 2978 42 2214 2568 1133 1721 329 1174 2886 3329 280 1061 2651 795 4387 1652 3374 1602 986 478 723 2523 1349 4776 2743 4827 275 493 1249 713 38 794 2139 1616 78 751 3544 3369 2776 107 2012 894 626 1261 1052 3357 3778 3371 1427
이어 이어지다 이용하 이웃 이제 이제 이젠 이중 이쪽 이튿날 익다 익히다 인간 인구 인기 인류 인물 인민 인민군 인사 인식 인정 일 일곱 일대 일반 일반적 일본 일부 일상 일시 일어나다 일어서다 일요일 일으키다 일일이 일정하다 일찌기 일찍 일하다 읽다 잃다 잃어버리다 임금 임금님 임무 임자 입 입다 입술 잇다 있다 잊다 잎 자 자 자 자가 자국 자극 자기 자기 자꾸 자다 자동차 자라다 자랑 자랑스럽다 자랑하다 자료
어찌씨 움직씨 움직씨 이름씨 어찌씨 이름씨 어찌씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 셈씨 이름씨 이름씨 이름씨 고유이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 움직씨 어찌씨 그림씨 어찌씨 어찌씨 움직씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 그림씨 움직씨 이름씨 느낌씨 씨끝 이름씨 이름씨 이름씨 이름씨 대이름씨 이름씨 어찌씨 움직씨 이름씨 움직씨 이름씨 그림씨 움직씨 이름씨
2318 1567 3838 2711 1372 20466 3593 892 2467 1655 1354 1086 24194 2472 1236 2351 4723 997 703 5386 3257 1236 99858 1819 1489 3969 2463 13979 3799 1283 1074 15688 4322 1429 5830 740 2610 1054 2694 4693 10174 6364 1517 3210 657 1359 646 15942 9852 3526 6550 127228 5834 1884 2667 51513 6170 988 1057 1345 37471 2033 5223 7558 3488 4375 1064 900 1055 3016
42 47 70 168 414 446 3 24 40 40 36 60 1201 67 56 190 158 63 18 138 165 89 3220 43 52 151 67 622 176 58 32 544 98 58 199 28 46 1 112 162 484 269 62 120 26 53 20 501 501 83 290 12392 200 59 272 1325 499 26 41 77 1322 73 138 1325 206 225 77 35 47 128
0 1 5 25 1 9 0 0 0 2 7 19 5 0 0 0 0 0 0 23 0 1 183 2 0 0 0 9 0 0 0 20 8 12 3 1 1 0 10 25 79 9 1 1 10 0 3 7 14 0 25 705 5 18 6 68 5 0 1 1 14 20 5 25 17 25 10 4 0 0
- 82 -
200 0 0 0 0 0 0 0 0 0 90 0 549 0 0 109 212 4177 155 0 126 0 0 99 166 87 0 0 80 0 320 164 0 467 0 0 138 0 193 206 255 0 0 0 315 0 252 855 120 167 244 124 161 0 0 0 0 0 0 156 294 265 0 247 0 0 251
0 0 0 3 0 0 1 6 1 0 1 0 0 1 2 0 0 0 0 7 0 0 0 0 1 2 0 0 3 1 1 6 0 2 0 0 0 0 1 2 14 0 0 2 0 0 0 3 3 1 0 0 3 2 6 0 0 2 0 0 0 0 3 2 2 2 0 0 1 0
2
-2 -5
3 2
-5
1
-1 -2 -2 -3 -3 -3 -2 -1
4 4 3 3 2 4 4 4
-2 -1 -2 -4 -5
1 * * 1 1
-1 -7
4 1
-3
4
-7 -5 -7
1 2 1
-1 -1
* *
-6 -6 -8 -2 -5 -3
1 1 1 * 2 4
-2
4
-2 -8 -2 -3 -8 -4 -3 -3 -1 -1
1 1 2 3 1 2 1 2 4 2
-1
4
-4 -4 -7 -7 -2 -1 -1 -2 -2
2 2 1 1 3 4 4 2 3
1
1 0 1 1 1 0 1 2 0 2 2 1 2 1 0 2 2 2 1
1 2 2 1
0 2 2 0 1 2 1 2
1 1 0 2 1 2 2 1
1
3490 2251 258 3132 2125 1976 1266 2235 666 736 568 3877 3414 1376 691 1131 2033 523 1058 2119 2503 600 1950 4113 144 4635 996 2652 1642 536 1744 1312 1467 3074 279 1992 1263 354 4423 1704 2798 1531 3253 1809 1470 3032 3002 3347 1766 158 301 3327 4222 3712 663 1458 4403 4504 4638 3503 2747 1954 4114 3188 650 2031 1175 1326 2835 119
자루 자르다 자리 자리잡다 자본 자본주의 자세 자세히 자식 자연 자유 자전거 자존심 자주 자체 작가 작년 작다 작업 작용 작전 작품 잔뜩 잔치 잘 잘나다 잘못 잘못하다 잘하다 잠 잠기다 잠깐 잠깐 잠자리 잡다 잡지 잡히다(주름이-) 장 장가 장군 장난 장면 장치 재다 재미 재미있다 재빨리 재주 저 저 저 저것 저기 저기 저녁 저렇게 저렇다 저리 저물다 저절로 저지르다 저쪽 저축 저항 적 적극적 적다 적다 적당하다 전
이름씨 움직씨 이름씨 움직씨 이름씨 이름씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 어찌씨 이름씨 이름씨 이름씨 그림씨 이름씨 이름씨 이름씨 이름씨 어찌씨 이름씨 어찌씨 그림씨 이름씨 움직씨 움직씨 이름씨 움직씨 어찌씨 이름씨 이름씨 움직씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 그림씨 어찌씨 이름씨 느낌씨 대이름씨 매김씨 대이름씨 대이름씨 어찌씨 이름씨 어찌씨 그림씨 어찌씨 움직씨 어찌씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 움직씨 그림씨 이름씨
1008 1787 17005 1161 1899 2073 3469 1795 7060 6237 8584 873 1037 3124 6767 3990 2002 9336 4328 1904 1531 7886 2107 803 28061 685 4640 1428 2619 9095 2414 3317 2930 1183 15729 2055 3484 13182 733 2495 1332 2806 1107 2319 2921 1206 1225 1068 2382 26043 14885 1075 778 923 7091 2951 737 713 684 1001 1357 2099 803 1137 7204 2006 3792 3284 1309 34793
21 64 583 42 45 76 132 80 309 374 392 47 18 168 355 198 46 541 179 175 35 254 62 23 1173 22 126 18 78 241 102 56 29 41 541 99 143 212 27 81 51 89 110 83 113 76 63 53 488 22 715 32 40 29 226 2 77 17 25 45 57 40 13 66 4032 52 168 4032 21 708
4 8 15 1 0 0 2 7 0 3 0 2 0 1 0 0 4 31 0 1 0 1 2 8 118 0 2 4 3 7 1 1 1 2 25 0 0 22 0 8 3 0 0 0 1 44 2 6 0 25 4 5 2 1 10 1 1 2 1 0 1 1 6 0 3 0 9 4 0 9
- 83 -
0 100 0 0 0 141 92 0 214 0 166 0 0 263 294 211 84 539 492 315 224 283 0 0 2353 0 0 0 0 327 276 0 0 0 1054 0 166 0 0 0 0 94 143 99 106 0 0 0 0 0 1383 0 86 0 391 0 92 0 0 92 0 0 0 114 0 84 0 0 81 0
0 0 7 0 1 0 0 0 0 0 0 0 1 0 0 0 3 10 0 0 0 0 0 0 0 1 0 0 0 3 0 0 0 3 4 2 0 6 1 9 0 0 0 0 5 3 0 0 2 6 1 10 0 0 6 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
1 2 1
-3 -6 -5
1 2 2
-1 -2
* 4
-3 -2 -2 -2 -4 -3 -5 -3 -2 -8 -7 -1
2 3 3 3 2 4 1 4 4 1 1 *
-2 -3 -3 -8 -1 -6 -2 -1 -6 -3
3 3 3 1 * 2 2 1 1 2
-6 -2 -7 -5
1 4 2 1
-6 -2 -1 -3 -3
1 4 4 3 4
-2 -3 -2 -3 -5
1 1 3 2 1
-6 -7 -6
1 1 1
-7 -3
1 1
-2 -1 -3 -2 -3 -2
2 * 3 * 1 3
-3 -3 -3 -2 -2 -8
3 3 2 3 4 1
0 1 1 1
1
1 0 1 0 2 2 1 1 0 2
2 2 0 1 0 1
1 2 1 2 2 2 2
1 2 1 1 1
2 1 1
1763 4293 2470 3581 1545 3048 3977 765 768 1211 3570 2733 1083 3959 692 602 4151 703 1836 4344 639 1323 247 1804 3702 3505 4611 268 1682 4298 3589 265 3033 2336 389 3056 525 3387 4208 364 3265 4721 1097 425 1439 1479 2923 1407 705 98 4818 1119 2744 4639 1200 3516 4160 2184 1909 993 2521 3861 1777 609 2895 1672 1931 4383 1106 2183
전기 전등 전략 전망 전부 전선 전설 전쟁 전체 전통 전통적 전투 전하다 전해지다 전혀 전화 전환 절 절대 절실하다 젊다 젊은이 점 점심(點心) 점잖다 접다 접시 정 정권 정기 정당하다 정도 정리 정리하다 정말 정말로 정부 정성 정세 정신 정원 정직하다 정책 정치 정하다 정확하다 젖 젖다 제 제 제국주의 제대로 제목 제안 제일 제일 제작 제품 조각 조건 조국 조그마하다 조그맣다 조금 조금 조금도 조금씩 조르다 조사 조사하다
이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 어찌씨 이름씨 이름씨 이름씨 이름씨 그림씨 그림씨 이름씨 이름씨 이름씨 그림씨 움직씨 이름씨 이름씨 이름씨 이름씨 그림씨 이름씨 이름씨 움직씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 이름씨 이름씨 움직씨 그림씨 이름씨 움직씨 대이름씨 매김씨 이름씨 어찌씨 이름씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 그림씨 어찌씨 이름씨 어찌씨 어찌씨 움직씨 이름씨 움직씨
2388 764 1561 974 2780 1196 839 6074 6043 3680 978 1366 4214 844 6759 7860 793 6647 2283 751 7414 3292 17573 2323 927 999 689 16545 2539 763 969 16697 1206 1706 12293 1193 9326 1046 781 12963 1102 668 4179 11453 2994 2898 1264 3060 6634 40342 648 4061 1359 684 3707 996 792 1843 2171 4650 1519 876 2360 7781 1277 2565 2136 741 4146 1844
54 5 56 58 74 33 50 322 308 173 50 48 213 11 289 167 63 162 74 19 353 164 524 96 24 44 25 189 51 31 15 797 52 47 322 42 271 46 56 558 61 23 166 324 125 88 94 94 237 448 44 149 61 43 124 40 52 66 91 206 76 31 134 224 215 20 44 28 105 28
5 1 0 0 0 1 0 2 0 0 0 0 11 2 0 14 0 11 0 0 2 1 11 54 3 3 13 6 0 1 0 2 4 1 5 1 0 0 0 7 0 2 0 0 11 1 1 9 6 0 0 3 2 0 6 3 0 0 45 0 0 1 2 7 1 2 1 3 11 2
- 84 -
0 0 138 157 109 0 0 705 594 143 237 890 320 0 149 0 190 0 113 80 351 101 0 121 0 0 0 0 270 0 109 0 0 0 0 0 0 87 238 532 0 0 480 762 126 152 0 96 0 384 149 87 0 222 0 0 132 165 0 594 936 0 85 276 0 0 0 0 0 0
1 0 0 0 1 0 1 1 0 0 0 0 2 0 0 26 0 10 0 0 5 0 0 15 0 0 0 0 0 2 0 0 0 0 2 0 2 0 0 1 3 0 2 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 2 0
-5 -2
2 2
-1 -2
4 2
0 1
-1 -2 -2 -3 -1 -1 -4
4 4 4 3 4 * 2
2 2
-3 -8
2 1
2 1
-2 -1 -1 -3 -4 -2
3 4 4 2 3 2
-2 -2 -4 -3
3 2 2 4
-6 -1 -3 -4 -1 -2 -2 -1 -4 -1 -2 -1 -2 -4 -5
3 2 2 1 4 3 4 4 3 4 4 3 3 3 2
-1 -8
2 1
-1 -4 -2 -3
4 3 2 3
-7
1
-2
2
-4
2
-2
4
-8
1
-2 -1 -1 -1
2 4 4 3
1 0 1 1 2 1 1
2 1 1 1 0
2 1 0 2 0 1 1 1 1 1 2
1 1
0 0 0 1 1 0 2
1 2
2201 2552 3184 1572 1741 740 2704 4797 4661 637 2451 3664 2793 235 1742 1404 3484 1348 3449 2927 114 846 1049 3704 456 93 1487 1764 1569 2924 3903 1140 3328 669 2273 3300 1186 2492 2141 177 727 845 1286 2097 481 551 2507 3441 3751 3098 2987 419 226 2160 3106 3772 828 1364 1729 549 2418 2244 1219 330 1525 1431 4581 260 274 345
조상 조심스럽다 조심하다 조용하다 조용히 조직 조치(措置) 조카 존경 존재 졸다 졸업 졸업하다 좀 좁다 종류 종업원 종이 종일 종합 좋다 좋아하다 죄 죄송하다 주 주다 주로 주머니 주먹 주사 주소 주위 주의하다 주인 주인공 주일 주장 주저앉다 주체 죽다 죽음 죽이다 준비 준비하다 줄 줄 줄기 줄다 줄어들다 줄이다 줍다 중 중 중간 중기 중대하다 중심 중앙 중얼거리다 중요하다 중학교 쥐 쥐다 즉(卽) 즐겁다 즐기다 증오 지 지금 지금
이름씨 그림씨 움직씨 그림씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 어찌씨 그림씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 움직씨 이름씨 그림씨 이름씨 움직씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 이름씨 움직씨 이름씨 움직씨 매인이름씨 이름씨 이름씨 움직씨 움직씨 움직씨 움직씨 매인이름씨 이름씨 이름씨 이름씨 그림씨 이름씨 이름씨 움직씨 그림씨 이름씨 이름씨 움직씨 어찌씨 그림씨 움직씨 이름씨 매인이름씨 어찌씨 이름씨
1829 1499 1139 2730 2416 6226 1395 652 680 7449 1579 940 1333 18201 2415 3068 1011 3214 1025 1263 36103 5543 4380 927 10675 44342 2885 2387 2737 1264 864 3937 1075 7018 1759 1087 3769 1544 1882 23322 6345 5549 3413 1942 10109 8855 1528 1028 909 1173 1231 11613 19267 1864 1171 902 5669 3157 2442 8874 1615 1789 3651 13963 2812 3008 695 16934 16012 13627
100 15 23 42 72 230 51 21 31 450 51 52 46 477 112 176 43 146 42 43 1591 233 122 19 3072 3072 140 114 47 31 23 172 28 331 57 39 200 40 112 909 524 150 177 58 404 138 63 404 44 60 54 352 945 81 3 13 157 114 76 286 58 110 110 622 209 146 20 9234 340 779
4 1 6 2 3 0 0 0 0 0 0 0 1 17 2 3 0 29 0 0 53 9 1 0 0 189 2 5 2 1 1 3 2 4 0 2 0 0 0 3 0 3 5 4 0 38 9 1 2 1 13 0 26 2 0 0 2 0 2 1 1 9 0 0 22 1 0 0 3 11
- 85 -
0 0 0 149 83 684 140 0 85 88 0 167 0 578 0 82 0 164 107 149 1390 0 0 0 0 108 0 138 0 0 88 0 436 98 0 160 89 826 712 132 110 564 0 600 0 102 0 0 0 0 0 0 0 0 0 442 353 0 1606 0 0 421 162 0 0 307 250 0 0
0 0 0 2 0 0 0 5 0 0 1 3 0 0 2 0 1 10 0 0 78 8 0 1 1 36 2 0 0 0 0 1 0 0 0 0 0 0 0 3 0 1 3 0 0 0 0 0 0 2 0 1 0 0 1 1 2 2 2 4 1 1 0 0 0 0 0 0 15 0
0
-3
3
2
-5 -7 -5
1 1 1
-4 -1 -2 -4 -5 -4
2 * 4 2 2 2
-6 -4 -4 -8 -1 -1 -7 -8 -1 -5 -5 -8 -3 -2 -1 -5 -6 -2 -2 -4 -2 -4 -2 -3
1 3 2 1 2 4 1 1 * 1 1 1 3 2 3 2 2 3 2 2 3 1 4 4
-4
2
-2 -4 -7 -4 -1
2 2 2 2 4
-3
3
-5 -2 -1 -5 -3
3 2 * 2 2
-1
4
-2 -5 -2 -5 -1
4 2 2 2 2
-6 -3
2 2
-7
1
1 1 1 0 1 1 2 1 2 1 2
2 2 1 1 1 1 1 2 1 1 0 2 1 2
1 1 1 1 1 1 1 1
2 1 1 1 1 1 0
1 1
815 244 842 747 273 1514 2029 4273 709 2293 2189 2504 1043 849 2771 1713 540 1509 956 1863 4542 1070 1505 1377 1701 1839 2855 83 1528 1085 851 4806 4304 3678 1667 577 4154 2072 3197 2192 1416 1418 325 1871 4515 4250 2078 4060 1342 287 2802 758 1542 1262 1080 1321 3436 2427 4724 1409 716 3334 1010 3609 3592 1228 606 3110 2007 3420
지나가다 지나다 지내다 지니다 지다 지도 지도자 지루하다 지방 지배 지붕 지시 지식 지역 지우다 지치다 지키다 직업 직접 진실 진하다 질 질문 질서 짐 짐승 짐작 집 집다 집단 집안 집합 집행 집회(集會) 짓 짓다 짖다 짙다 짚다 짜다 짝 짧다 쪽 쫓기다 쭉 찌다 찌르다 찌푸리다 찍다 차 차다 차다 차례 차리다 차이 차지하다 차차 착하다 찬란하다 참 참 참가하다 참다 참말 참새 참으로 창 창고 창문 창작
움직씨 움직씨 움직씨 움직씨 움직씨 이름씨 이름씨 그림씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 그림씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 그림씨 움직씨 움직씨 이름씨 그림씨 이름씨 움직씨 어찌씨 움직씨 움직씨 움직씨 움직씨 이름씨 그림씨 움직씨 이름씨 움직씨 이름씨 움직씨 어찌씨 그림씨 그림씨 느낌씨 어찌씨 움직씨 움직씨 이름씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨
5748 17738 5557 6175 16031 2830 2007 768 6597 1741 1840 1531 4407 5516 1348 2480 8969 2840 4842 2234 704 4270 2856 3113 2500 2278 1296 49294 2807 4206 5513 650 762 934 2579 8347 793 1967 1132 1837 3045 3043 14124 2223 711 773 1957 818 3241 15474 1329 6098 2788 3486 4228 3294 1030 1604 667 3056 6495 1072 4587 961 968 3616 7815 1169 2038 1035
193 594 213 298 398 268 84 26 265 146 85 43 201 253 63 93 291 102 179 162 41 64 158 120 73 81 50 1846 1846 188 193 21 11 42 345 345 19 36 28 76 52 154 463 54 35 68 53 28 113 451 65 451 77 100 186 68 18 49 28 184 196 23 184 25 125 119 207 33 88 21
16 20 16 0 4 1 0 0 2 0 3 0 0 0 2 0 19 0 3 0 1 0 1 0 4 18 1 151 0 0 4 6 0 0 3 29 15 1 1 8 2 4 34 1 0 3 0 1 7 22 5 12 34 5 0 0 0 17 0 3 40 0 2 1 7 1 2 1 0 0
- 86 -
0 907 168 165 0 0 2621 0 0 87 0 209 232 322 0 0 424 119 367 569 0 0 0 145 195 81 101 1558 111 215 0 0 110 213 0 0 0 0 0 0 0 152 0 0 0 0 127 0 144 0 104 0 0 168 172 165 0 0 89 0 162 0 222 0 0 164 0 82 0 108
1 8 6 0 4 0 0 1 0 0 0 0 0 0 0 1 4 0 0 0 0 1 0 0 3 2 0 39 0 0 0 0 0 0 0 4 0 0 0 0 0 4 0 0 1 2 0 1 1 9 2 0 0 0 0 2 1 0 0 1 0 1 0 0 0 0 1 0 3 0
1 2 1 1 1 1 1 1 0 0 1 0 1 1 1 1 0 1 1 2 2 1 2 1
2 1 1 0 1 1
1 1 1
2 1 1 1 1 1 1 0 2 1
-3 -4 -5 -1 -2 -4 -2 -3 -2 -2 -2
2 2 1 4 2 1 4 2 2 4 4
-1 -4 -3 -6 -5 -6 -2
3 2 4 2 2 2 4
-3 -4 -1 -5 -1 -1 -8 -3 -2 -5
2 1 * 2 4 * 1 2 4 3
-1 -5 -3 -3
4 2 3 4
-7 -3 -6 -5 -3 -1 -2
1 4 1 1 2 2 4
-6 -5 -4 -1 -4 -5 -3 -2 -2 -2
1 1 2 3 4 3 3 3 3 2
-2 -4 -2 -4
3 1 3 2
-1 -3 -1 -5 -1
4 1 3 1 *
0 1 0 2 1
2425 217 1138 2133 932 1559 514 1660 1007 2572 1622 86 2873 298 1490 1625 393 1400 454 4359 2357 3771 793 1304 1223 813 4223 2088 2049 3560 3757 766 3522 4056 4582 1065 1709 1459 2868 3101 1493 3353 4444 4799 3974 4478 1738 1886 1868 3261 3142 745 1318 297 2820 2601 357 4519 3201 3850 1932 4640 4723 1253 3262 3949 1245 2715 4479 1864
창조 찾다 찾아가다 찾아보다 찾아오다 채우다 책 책상 책임 챙기다 처녀 처럼 처리 처음 처지 천 천(千) 천천히 철 철도 철저하다 철저히 철학 첫 첫째 청년 청소 체 체 체육 체험 쳐다보다 쳐들다 초대 촛불 총 최고 최근 최대 최후 추다 추위 축구 출근하다 출발 출입 춤 춥다 충분히 취급하다 취미 취하다 층 치다 치료 치마 친구 친절하다 친하다(親~) 침략 침묵 침착하다 칭찬 칼 캄캄하다 캐다 커다랗다 커지다 컵(cup) 켜다
이름씨 움직씨 움직씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 움직씨 이름씨 토씨 이름씨 이름씨 이름씨 이름씨 셈씨 어찌씨 이름씨 이름씨 그림씨 어찌씨 이름씨 매김씨 셈씨 이름씨 이름씨 매인이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 그림씨 어찌씨 움직씨 이름씨 움직씨 이름씨 움직씨 이름씨 이름씨 이름씨 그림씨 그림씨 이름씨 이름씨 그림씨 이름씨 이름씨 그림씨 움직씨 그림씨 움직씨 이름씨 움직씨
1608 19926 3945 1894 4976 2756 9541 2596 4599 1487 2656 47538 1291 15033 2882 2650 12195 3079 10694 747 1681 903 5835 3340 3627 5761 778 1950 1994 982 908 6054 994 819 695 4303 2484 2949 1293 1172 2876 1066 728 652 840 719 2424 2206 2230 1103 1157 6186 3300 15041 1319 1464 13116 710 1130 881 2134 684 668 3522 1103 849 3542 1385 719 2234
150 863 102 47 116 113 483 87 131 38 59 1874 71 524 55 229 113 104 176 25 71 44 390 143 163 231 21 30 56 38 46 176 26 16 16 70 92 104 61 35 57 49 21 15 61 16 45 134 106 17 28 162 89 568 184 32 661 30 44 39 62 47 85 39 19 204 39 17 72
0 46 10 32 2 1 30 24 0 3 0 15 0 7 0 1 0 5 2 2 0 0 0 1 4 0 2 0 1 1 0 5 0 0 0 6 0 0 0 0 10 2 4 0 0 0 8 9 0 0 0 0 1 41 2 0 8 2 3 0 0 1 6 7 0 2 2 1 2 3
- 87 -
578 993 0 0 0 94 271 168 388 0 271 0 178 0 190 0 158 124 0 131 109 721 83 558 0 943 0 179 0 116 141 0 113 0 0 0 278 231 106 125 0 0 0 0 114 0 89 0 113 0 0 0 0 0 126 84 227 0 0 359 93 0 0 154 105 0 489 86 0 0
0 12 1 0 0 0 25 8 0 0 3 1 0 0 0 0 0 3 1 0 0 0 0 1 2 0 0 0 0 1 0 0 0 1 2 3 0 1 0 0 1 0 0 1 2 1 1 8 0 1 6 1 0 5 2 0 13 0 0 1 0 0 0 5 0 0 0 0 0 0
0
-2 -8 -1
4 1 2
-2 -2 -8 -8 -2 -3 -1
2 3 1 1 3 4 *
-7 -2 -3
1 4 1
-7 -1
1 4
-1 -1 -3
* 4 3
-1
4
-3
2
-2 -2
4 2
-1 -3 -2 -5 -3 -1 -1 -4
2 2 3 2 2 * 4 2
-4 -5 -2 -1 -5 -6 -2 -1 -7 -2 -3 -6 -2 -4 -8 -5
2 2 1 2 2 1 2 * 2 2 1 1 2 1 1 1
1 2
-2 -2 -1 -1 -3
4 4 4 3 1
1 0
-1
*
-3 -6
1 1
2 1 1 1 1 0 0 2 2 0 0
0 1 1 0 1 1 0 1 1 1 0 1 1 1
1 0 0 2 0 1 2
1 2 0
1 2 1
0
922 2856 2315 125 4761 3886 754 1887 300 3938 4814 2602 4412 686 2241 1242 1853 1895 367 2550 1056 1276 2779 3655 4286 4202 2021 2687 837 4464 1426 3941 307 4097 1589 4287 3178 3117 2455 3366 2619 1580 510 4325 2773 1529 1677 1291 4456 1644 2493 3075 3013 3078 1664 992 1172 662 3174 1665 1986 2634 2092 1094 3058 3650 820 2032 2563 1789
코 콩 크기 크다 큰소리 큰일 키 키우다 타다 타오르다 탄압 탈 탐구 태도 태양 태어나다 태우다 택시 터 터뜨리다 터지다 털다 토끼 토대 토론 토요일 토지 토하다 통 통신 통일 통치 통하다 통화 투쟁 툭 트다 트럭 특별하다 특별히 특성 특징 특히 튼튼하다 틀 틀리다 틀림없다 틈 파괴 파다 파도 파랗다 파리 파업 판단 팔 팔(八) 팔다(賣) 팔리다 패 퍼지다 퍽 펴다 편 편리하다 편안하다 편지 편하다 펼치다 평가
이름씨 이름씨 이름씨 그림씨 이름씨 이름씨 이름씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 이름씨 이름씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 어찌씨 움직씨 이름씨 그림씨 어찌씨 이름씨 이름씨 어찌씨 그림씨 이름씨 움직씨 그림씨 이름씨 이름씨 움직씨 이름씨 그림씨 이름씨 이름씨 이름씨 이름씨 셈씨 움직씨 움직씨 이름씨 움직씨 어찌씨 움직씨 이름씨 그림씨 그림씨 이름씨 그림씨 움직씨 이름씨
5039 1296 1719 33106 660 871 6133 2206 14945 851 649 1464 735 6858 1790 3561 2250 2196 12916 1500 4329 3451 1344 944 765 782 2017 1406 5620 723 3026 850 14452 808 2709 765 1142 1167 1577 1060 1451 2720 9580 755 1346 2807 2553 3388 725 2616 1543 1183 1221 1182 2583 4652 3809 7107 1144 2581 2064 1438 1946 4183 1192 946 5718 2006 1491 2347
149 30 80 1537 24 37 126 88 578 34 31 40 34 235 147 223 64 26 226 28 132 80 51 45 70 20 72 51 91 20 182 83 651 27 155 31 48 64 45 53 51 110 455 20 48 121 87 74 64 165 43 61 75 19 186 241 109 241 43 25 59 54 77 246 33 38 292 68 119 78
3 1 15 63 2 2 12 0 22 0 0 0 0 0 0 3 4 3 6 2 0 0 66 0 0 4 1 0 2 0 13 0 2 0 0 1 12 9 0 0 0 0 1 9 2 4 1 2 0 4 0 17 1 0 0 1 1 13 1 1 0 9 1 1 2 1 47 3 1 0
- 88 -
150 87 270 0 0 0 125 510 0 110 261 0 120 202 97 0 0 0 103 0 263 84 0 121 140 0 0 0 0 249 1337 251 558 0 3106 0 89 0 99 97 289 155 626 133 97 0 0 134 180 146 0 0 0 81 85 0 0 139 0 0 103 0 143 0 0 0 416 0 163 191
6 1 0 0 0 0 0 0 8 0 0 2 0 0 0 1 1 0 0 0 0 0 2 0 0 2 2 1 0 0 1 0 1 2 0 0 0 0 2 0 0 0 1 1 0 2 1 4 1 0 3 1 0 0 0 0 4 6 1 0 0 6 3 0 1 0 8 0 0 0
2 2 1 2 1 1 1
0 0 1 1 1 2
1
2 0 1 1 1 1 1 1 1
1
1 2 1 2 1 0 1 1
0 0 2 2 2 1
-2 -1 -3 -7 -1 -3 -6 -2 -8 -2 -1 -2
1 2 2 1 3 2 1 3 1 4 4 3
-3 -1 -1 -2 -7
4 3 1 3 1
-2 -3 -2 -2
4 4 * 2
-2 -7
3 1
-1 -3
3 2
-3
3
-3
3
-1 -3 -5
1 3 3
-1 -3 -3 -1 -4
* 3 2 4 2
-3 -1 -1 -2 -6 -1 -2 -1 -4
3 3 3 3 1 * 3 * 1
-3
3
-3 -3 -3 -5 -1 -8 -5
1 3 3 1 3 1 2
-1
4
0 2 1 1 0 2 1 0 1
2645 1834 2583 1028 3794 2289 516 1171 1675 3153 1414 960 1498 2013 2110 3324 3502 2881 1039 3907 3904 1182 1048 2126 575 534 257 115 432 14 3254 627 1240 1518 306 2034 413 2136 1608 52 283 3891 2379 2576 1690 1512 3084 554 802 885 242 2605 3444 4109 1099 315 2465 1161 4340 3810 3348 2449 605 1698 743 1037 3740 468 1311 4808
평균 평화 폭력 표 표시 표시하다 표정 표현 푸르다 푹 풀 풀다 풀리다 품다 풍기다 풍부하다 프로 피곤하다 피다 피로 피아노 피우다 피하다 피해 필요 필요하다 하고 하나 하늘 하다 하도 하루 하얗다 하여금 학교 학년 학생 학습 학자 한 한국 한글 한꺼번에 한두 한숨 한쪽 한창 한테 할머니 할아버지 함께 함부로 합치다 합하다 항상 해 해결 해방 핵 핵심 햇볕 햇빛 행동 행복 행위 행정 향기 향하다 허리 허옇다
이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 이름씨 그림씨 어찌씨 이름씨 움직씨 움직씨 움직씨 움직씨 그림씨 이름씨 그림씨 움직씨 이름씨 이름씨 움직씨 움직씨 이름씨 이름씨 그림씨 토씨 셈씨 이름씨 움직씨 어찌씨 이름씨 그림씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 매김씨 고유이름씨 이름씨 어찌씨 매김씨 이름씨 이름씨 이름씨 토씨 이름씨 이름씨 어찌씨 어찌씨 움직씨 움직씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 이름씨 그림씨
1432 2284 1481 4485 896 1746 9518 3815 2561 1153 3052 4818 2866 2032 1912 1076 1002 1286 4427 862 864 3778 4384 1899 8434 9115 17223 35970 11238 506485 1105 7528 3562 2818 14620 2002 11741 1887 2681 73296 15621 869 1656 1484 2530 2832 1179 8834 5806 5306 17827 1462 1027 804 4172 14298 1565 3842 752 890 1068 1580 7831 2513 6202 4430 915 10420 3322 650
46 89 34 106 78 29 221 261 177 28 198 198 66 108 60 36 13 23 214 51 18 116 140 98 641 229 348 853 551 15363 42 298 173 95 674 156 512 14 220 2969 446 65 57 56 89 93 60 216 263 276 739 37 54 25 255 389 83 212 14 47 39 84 256 334 280 60 83 333 101
5 0 0 52 1 0 0 0 1 1 17 3 0 0 0 0 0 0 30 0 1 4 6 0 2 0 29 17 28 1226 1 13 21 0 69 20 12 0 0 46 0 1 2 1 0 8 0 1 9 65 32 2 3 3 1 19 0 0 0 0 4 9 0 0 0 0 7 2 5 1
- 89 -
202 865 104 0 583 0 225 121 268 0 0 629 117 137 99 172 83 0 0 0 0 254 107 88 615 788 0 799 271 0 338 159 95 415 0 570 228 0 3514 0 0 0 0 0 0 0 0 190 0 864 0 98 0 0 0 487 398 185 111 0 0 282 248 97 110 0 355 191 0
0 0 0 4 0 1 0 0 3 0 2 0 0 0 0 0 0 1 0 1 1 1 0 0 3 0 8 4 4 0 0 2 0 0 21 0 12 0 4 0 6 0 0 0 1 0 3 7 2 1 1 2 0 0 1 0 0 2 0 2 0 0 0 0 0 0 0 0 0 0
0 1
1
1 2 0 1 2 1 1 0 1 1 2 1 0 1
2
2 2 2 1
2 1 2 1 1 2 2 1 1
2 2 2 1 1 1 2 0 1 0
0 1 2 0 0 1 1 2
-3 -1
3 2
-5 -1 -1 -4 -2 -3 -5 -1 -2 -2
1 3 3 3 3 2 3 2 3 3
-2 -4 -8 -6 -1 -6 -6 -3 -2 -1 -8 -1 -5 -5 -6 -3 -6 -6
4 1 1 1 3 2 2 4 4 4 1 1 1 1 1 3 1 1
-8 -2 -8 -1 -1 -6 -8 -5
1 1 1 * 3 1 1 1
-2 -2
2 4
-1 -2 -5 -7 -4 -3
* 1 1 1 1 4
-2 -5 -4
3 2 1
-2 -1
4 *
-2 -1 -3 -2 -1
2 2 3 * 4
-1 -1 -2
3 3 2
4726 4770 4316 2843 1630 3151 961 824 604 1727 718 4757 4277 1607 3352 2691 1136 1670 918 1522 4822 3045 2222 3613 1428 2631 998 450 617 3284 3317 3479 3014 1199 1421 3100 826 3996 3768 3085 4669 681 4830 1195 1697 216 1681 1401 2479 1068 3499 4782 684 2898 1081 1951 1500 3157 3485 1126 1534 2345 2206 1035 1626 3003 3335 305 3610 1134
허허 헌 헌병 헤매다 헤어지다 헤치다 혁명 현대 현실(現實) 현장 현재 협력 협조 형님 형상 형성 형식 형제 형태 형편 혜택 호기심 호랑이 호흡 혹시 혼란 혼자 혼자 화 화가 화장실(~室) 화학 확대 환경 환자 환하다 활동 활발하다 활짝 회담 회복하다 회사 회색(色) 회의 효과 후 훈련 훌륭하다 훔치다 훨씬 휘두르다 휴가 흐르다 흐름 흔들다 흔들리다 흔히 흘러가다 흘러내리다 흘리다 흙 흥미 흩어지다 희다 희망 희미하다 희생 힘 힘껏 힘들다
느낌씨 매김씨 이름씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 어찌씨 이름씨 어찌씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 이름씨 그림씨 어찌씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 그림씨 움직씨 어찌씨 움직씨 이름씨 움직씨 이름씨 움직씨 움직씨 어찌씨 움직씨 움직씨 움직씨 이름씨 이름씨 움직씨 그림씨 이름씨 그림씨 이름씨 이름씨 어찌씨 움직씨
666 659 758 1303 2636 1154 4815 5693 7835 2447 6427 661 767 2687 1067 1404 3947 2570 5072 2815 647 1198 1813 960 3014 1441 4626 10752 7663 1096 1078 1013 1220 3714 3034 1173 5684 832 904 1179 679 6890 646 3730 2515 20108 2542 3074 1553 4280 1003 656 6876 1276 4224 2104 2865 1152 1011 4024 2804 1695 1824 4442 2649 1225 1072 14675 961 3962
4 24 37 76 105 25 127 257 367 73 291 20 18 116 46 71 165 100 328 76 37 47 50 37 80 64 100 148 262 146 24 56 47 185 467 26 225 15 39 17 40 184 23 120 183 663 60 141 49 244 32 35 369 86 142 67 156 34 26 143 103 67 80 141 134 33 42 603 29 118
1 3 0 2 2 1 0 0 0 0 0 0 0 27 0 0 0 23 0 0 0 0 25 0 0 0 4 1 4 0 0 0 0 0 3 0 0 0 2 0 0 0 1 1 0 5 3 7 3 2 1 0 3 0 12 1 0 1 1 7 4 0 1 8 0 1 0 27 3 1
- 90 -
0 0 0 0 0 89 3350 237 390 130 240 0 179 0 320 125 349 0 222 152 0 83 0 0 0 0 0 0 0 0 0 174 231 232 96 0 543 80 0 116 0 83 0 0 126 0 83 123 0 192 0 0 337 132 80 0 89 0 0 230 107 0 0 267 192 0 125 1724 0 0
0 0 2 0 0 0 0 1 0 0 3 1 0 2 0 0 0 2 0 1 1 2 14 2 1 1 0 0 0 7 1 0 0 0 1 1 0 0 0 0 1 12 0 1 0 0 0 0 0 3 0 1 3 0 0 1 3 0 0 0 0 1 0 5 0 0 0 2 0 0
1
-2
3
-2 -6
3 2
-3 -4
4 3
-1 -3
3 3
0 1 1 0 2
-1 -2 -2 -2 -2
4 3 1 4 4
2 0 1 0
-4 -2 -2 -3 -1 -6
3 3 4 2 * 2
2 0 0 2
-4 -2
2 4
-2
4
-4 -4 -2 -2
3 2 3 4
-1
4
-8
1
-5 -3 -1 -1 -3 -4 -5
1 3 1 4 3 3 2
-5 -1
2 2
0 1
-2 -1 -2 -1
2 3 3 3
0 1 1 1
-2 -1 -1 -1
3 2 3 *
1
-2 -1 -1 -5 -1 -8
3 4 * 1 4 2
1 1 0 1 0 1 2
0 1 1 0 1 1 0
2 1 1 1 2 1 1 2 0 0 2
1
3457 힘쓰다 움직씨 1022 33 6 0 0 0 -1 4 3960 힘차다 그림씨 844 48 1 136 0 -2 4 ------------------------------------------------------------------------------------------------------------------------
6.3.2. 합집합의 어휘 분포
씨갈래
후보군 어휘 종수 고유이름씨 75
<표 27> “기초 어휘 후보군”과 검증 자료 간의 합집합의 어휘 분포 후보군 합집합 합집합 어휘 후보군 후보군 어휘 종수 어휘 종수 종수 비율 빈도수 빈도 비율 1.57% 3 0.06% 138,454 0.35%
그림씨
293
6.13%
176
3.68%
1,219,594
3.06%
합집합 빈도 30,318
합집합의 빈도 비율 0.08%
1,071,479
2.69%
느낌씨
27
0.56%
19
0.40%
72,696
0.18%
57,031
0.14%
대이름씨
47
0.98%
30
0.63%
1,158,178
2.91%
1,088,173
2.73%
도움풀이씨
35
0.73%
1
0.02%
997,878
2.51%
130,493
0.33%
매김씨
45
0.94%
25
0.52%
589,838
1.48%
489,820
1.23%
매인이름씨
140
2.93%
17
0.36%
1,512,002
3.80%
829,147
2.08%
셈씨
37
0.77%
27
0.56%
213,859
0.54%
176,044
0.44%
씨끝
250
5.23%
6
0.13%
8,964,677
22.52%
866,464
2.18%
어찌씨
381
7.97%
205
4.29%
1,620,176
4.07%
1,325,495
3.33%
움직씨
992
20.76%
584
12.22%
4,557,215
11.45%
4,011,557
10.08%
이름씨
2,311
48.36%
1,269
26.55%
7,550,057
18.97%
5,475,675
13.75%
토씨 합계
128 4,779
2.68% 100%
74 2,337
1.55% 48.90%
8,636,440 39,808,88 7
21.69% 100.00%
8,455,297 24,109,970
21.24% 60.56%
위의 표를 통해서 우리는, 기초 어휘 후보군에 속하면서, 검증 자료에서 1번 이상 출현하는 어휘가, 후보군 4,779개 중, 약 48.9%인 2,337개임을 알 수 있다. 즉, 기초 어휘 후보군 가운데에서 2,337개의 어휘는 비교적 다양한 검증 자료에서도 그 사 용을 확인할 수 있는 것이다. 특이한 것은, 이들 후보군의 약 48.9%의 어휘가 차지하는 빈도합은 60.56%에 달한다는 것이다. 즉, 비교적 높은 빈도에 속하는 어휘들이 여기에 속해 있을 개연성을 시사한다고 할 수 있다.
6.3.3. 합집합의 씨갈래별 어휘 비율 증감
- 91 -
씨갈래
<표 28> 합집합 어휘 종수의 씨갈래별 비율 증감 후보군 어휘 종수 합집합 어휘 종수 합집합어휘종수비 합집합 어휘 종수 비율
후보군 어휘 종수
고유이름씨
비율
율(합집합 대비)
(후보군 전체 대비)
75
1.57%
3
0.13%
그림씨
293
6.13%
176
7.53%
3.68%
느낌씨
27
0.56%
19
0.81%
0.40%
대이름씨
47
0.98%
30
1.28%
0.63%
도움풀이씨
35
0.73%
1
0.04%
0.02%
매김씨
45
0.94%
25
1.07%
0.52%
매인이름씨
0.06%
140
2.93%
17
0.73%
0.36%
셈씨
37
0.77%
27
1.16%
0.56%
씨끝
250
5.23%
6
0.26%
0.13%
어찌씨
381
7.97%
205
8.77%
4.29%
움직씨
992
20.76%
584
24.99%
12.22%
이름씨
2,311
48.36%
1,269
54.30%
26.55%
토씨 합계
128 4,779
2.68% 100.00%
74 2,337
3.17% 100.00%
1.55% 48.90%
씨갈래(품사)별로 볼 때에는, 위의 표에서 보듯이, “그림씨, 셈씨, 어찌씨, 움직씨, 이름씨” 등의 비율은 증가하고 있는 데 비 해, “고유이름씨, 도움풀이씨, 매인이름씨, 씨끝” 등은 감소하고 있다. 그러나 이러한 현상이, 어휘 사용 자체의 내적인 요인에 의한 것인지, 검증 자료로 사용한 자료에서의 어휘 항목 설정의 차이에 의한 것인지 속단하기는 어렵다. 예컨대, 『조선어 빈도수 사전』(1993)의 경우에는, 빈도 81 이상의 1,920개의 어휘 목록만을 취했는데, 이는 이 자료 전체 의 68.8%의 사용률에 해당한다. 또한 이 자료에는 “토”(토씨, 씨끝)는 별도로 처리되어 있어, 검증 자료에는 이들을 포함하지 아니하였다. 노마 히데키 교수의 『조선어 분류 기초 어휘집』(1998)에도 역시 실사만 다루고, 씨끝과 토씨는 빼고 있다. 기타 의 자료에서도 각기 다루는 범주가 서로 다른 경우가 많으므로, 위의 씨갈래별 증감에 관해서는 추후 면밀한 검증이 필요하 다.
6.3.4. 합집합의 어휘 종수의 분포와 일치도 한편, 기초 어휘 후보군의 어휘와 검증 자료와의 합집합에 속한, 검증 자료 각각의 어휘 종수는 다음의 표와 같이 나타난다. 이 표에서 우리는, 기초 어휘 후보군의 어휘와 검증 자료와의 합집합으로 추출된 2,337개가, 어떤 자료에 주로 나타나고 있는 가에 대한 경향을 알 수 있다. 아래의 표에서도 볼 수 있듯이, 합집합을 구성한 2,337개의 어휘에 대해 가장 높은 일치율을 보이는 자료는 단순한 어휘수 로 보면, 초중등 교과서이다. 2,337개의 합집합에 대해 1,674개의 어휘가 속한 것으로 나타나, 71.6%의 일치율을 보인다. 다음 으로는 『조선어빈도수 사전』인데, 1,079개가 일치하는 것으로 나타나, 46%의 일치율을 보이며,60 가장 낮은 일치도를 보인 것 이 한국어 교재로, 40.7%에 그치고 있다. 그런데 이러한 합집합 내에서의 일치도보다 중요한 것은, 각 개별 검증 자료 전체에 대한 비율이라 하겠다. 다시 말해 각 자료에 사용된 전체 어휘 중에서, 고빈도의 기초 어휘 후보군에 얼마나 많은 어휘 수가 속하는가의 여부는, 그 자료가 일반적 이고 자주 사용되는 어휘로 구성되어 있는지, 또는 그러한 어휘적 통제가 이루어지지 않고 있는지를 판단할 수 있는 중요한 60
) 다만, 앞에서도 언급한 바와 같이, 이 자료는 전체 자료가 아니라, 『조선어 빈도수 사전』의 빈도 중 약 68%의 사용률에 해당하는 자 료만을 사용하였다는 점에 문제가 없지 아니하다. 만일, “기초 어휘 후보군”과 같은 수준의 90%의 사용률까지로 범위를 일치시킨다면, 일치도는 당연히 높아질 것으로 예측된다. 그러나 이 연구에서의 목적은, 『조선어 빈도수 사전』 자체의 어휘 빈도의 타당성을 검증하 고자 하는 것이 아니라, “기초 어휘 후보군”의 어휘 선정의 타당성을 검증코자 하는 것이므로, 이는 추후의 과제로 남겨 둔다. 참고로, 『조선어 빈도수 사전』에서 빈도 점유율 90%에는, 빈도수 10까지의 10,844개의 어휘가 속해 있으며, 이는 전체 어휘수 39,369개의
- 92 -
요소라 할 수 있기 때문이다.61
<표 30> 교재 중복 출현 어휘 수의 분포
중복도
씨갈래
고유이름씨 그림씨 느낌씨 대이름씨 도움풀이씨 매김씨 매인이름씨 셈씨 씨끝 어찌씨 움직씨 이름씨 토씨 합계 자료 총 어휘수
후보군 어휘 종수 75 293 27 47 35 45 140 37 250 381 992 2,311 128 4,779
어휘 수
<표 29> 각 검증 자료별, 합집합에 속한 어휘 종수 8 97 합집합 전체 합집합x 합집합x <합집합x 어휘 종수 교과서 어휘 종수 조선어빈도수사전 어휘 7 한국어 교재130 종수> 6 어휘 종수 132 3 2 1 5 171 176 136 99 4 81 176 19 14 5 3 12 291 30 30 12 10 2 366 1 1 1 1 448 25 23 14 13 합계 1,811 17 6 14 3 27 23 8 15 6 6 2 205 153 97 80 584 497 287 216 1,269 709 542 499 74 73 20 2,337 1,674 1,079 952 9,836 1,920 1,827
이러한 관점에서 본다면, 위의 표에서 가장 높은 일치율을 보이는 초중등 교과서의 전체 어휘수에 대한 일치 어휘수의 비 율은 전혀 다른 결과를 보여 준다. 즉 합집합에 속한 1,674개의 어휘는 해당 자료 전체 어휘수의 고작 17%에 지나지 않는 것 이다. 이는 바로 이러한 교과서의 어휘 구성이 대규모 말뭉치의 무려 90%의 사용을 설명할 수 있는 고빈도 어휘보다는, 오히 려 저빈도의 어휘들로 구성되어 있음을 반영한다고 할 수 있다. 거꾸로, 합집합 어휘 종수에 대해 가장 낮은 어휘 일치도를 보이는 것으로 보이던 “한국어 교재”가, 해당 자료의 전체 어휘수 1,827개에 대해, 52.1%의 어휘가 고빈도 어휘로 구성된 것 으로 나타나, 일치도에 역전 현상이 나타난다. 『조선어 빈도수 사전』의 경우에는, 비교 대상이 된 어휘수 1,920개에 대해 합집합에 속한 어휘수가 약 56.2%를 차지하는 것으로 나타나 가장 높은 일치도를 보인다. 이는 연세 말뭉치 4,200만 어절을 대상으로 한 어휘 빈도 조사와, 약 100만 어절 을 대상으로 한『조선어 빈도수 사전』이 비록 조사 대상의 규모는 다르더라도, 실제 어휘 사용에 있어서는 거의 근접하고 있 음을 보여 준다 할 수 있을 것이다.
6.3.5. 어휘 중복도 검증 그런데 위에서 인용한 “한국어 교재”의 어휘 사용 빈도는 어떤 면에서는 다소 불완전한 자료라고 생각할 수 있다. 그것은 각 교재의 모든 어휘들을 망라하고 있지 않다는 문제점을 지닌다. 이 점을 해소하기 위하여, 앞의 6.2.1.에서 언급한 모두 8종 의 현행 주요 한국어 교재를 대상으로 하여 어휘의 사용, 즉 중복 출현도를 조사한 결과는 또다른 현상을 나타낸다. 이 표에서 우리는, 조사 대상이 된 현행 한국어 교재 8종에 모두 출현하는 어휘가 97개, 7개에 중복 출현하는 어휘수는 130개 등으로 나타나, 앞에서 살펴본 ‘합집합’의 목록과 일치하는 것이 1,811개의 어휘임을 알 수 있다.
27.54%에 해당한다. ) 다시 말하자면, 이 합집합에 속하지 않은 개별 자료의 어휘수가 얼마나 되는가에 따라서, 각 자료의 어휘 사용의 통제도를 알 수 있을 것이라는 것이다. 물론, 이것은 이 합집합이 타당하고, 아울러서 “기초 어휘 후보군”의 어휘 구성이 타당하다는 것을 전제로 한다. 이 점에 있어서는, 현재 이 작업을 하는 목적이 “기초 어휘 후보군”의 구성의 타당성 검증에 있으므로, 다소 궤를 벗어나기는 하지만, 이 들 자료의 타당성을 엿보는 것도, 우리가 이러한 작업을 하지 않으면 안될 명백한 이유를 보여 준다고 할 수 있다.
61
- 93 -
이와 같이, 8개 한국어 교재에서 추출된 모두 총 9,391개의 어휘 목록 가운데, 앞의 2,337개의 합집합에 속하는 어휘는 고 작 1,812개에 그쳐, 19.29%의 일치도를 나타낸다. 다시 말하자면, 조사 대상이 된 현재 국내의 주요 한국어 교육 기관에서 편 수되고 실제 사용되고 있는 교재의 어휘 대부분이 고빈도보다는 저빈도 어휘로 구성되어 있다는 것이다. 이것은 두 가지로 해석할 수 있다. 첫째로는, “기초 어휘 후보군”의 어휘들이, 일반적인 한국어 사용을 드러낼 목적으로 구축된 말뭉치를 반영하고 있다는 점 에서, 외국어로서의 한국어를 학습하는 학습자들의 언어 사용 환경과는 다를 수 있다는 생각을 해 볼 수 있다. 둘째로는, 그야말로 비판적으로 본다면, 조사 대상이 된 한국어 교재의 어휘 사용과 구성이 불합리하게 되어 있다고도 볼 수 있다는 것이다. 다시 말하자면, 한국어 교재의 81.58%에 해당하는 어휘가 고빈도 어휘가 아니라, 저빈도 어휘로 채워져 있 다는 현실을 반영하고 있을 가능성도 적지 않다는 것이다.
6.3.6. 교육용 말뭉치의 어휘 빈도 바로 여기에서 이미 앞장에서 제안한 “외국어로서의 한국어 교육을 위한 <교육용 말뭉치>”의 어휘 사용의 실제와 대비할 필요가 대두되는 것이다. 이미 앞서 소개하고 어휘 종수의 증가율을 분석한 바 있는, 교육용 말뭉치 약 100만 어절을 대상으 로 한 어휘 빈도표와 “기초 어휘 후보군”의 어휘 목록과는 과연 어느 정도의 일치도를 나타낼 것인가? 한국어 교육용 말뭉치(약 100만 어절)은 한국어 교육을 위한 특별한 고안을 하고 있다. 만일 이러한 자료에서의 어휘 빈도 가 연세 말뭉치 전체의 어휘 빈도와 어느 정도 일치하는가가 매우 중요한 검증 기준이 될 것이다. 6.3.1.의 합집합의 어휘 목록에도 표시된 바와 같이, 합집합에 속한 어휘 2,337개의 어휘 중에서, 교육용 말뭉치에서 확인 되지 않은 것은 “침착하다(그림씨), 허옇다(그림씨)”의 단 2개에 불과하다. 이들은 각기 연세 말뭉치의 빈도 순위 4640, 4808 위에 해당되어, 합집합의 어휘 가운데에서는 상대적으로 낮은 빈도에 속하는 어휘이다.
6.3.7. 어휘의 중요도 검증 다음은, 노마 히데키 교수의 『조선어 분류 기초 어휘집』(1998)에서의 중요도 분류에 따른, 합집합과의 일치도를 보인 것 이다. 여기서 중요도 표시는 2(최중요어), 1(중요어), 0(일반어)로 되어 있다. <표 31> 『조선어 분류 기초 어휘집』과의 일치도
중요도 0 1 2 합계
어휘 종수 247 685 524 1,456
빈도 685,727 3,011,250 8,179,698 11,876,675
빈도비율 5.77% 25.35% 68.88%
여기서도 알 수 있듯이, 이 자료에서 합집합에 포함된 어휘수는 1,456개로 나타나, 해당 자료의 전체 어휘수 5,535개 중의 33.53%의 일치도를 보인다. 그러나 최중요어로 선정된 중요도 2의 어휘가 합집합에 속한 어휘의 69% 가량이 된다는 점에서, 이 자료의 중요도는 상당히 신뢰할 수 있음을 시사한다.
6.4. 검증 자료와 기초 어휘의 교집합 이제, “기초 어휘 후보군” 중에서, “교과서, 조선어 빈도수사전, 한국어 교재” 모두에 중복되어 나온 어휘 목록을 교집합으로 하여 살펴보기로 하자. 아래의 ID는 연세 말뭉치를 대상으로 한 어휘 빈도 조사표(서상규 1998 참조)에서의 표제어 고유 번
- 94 -
호를, ①은 연세 말뭉치에서의 사용 빈도를, ②는 초중등 교과서의 어휘 빈도 총합을, ③은 『조선어 빈도수 사전』(1993)에서 의 빈도수를, -----------------------------------------------------------------------------------------------------------------------ID 어휘 품사 ①빈도 ②교과서 ③빈도사전 ④한국어A ⑤분류어휘집 ⑥교재 등급 ⑥교재 중복도 -----------------------------------------------------------------------------------------------------------------------862 가깝다 그림씨 5438 5 156 53 2 1 -8 1510 가끔 어찌씨 2839 6 83 41 2 1 -4 976 가르치다(敎) 움직씨 4756 5 121 78 2 1 -6 335 가슴 이름씨 13881 5 740 15 2 2 -3 951 가운데 이름씨 4885 7 399 63 2 2 -4 1273 가을 이름씨 3452 15 190 5 2 1 -7 289 가장 어찌씨 15263 38 484 10 2 2 -4 1051 값 이름씨 4375 6 264 4 2 1 -7 356 갖다 움직씨 13151 20 88 6 1 2 -5 44 같다 그림씨 90935 133 6324 2 2 1 -5 361 거기 대이름씨 12983 1 352 4 2 1003 걱정 이름씨 4610 10 192 5 2 2 -5 2019 건강 이름씨 2019 3 82 9 2 2 -3 624 걸리다 움직씨 7600 11 98 1 1 -7 1293 검다 그림씨 3383 3 176 4 1 3 -1 1098 겨우 어찌씨 4175 2 127 4 1 3 -4 1050 겨울 이름씨 4379 10 179 16 2 1 -5 2205 계시다 움직씨 1824 14 273 9 1885 고기 이름씨 2207 6 161 32 2 1 -6 1197 고맙다 그림씨 3721 24 96 1 2 1 -5 369 곧 어찌씨 12871 6 261 5 2 2 -5 1067 공부 이름씨 4282 20 150 1 2 1 -2 395 교육 이름씨 12161 1 499 2 1 3 -2 2909 굶다 움직씨 1267 1 87 11 1 2 -5 440 그 매김씨 11081 67 4549 12 2 1 -7 58 그것 대이름씨 67895 14 1111 3 2 1 -7 507 그대로 어찌씨 9641 1 345 4 1 3 -1 564 그래 느낌씨 8672 26 399 4 1 2 -4 638 그래도 어찌씨 7414 5 85 1 1 3 -2 59 그러나 어찌씨 67427 37 1358 1 1 1 -2 1516 그러니 어찌씨 2821 3 121 13 0 180 그러다 움직씨 23040 1 3317 2 2 698 그림 이름씨 6718 74 218 2 2 1 -7 901 그만 어찌씨 5178 5 221 3 1 2 -3 1463 그치다 움직씨 2938 1 91 1 0 2 -2 글자 이름씨 1715 3 86 7 0 2 -3 2320 2112 급하다 그림씨 1910 2 112 1 0 2 -4 353 기다리다 움직씨 13237 14 358 2 2 1 -7 1460 기록 이름씨 2942 8 96 1 0 4 -2 2925 기름 이름씨 1263 1 163 2 2 2 -4 기분 이름씨 8053 2 271 1 2 2 -7 592 2017 기쁘다 그림씨 2024 18 213 7 2 2 -5 574 길다 그림씨 8441 19 311 2 2 1 -5 2008 깨끗하다 그림씨 2035 7 122 1 2 1 -6 841 꺼내다 움직씨 5559 6 312 1 1 3 -4 2564 꼬리 이름씨 1490 4 86 7 1 3 -3 518 꼭 어찌씨 9487 23 332 6 2 2 -6 690 꽃 이름씨 6785 31 499 15 2 1 -7 646 꿈 이름씨 7254 2 250 15 2 2 -3 2553 끄다 움직씨 1498 4 213 20 2 1 -6 561 끝나다 움직씨 8689 17 264 17 1 -7 930 끼다 움직씨 4995 4 123 4 0 2 -4 194 나가다 움직씨 21763 29 1565 5 2 1 -8 126 나다 움직씨 32749 62 1794 13 2 -4 나라 이름씨 20850 86 3194 9 2 1 -7 205 529 나무 이름씨 9234 78 927 1 2 1 -5 1074 나쁘다 그림씨 4261 12 116 45 2 1 -8 105 나오다 움직씨 37597 47 1491 4 2 1 -7 706 나이 이름씨 6627 11 197 1 2 1 -5 847 나타내다 움직씨 5529 22 165 3
- 95 -
2300 1206 399 1582 1488 990 1574 997 295 1383 291 375 1033 651 1700 909 591 170 243 632 752 870 446 118 108 1564 1906 2393 724 943 72 545 1233 1827 920 212 581 634 582 464 1731 372 1062 1045 2401 2474 633 1009 269 222 341 1231 1843 2621 1282 351 444 91 671 383 563 448 149 218 495 123 342 71 1464 1159
낡다 남기다 남다 낮 낮다 낳다 내놓다 내려가다 내리다 내밀다 너 너무 넓다 넘다 논 놀다 높다 놓다 누구 눈물 눕다 늘 다니다 다르다 다시 닦다 단위 달려오다 담배 대통령 대하다 대학 대회 덮다 데리다 돈 돌 돌다 돌리다 돌아가다 돌아보다 돌아오다 돕다 동생 돼지 두드리다 둘 드리다 듣다 들어가다 들어오다 들이다 따뜻하다 따라가다 땀 떠나다 떨어지다 또 뛰다 뜻 마시다 마을 마음 만나다 만큼 많다 많이 말하다 맑다 맛
그림씨 움직씨 움직씨 이름씨 그림씨 움직씨 움직씨 움직씨 움직씨 움직씨 대이름씨 어찌씨 그림씨 움직씨 이름씨 움직씨 그림씨 움직씨 대이름씨 이름씨 움직씨 어찌씨 움직씨 그림씨 어찌씨 움직씨 이름씨 움직씨 이름씨 이름씨 움직씨 이름씨 이름씨 움직씨 움직씨 이름씨 이름씨 움직씨 움직씨 움직씨 움직씨 움직씨 움직씨 이름씨 이름씨 움직씨 셈씨 움직씨 움직씨 움직씨 움직씨 움직씨 그림씨 움직씨 이름씨 움직씨 움직씨 어찌씨 움직씨 이름씨 움직씨 이름씨 이름씨 움직씨 매인이름씨 그림씨 어찌씨 움직씨 그림씨 이름씨
1736 3694 12107 2718 2884 4656 2727 4639 15061 3097 15234 12675 4450 7187 2500 5120 8058 24247 17751 7501 6161 5393 10905 34892 37406 2745 2177 1642 6354 4928 52735 8915 3588 2292 5055 20372 8263 7465 8253 10482 2438 12799 4312 4396 1631 1556 7476 4588 16353 19681 13771 3595 2265 1449 3428 13275 10971 45002 6992 12436 8684 10816 27202 19833 9835 33779 13696 53041 2938 3845
1 1 12 4 8 7 3 16 30 3 38 5 14 1 28 67 14 58 24 3 2 1 14 43 39 1 18 7 1 3 52 1 3 1 15 34 12 8 4 11 4 34 38 37 10 1 12 20 65 24 20 11 7 4 6 3 22 132 26 2 3 81 15 13 7 87 49 98 4 8
205 136 368 145 180 173 296 195 871 189 483 164 286 319 119 181 971 1652 1282 98 159 298 490 1254 1190 136 197 89 181 98 2741 231 106 176 182 172 115 487 718 317 274 330 134 160 94 92 192 272 596 778 417 289 111 87 216 702 394 1330 304 399 117 470 1227 594 177 1472 494 1159 134 138
- 96 -
3 4 1 14 12 26 8 1 1 6 1 7 23 9 1 1 2 2 1 6 6 5 4 7 3 3 5 4 1 3 1 2 1 4 1 2 3 2 5 1 23 5 1 9 15 5 10 13 10 19 4 9 7 3 8 4 8 12 12 10 8 20 13 4 6 7 1 9 6 6
4 2 2 1 1 3 3 2 1 4 1 1 1 3 4 1 1 2 1 2 2 3 1 1 1 2
-1 -4 -6 -5 -4 -2 -1 -1 -8 -1 -4 -7 -8 -3 -2 -8 -7 -7 -8 -3 -4 -3 -5 -7 -6 -6
2 1 3 3 1 3 3 3 1 1 2 2 1
-1 -8 -3 -2 -2 -3 -2 -3 -7 -1 -3 -3 -5
1 1 1 2 2 1 1 1 1 1
-5 -7 -8 -2 -2 -3 -7 -7 -6 -6
2
1
-6
1 2 2 2 2 2 2 1 2 2
2 1 2 1 2 2 1 3 2 1 3 1 1 1 2 1
-2 -5 -5 -6 -1 -4 -8 -1 -8 -8 -2 -7 -6 -6 -6 -4
1 2 2 2 0 2 0 2 2 2 2 2 2 2 2 1
2 2 2 2
1 1 1 2 1 2 2 2 2 1 2 0 2 1 2 2 2 2
2 2 1 2
282 165 445 779 1001 87 1485 186 1191 215 147 228 1507 1036 544 1019 714 1239 272 1246 1358 2124 1044 101 689 807 219 181 621 4650 867 412 113 1831 1137 3540 314 782 1543 2654 685 1586 737 1879 1090 696 1444 848 1661 271 35 438 1557 940 334 104 1855 818 1365 1451 120 380 835 172 3865 424 1655 276 608 3339
머리 먹다 먼저 멀다 며칠 모르다 모시다 몸 몹시 못 문제 물 미안하다 밀다 밑 바꾸다 바다 바닥 바로 바쁘다 바위 반갑다 반드시 받다 밥 배우다 백 버리다 벌써 벗 변하다 보내다 보이다 복잡하다 봄 부럽다 부르다 부분 부엌 부탁 불다 붉다 붙이다 비밀 비하다 빛 빠르다 빨리 뿌리 사다 사람 사랑 사무실 사진 산 살다 살리다 새 새로 색 생각 생기다 생명 서다 섞다 선생님 설명 세상 세우다 소나무
이름씨 움직씨 어찌씨 그림씨 이름씨 움직씨 움직씨 이름씨 어찌씨 어찌씨 이름씨 이름씨 그림씨 움직씨 이름씨 움직씨 이름씨 이름씨 어찌씨 그림씨 이름씨 그림씨 어찌씨 움직씨 이름씨 움직씨 셈씨 움직씨 어찌씨 이름씨 움직씨 움직씨 움직씨 그림씨 이름씨 그림씨 움직씨 이름씨 이름씨 이름씨 움직씨 그림씨 움직씨 이름씨 움직씨 이름씨 그림씨 어찌씨 이름씨 움직씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 움직씨 매김씨 어찌씨 이름씨 이름씨 움직씨 이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 움직씨 이름씨
15630 24796 10939 5940 4615 47150 2889 22616 3751 20167 27511 18980 2854 4438 8953 4535 6537 3562 16123 3537 3174 1899 4404 38934 6787 5787 19765 22925 7614 682 5401 11741 36493 2287 3946 989 14324 5898 2780 1425 6866 2711 6231 2216 4192 6733 2978 5525 2592 16192 134868 11100 2759 4947 13883 37601 2248 5723 3155 2962 34054 12515 5632 23832 875 11491 2604 15892 7797 1070
12 104 41 9 16 17 8 9 2 20 3 78 2 14 7 12 15 1 5 11 7 7 1 27 9 5 10 9 10 1 8 34 47 2 8 2 41 12 2 1 25 3 22 2 2 9 11 28 6 34 261 1 1 4 41 72 3 18 19 8 46 16 1 8 3 90 1 4 16 2
1026 898 420 295 226 1199 228 747 263 1516 1356 791 96 240 831 104 278 219 380 82 83 127 155 1038 181 277 92 364 242 83 227 593 540 163 482 81 593 120 88 99 269 226 231 104 159 718 161 571 264 134 3823 518 95 177 123 658 100 446 160 134 199 560 231 1332 103 146 176 134 363 83
- 97 -
9 16 1 3 15 2 6 3 3 10 6 6 14 4 3 4 4 8 3 1 3 12 2 4 1 6 3 3 3 1 270 1 10 1 3 1 8 1 6 5 1 1 1 6 2 1 1 6 2 3 2 5 2 1 3 1 2 2 1 1 1 2 1 1 1 2 1 1 1 2
2 2 2 2 2
2
2 1 2 2 2 1 2 2 1 2 2 2 2 2 2 1 1 1 2 2 2 2 1 2 2 1 1 2 1 1 2 2 2 2 2 2 2 2 2
0 2 0 2
2 2 2 1
1 1 1 1 1 1 2 1 1 4 1 1 1 2 1 1 1 2 1 1 * 1 2 1 1 1 1 2 1 * 2 1 2 1 1 2 1 4 1 2 1 4 2 3 3 3 1 1 3 1 1 1 1 1 1 1 2 1 3 1 1 2 3 1 3
-7 -8 -5 -6 -7 -8 -4 -6 -3 -1 -3 -6 -5 -3 -4 -7 -7 -2 -6 -8 -2 -6 -2 -8 -7 -7 -4 -7 -7 -1 -5 -5 -7 -7 -7 -5 -5 -3 -4 -1 -5 -1 -4 -4 -2 -1 -6 -7 -2 -8 -8 -3 -7 -7 -7 -7 -2 -3 -3 -8 -5 -3 -3 -5 -1
1
-1
2 3
-3 -1
861 96 1153 1347 964 1565 843 573 1387 2376 2426 746 1593 2551 801 1132 641 1073 1566 1683 1274 40 505 559 738 625 161 1340 469 856 1145 174 60 1078 116 3310 1420 173 962 466 156 1178 902 131 2818 1287 449 465 26 230 284 1289 441 2797 363 501 803 261 491 1229 800 965 555 929 509 447 1585 688 336 3259
소년 소리 소식 손가락 손님 숲 쉬다 쉽다 시골 시원하다 시작 시키다 시험 신다 싫다 심하다 싶다 싸우다 쌀 쏟아지다 아까 아니다 아들 아래 아름답다 아마 아버지 아주머니 아침 아프다 안다 앉다 알다 알리다 앞 야단(惹端) 약속 어느 어떠하다 어렵다 어머니 어찌 언제 얼굴 얼다 얼른 얼마나 엄마 없다 여기 여러 여름 역시 연습 열다 옆 옛날 오늘 오르다 오빠 올라가다 옮기다 옷 외 운동 울다 울음 움직이다 웃다 웬
이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 그림씨 이름씨 그림씨 이름씨 움직씨 이름씨 움직씨 그림씨 그림씨 그림씨 움직씨 이름씨 움직씨 어찌씨 잡음씨 이름씨 이름씨 그림씨 어찌씨 이름씨 이름씨 이름씨 그림씨 움직씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 매김씨 그림씨 그림씨 이름씨 어찌씨 어찌씨 이름씨 움직씨 어찌씨 어찌씨 이름씨 그림씨 대이름씨 매김씨 이름씨 어찌씨 이름씨 움직씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 움직씨 이름씨 움직씨 움직씨 매김씨
5440 41609 3885 3221 4810 2741 5556 8472 3095 1659 1604 6180 2701 1499 5817 3983 7371 4262 2740 2537 3452 102336 9657 8701 6228 7578 25799 3243 10390 5471 3913 23662 66535 4255 35465 1083 3035 23731 4814 10434 26213 3788 5174 30552 1320 3408 10757 10462 180527 18938 15582 3404 11024 1332 12964 9734 5805 16917 9895 3613 5824 4809 8822 4996 9585 10856 2712 6796 13843 1104
3 41 14 7 8 4 12 3 5 4 6 4 1 9 9 2 28 13 4 1 1 27 6 6 11 3 84 23 19 11 2 18 51 9 37 3 3 65 21 4 98 4 4 18 1 16 15 17 72 7 122 19 1 1 9 20 12 50 8 14 16 6 28 4 14 22 2 33 35 1
160 252 87 80 157 147 137 185 88 91 871 1313 117 93 177 152 952 643 109 86 94 2908 356 323 334 133 541 124 445 184 427 792 2033 174 1781 81 90 359 518 406 754 165 160 776 105 94 226 81 5645 792 1277 174 255 143 296 365 803 1281 763 219 183 337 303 281 1059 392 88 297 521 162
- 98 -
1 1 1 3 18 1 1 1 1 1 1 1 3 1 17 39 5 16 1 4 2 7 24 14 2 11 6 6 19 3 4 2 1 2 21 21 3 13 1 5 1 5 12 26 4 4 3 8 5 3 19 3 25 5 3 6 5 7 5 3 1 5 7 2 1 1 6 3 7 2
1 2
2 2 2 1 2 2 1 2 1 2 2 1 2 1 2 2 2 2 2 2 2 2 2 1 2 2 1 2 1 2 2 1 2 2 0 2 1 1 1 2 2 2 1 1 2 2 1 2 2 2 1 1 1 1 2 2 2 0
4 1 2
-1 -5 -6
1 3 1 1 1 1 1 1 1 1 1 2
-7 -2 -8 -7 -5 -1 -1 -7 -6 -7 -4 -6
2 3 4 2 1 1 1 1 2 1 1 1 1 3 1 1 2 1
-5 -2 -3 -5 -7 -7 -5 -5 -4 -8 -4 -8 -8 -4 -7 -7 -5 -8
1 1 1 1 1 3
-7 -7 -1 -8 -8 -1
1 2 2 1 * 1 1 1 1 3 1 1 1 2 1 2 1 1 2 1
-6 -3 -5 -5 -1 -7 -2 -4 -7 -5 -3 -6 -8 -3 -8 -3 -7 -4 -3 -8
1 1 3 3 1 3
-7 -4 -1 -3 -6 -3
1016 1238 200 722 613 405 598 277 2761 280 986 478 275 493 794 2139 1616 894 626 1261 2033 523 536 279 1470 301 663 765 1083 639 1804 364 1572 1348 114 1487 1140 177 845 1286 828 549 244 842 540 1701 1839 83 1418 1342 2802 217 514 1660 1400 1304 3560 1738 2820 357 1253 922 2856 1426 307 510 4325 1291 662 2092
음악 의견 이것 이다 이루다 이름 이번 이야기 익다 일어나다 일하다 읽 입 입다 잊다 잎 자 자꾸 자다 자동차 작년 작다 잠 잡다 재미 저 저녁 전쟁 전하다 젊다 점심(點心) 정신 조용하다 종이 좋다 주로 주위 죽다 죽이다 준비 중심 중요하다 지나다 지내다 지키다 짐 짐승 집 짧다 찍다 차다 찾다 책 책상 천천히 첫 체육 춤 치료 친구 칼 코 콩 통일 통하다 특히 튼튼하다 틈 팔다(賣) 펴다
이름씨 이름씨 대이름씨 움직씨 움직씨 이름씨 이름씨 이름씨 움직씨 움직씨 움직씨 움직씨 이름씨 움직씨 움직씨 이름씨 느낌씨 어찌씨 움직씨 이름씨 이름씨 그림씨 이름씨 움직씨 이름씨 매김씨 이름씨 이름씨 움직씨 그림씨 이름씨 이름씨 그림씨 이름씨 그림씨 어찌씨 이름씨 움직씨 움직씨 이름씨 이름씨 그림씨 움직씨 움직씨 움직씨 이름씨 이름씨 이름씨 그림씨 움직씨 그림씨 움직씨 이름씨 이름씨 어찌씨 매김씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 이름씨 움직씨 어찌씨 그림씨 이름씨 움직씨 움직씨
4558 3568 21046 6368 7688 11971 7965 15869 1354 15688 4693 10174 15942 9852 5834 1884 2667 5223 7558 3488 2002 9336 9095 15729 2921 14885 7091 6074 4214 7414 2323 12963 2730 3214 36103 2885 3937 23322 5549 3413 5669 8874 17738 5557 8969 2500 2278 49294 3043 3241 1329 19926 9541 2596 3079 3340 982 2424 1319 13116 3522 5039 1296 3026 14452 9580 755 3388 7107 1946
1 1 27 13 3 10 9 114 7 20 25 79 7 14 5 18 6 5 25 17 4 31 7 25 1 4 10 2 11 2 54 7 2 29 53 2 3 3 3 5 2 1 20 16 19 4 18 151 4 7 5 46 30 24 5 1 1 8 2 8 7 3 1 13 2 1 9 2 13 1
90 127 513 218 601 443 106 810 90 320 193 206 252 855 244 124 161 156 294 265 84 539 327 1054 106 1383 391 705 320 351 121 532 149 164 1390 108 88 712 110 564 442 1606 907 168 424 195 81 1558 152 144 104 993 271 168 124 558 116 89 126 227 154 150 87 1337 558 626 133 134 139 143
- 99 -
22 3 5 2 1 1 2 2 8 2 1 1 6 2 9 1 1 1 1 3 4 7 11 7 8 16 1 1 3 2 2 2 2 5 2 9 2 3 15 4 2 1 10 3 2 11 1 1 4 2 5 5 3 2 3 11 1 1 1 8 2 1 3 1 15 2 2 3 22 1
2 1 2 0 1 2 1 2 1 2 2 2 2 1 2 1 2 2
0 2 1 2 2 1 2 2 2 2 2 1 1 2 1 2 2 1 1 2 1 2 2
1 2 1 2 1 1 1 0 2 2 2 1 1 2 1 1 2 2
1 4 1 1 3 1 1 1 4 1 1 1 1 1 2 1 2 2 1 1 1 1 1 2 1 1 1 4 2 2
-7 -1 -8 -3 -2 -8 -6 -5 -1 -7 -6 -8 -2 -8 -4 -3 -3 -4 -7 -7 -8 -7 -6 -7 -2 -6 -7 -2 -4 -3
3 1 1 1 3 3 2 2 2 4 2 2 1 2 2 4 1 1 1 2 1 1 1 1
-4 -7 -8 -7 -3 -2 -4 -2 -4 -1 -5 -4 -5 -6 -5 -1 -8 -6 -6 -4 -8 -8 -8 -7
2 2 1 1 1 2 3 3 3 2 3
-5 -2 -8 -3 -2 -1 -3 -3 -3 -3 -3
3
-3
820 1675 1182 575 115 432 627 306 413 802 242 1421 1068 684 1035 305
편지 푸르다 피우다 필요 하나 하늘 하루 학교 학생 할머니 함께 환자 훨씬 흐르다 희다 힘
이름씨 그림씨 움직씨 이름씨 셈씨 이름씨 이름씨 이름씨 이름씨 이름씨 어찌씨 이름씨 어찌씨 움직씨 그림씨 이름씨
5718 2561 3778 8434 35970 11238 7528 14620 11741 5806 17827 3034 4280 6876 4442 14675
47 1 4 2 17 28 13 69 12 9 32 3 2 3 8 27
416 268 254 615 799 271 338 415 570 190 864 96 192 337 267 1724
3 2 5 3 1 1 4 1 2 1 1 1 4 1 1 33
2 2 1 2 2 2 2 2 2 2 1 2 2
1 2 2 4 1 1 1 1 1 1 1 2 2 2
-8 -3 -6 -1 -5 -5 -6 -8 -8 -5 -4 -4 -5 -1
1
-5
------------------------------------------------------------------------------------------------------6.5. 합집합과 교집합의 어휘 분포
“기초 어휘 후보군”(상위 90% 이상) 중 합집합 어휘의 어휘 종수 분포 상위90% 어휘 중 합집합 어휘의 어휘 종수 비율 상위90% 어휘 중 교집합 어휘의 어휘 종수 비율 상위90% 어휘 중 합집합x교과서 어휘의 어휘종수비율 상위90% 어휘 중 합집합x한국어교재 어휘의 어휘종수비율
48.90% 7.45% 35.03% 19.92%
“기초 어휘 후보군”(상위 90% 이상) 중 합집합 어휘의 빈도수 분포 상위90%어휘중 합집합 어휘의 빈도 비율 상위90%어휘중 교집합 어휘의 빈도 비율 상위90%어휘중 합집합x교과서 어휘의 빈도 비율 상위90%어휘중 합집합x한국어교재 어휘의 빈도 비율
60.56% 9.88% 55.50% 31.12%
- 100 -
7. 외국어로서의 한국어 교육을 위한 기초 어휘 의미 빈도
최근 전산 기술의 발달과 더불어 여러 연구기관과 연구자들 사이에 언어 연구의 한 방법으로 언어에 대한 계량적 분석이 시도되고 있다. 특히 실제 언어 사용에 기반한 말뭉치를 구성하고 그 말뭉치에서 낱말이 쓰인 빈도를 조사하는 작업이 이루 어져 왔다. 이러한 작업들 중에는 단순히 개별 낱말의 빈도를 조사하는 차원에서 그치지 않고 이를 바탕으로 새로운 결과물 을 이끌어낸 작업도 있다.62 그런데, 단지 그 어휘의 사용 빈도만으로는 결코 파악할 수 없는 많은 것들이 개별 어휘의 사용에 존재한다. 어떤 한 어휘 는 홀로 쓰이는 것이 아니라 다른 것들과 밀접한 관계를 맺으면서, 어떤 상황이나 문장에서 사용된다. 사전에서 볼 수 있는 개별 어휘의 여러 가지 다양한 의미들은 바로 이러한 관계에서 파악되는 것이라 하겠다. 그러므로 개별 어휘의 특성을 밝히 기 위해서는 어휘의 사용 빈도를 넘어서 실제 그 어휘가 사용된 문장이나 상황과 함께 연구되어야 한다. 이 글에서는 기존의 어휘 사용 빈도에 대한 조사를 바탕으로 한, ‘한국어 교육을 위한 기초 어휘 선정’을 위한 작업의 일환 으로 수행된, 어휘 의미 빈도 조사의 방법론과 그 응용의 실제를 소개하기로 한다. 어떤 한 어휘의 사용 빈도란 것은 결국 그 어휘가 뜻하는 여러 가지 의미들로 사용된 현상들의 총합이라고 하겠다. 따라서 어휘 의미의 빈도에 대한 조사는 결국 그 어 휘의 사용 빈도의 실제적 양상을 밝히는 작업이 된다. 이는 단순히 한 어휘가 뜻하는 의미들의 빈도만을 보여 주는 것이 아니 라, 그 어휘와 함께 쓰이는 다른 어휘들과의 관계도, 예를 들어 풀이씨의 경우 격틀(논항 구조)을, 임자씨의 경우 문장성분을, 보여 준다. 이러한 의미 별 빈도로 대표되는 통계적인 사실은, (한)국어 교육에서만이 아니라, (전자) 사전 편찬이나, 기계 번역, 문법 연구 등의 여러 관련 분야에서 활용될 수 있는 기초 자료가 될 뿐만 아니라, 그 통계적 특성을 통해 한국어 실제적 양상 을 더 깊이 이해할 수 있도록 한다.
7.1. 선행 연구 기존의 계량적 연구는 대체적으로 개별 형태의 ‘형태적 특징’을 중심으로 이루어졌다. 그러므로 기존의 빈도 조사는 동형어 를 구별하지 못하는 한계를 가지고 있다.63 이러한 한계는 조사 대상 어휘의 의미를 고려할 때만이 해결될 수 있다. 그러나 지금까지 이루어진 빈도 조사는 의미에 대한 부분이 포함되지 않았다. 이는 외국의 경우에도 비슷한 듯하여, 국내에서 찾을 수 있는 의미 빈도에 대한 조사는 A General Service List of English Words: with Semantic Frequencies and a Supplementary Word-list for the Writing of Popular Science and Technology(Longman, 1953(36))이, 논문을 포함하여, 유일한 것 같다. 이것은 외국어로서 영어를 배우려는 학습자와 이들을 가르치는 교사를 대상으로 한 사전으로서, 500만 단어 수준의 글말 말뭉치에서 개별 어휘의 사용 수와 그 어휘의 각 의미 항목 별 빈도를 밝히고 있다. 여기에 실려 있는 어휘들은 사용 빈도와 더불어, 학습의 용이성, 필수성(preserve-canning, freezing, bottling), 대체 표현의 수, 문체, 강조나 감정적 의미, 등과 같은 몇 가지를 고려해 2000개를 싣고 있다. 그리고 이 사전에서 의미 별 빈도를 셈하는 기준은 Oxford English Dictionary를 기반으로 하여, Oxford English Dictionary의 의미 분류에 따라 의미 빈도를 표시하고 있다.
7.2. 어휘 의미 빈도 조사를 위한 요소 7.2.1. 대상 어휘와 기반 사전의 선정 어휘 의미 빈도 조사를 위한 대상 어휘의 선정은, ‘연세말뭉치 1-9(4300만 어절)’에 대해서 빈도 조사가 이루어진, 서상규
62
) 『연세한국어사전』이 그 대표적인 예이다. ) 이 연구에서 기반으로 하고 있는 서상규(1998)의 ‘“현대 한국어 기본 어휘 후보 목록-일반 어휘 편-,” 연세대학교 언어정보개발연구 원 내부 보고서 CLID-WP-98-09-11(1998)’에서는 일부 어휘(풀이씨)에 대해서 동형어의 구별이 되어 있다.
63
- 101 -
(1998)의 ‘“현대 한국어 기본 어휘 후보 목록-일반 어휘 편-,” 연세대학교 언어정보개발연구원 내부 보고서 CLID-WP-98-09-11(1998)’를 기반으로 하였다. 이 보고서는 빈도 7 이상의 어휘 64,666개를 싣고 있는데, 이 중에서 문법 형태소(토씨, 씨끝)를 제외한 상위 빈도의 실질 어휘 500 낱말을 선정하였다. 이는 실질 어휘 중 최상위 빈도의 ‘하다’(움직씨, 506,485번, 2.0746%)부터 500번째 낱말인 ‘관’(이름씨, 7,110번, 0.0291%)까지로서, 전체 낱말 중 53.4746%의 (누적) 빈도를 보인다. 이들 어휘는 교육용 말뭉치(100만)에서, 각기 ‘하다’가 30,271번, ‘관’이 98번의 사용 빈도를 보이고 있다. 이를 품사 별로 정리하면, 이름씨 224개, 매인이름씨 40개, 움직씨 103개, 그림씨 23개, 도움풀이씨 18개, 어찌씨 54개, 매김씨 15개, 느 낌씨 3개로, 모두 500개이다. 대상 어휘에 대한 의미 빈도를 조사하기 위해서는 의미 분류의 기준이 있어야 하는데, 이 연구에서는 『연세한국어사전』을 그 기준으로 삼았다. 기존의 사전과 달리 『연세한국어사전』은 실제 사용된 대규모 언어 자료(말뭉치)를 바탕으로 빈도 조사 를 하여 표제어를 선정하였고, 의미 기술도 실제 사용된 예문을 중심으로 이루어졌기 때문에, 말뭉치를 바탕으로 어휘들의 의 미 빈도를 조사하기 위한 본 연구의 성격에 가장 부합하기 때문이다.
7.2.2. 빈도 조사를 위한 도구 의미 빈도의 조사를 위해서는 개별 어휘가 쓰인 용례를 말뭉치에서 뽑아내야 하는데, 이를 위한 도구로 연세대학교 언어정 보개발연구원에서 사용하고 있는 프로그램인 “말씀”을 사용하였다. 교육용 말뭉치에서 말씀을 사용하여 각 어휘 별로 뽑은 용 례는 txt 파일의 형태로 추출되는데, 이 용례를 처리하기 위해서는 약간의 가공이 필요하였다. 각각의 용례에 대해서 의미 별 분류기호의 표시와 통계처리를 위해서는 자료 처리 프로그램(Excel이나 Foxpro)을 사용해야 했고, 이를 위해서는 해당 어휘 에 구분자가 표시되어야 했다. 이를 위해 해당 어휘에 구분자를 표시하고, 각각의 용례에 일련번호를 매기고, 용례의 수를 일 정하게 줄일 수 있는 프로그램을 개발하였다.
7.2.3. 의미 빈도 조사 대상 용례 위에서 이루어진 작업과 개발된 도구를 바탕으로 대상 어휘 500개에 대해 교육용 말뭉치에서 용례를 뽑은 결과, 용례는 모 두 30 여만개가 되었다. 몇 개의 어휘에 대해 시험적인 의미 빈도 조사를 해 본 결과 모든 용례를 처리하기에는 시간과 인원 이 부족한 것으로 판명되었다. 가용 인원과 시간을 고려할 때, 전체 용례의 1/3 수준이 최대치인 것으로 판단되어 약 10만개 의 용례를 대상으로 의미 빈도 조사를 실시하였다.
7.3. 한국어 어휘 의미 빈도의 시험 기술 위에서 밝힌 것처럼, 먼저 ‘말씀’을 이용하여 대상 어휘의 용례를 교육용 말뭉치에서 추출하였다. 추출된 용례는 개발된 도 구 프로그램을 사용하여 각각의 예문에 일련번호를 붙이고 다시 이를 1/3 수준으로 그 수를 줄였다. 이렇게 해서 얻은 용례 는 Excel을 이용하여, 대상 어휘에 대한 『연세한국어사전』의 의미 분류에 따라 꼬리표를 달고 통계 처리를 하였다. 통계 처 리를 한 결과를 임자씨, 풀이씨, 꾸밈씨 각각에 대해 하나씩 예를 들면 다음과 같다. 다음의 표에서 ‘표제어’에는 동형어를 모두 나열한다. 의미 항목 별 분류는 각각의 표제어에서 그 쓰임에 따라 대 분류(『연 세한국어사전』에서는 로마자 I, II를 사용하여 구별함)와 그에 따른 의미 항목 별 소 분류를 보여준다. 분류기호에서 첫번째 숫 자는 동형어를 나타내고(동형어가 없는 경우에는 대 분류를 나타내고, 대 분류도 없는 경우에는 의미 항목 별 분류를 나타냄), 두번째 숫자는 대분류를 나타내고, 세번째 숫자는 소 분류를 나타낸다. 그리고 각각의 의미 항목에 대한 용례의 수와 그 비율 을 보여 준다.
7.3.1. 임자씨(체언)
- 102 -
‘집’의 의미 빈도 표제어
의미 항목 별 분류
예
사람이 살기 위하여 지은 아담한 정원이 있는 집에서 살 건물 아보는 것이 소원이다. 전봇대 위에 까치가 지어 놓은 동물이 들어 사는 보금자 집 때문에 간혹 정전 사고가 일 리 어난다. 어떤 집에 전화를 걸었다가 그 자립적 가정을 이루고 생활하는 집 아이의 전화 받는 태도가 예 쓰임 집안, 또는 그러한 가정 의바르지 못해 기분을 상한 적 이 있다. 집1 (바둑에서) 돌로 둘러싸여 (명사) 상대편이 들어올 수 없거 백이 우변에서 집을 크게 냈군. 나, 자기 차지가 된 바둑 판의 빈 자리 사람이 살기 위하여 지은 나와 몇 집 건너 살던 친구가 건물이나 가정을 세는 단 어제 이사를 갔어. 의존적 위를 나타냄 쓰임 (바둑에서) 자기 차지가 아무리 대마라 해도 두 집이 나 된 바둑판의 빈 자리를 세 지 않으면 안 된다. 는 단위를 나타냄 문학 작품이나 학술 논문 같은 글 을 모아 펴낸 책이나, 음반 같은 이들의 진면목은 작년에 발표한 집2(輯) 것을 여러 차례에 걸쳐 계속 내는 11집 ‘무신론’에서 유감없이 발 (의존명사) 것의 차례를 나타내는 단위를 나타 휘되었다. 냄 누계
분류기호 빈도수
비율(%)
111
348
54.46
112
10
1.57
113
273
42.72
114
0
0
121
8
1.25
122
0
0
2
0
0
639
100 (97.11
오류
19
(2.89)
합계
658
(100)
- 103 -
7.3.2. 풀이씨(용언) ‘있다’ 의미 빈도 표제어 격틀 및 대분류 의미 항목 별 소분류
예
옛날에 한 부부가 있었 는데, 오랫동안 손이 없 었다. 그 일로 인해 크게 다치 1이 (2에) 있다 는 사람이 있을 것이라 생기거나 발생하다 는 소문도 돌았다. (어떤 일이) 벌어지거 오늘 소방 훈련이 있습 나 진행되다 니다. (무엇이 어떤 곳에) 정거장은 바로 학교 앞 위치하다 에 있었다. (어떤 직장이나 부서 남편이 제약회사에 있어 에) 근무하다/일하다/ 서 약 걱정은 안 하는 소속되어 있다 터였다. 1이 2에 있다 명단에 혹시 우리 형님 포함되다 이름도 있던가? (어떤 상태에) 놓이거 공업용 원자재들의 국제 가격이 오르는 추세에 나 처하다 있다. 그만한 돈은 내게도 있 소유하다 네. 존재하다
(일정한 관계에 있는 내가 아들만 있었어도 있다1 사람이) 딸리어 존재 이런 설움을 당하지 않 (형용사) 1에게 2가 있다 하거나 생존하다 았을 텐데. (무엇을) 자체에 지니 이 소설에는 주목할 만 거나 가지다 한 독창성이 있다. 며느리가 태기가 있어 친정으로 보냈다. 어떤 직위나 자격, 신 집안에 분란이 생겼을 1이 2로 있다 분의 상태로 존재하다 때도 오빠는 늘 방관자 로 있었다. [동사적으로 쓰이어] 그 곳에서 나는 6개월 1이 2에 있다 (어떤 장소에) 머무르 있었을 뿐이다. 다/지내다 [동사적으로 쓰이어] 몇 년만 있으면 21세기 1이 있다 (시간이) 경과하다/지 다. 나가다 [‘있는’의 꼴로 쓰이 한 눈에 있는 집 자식임 1이 있다 어] (재물이나 살림 따 을 알 수 있었다. 위가) 넉넉한 나에게 있어서 그 일은 삶의 이유와도 같은 것 ‘∼에게/에 있어서’ 이었다. 숙어 그 문제는 어린아이도 ‘∼을 수 있다’ 풀 수 있는 문제였다. (동작이나 상황이) 계 아이들은 서울에서 학교 동사의 보조적 속 진행되다 에 다니고 있습니다. 연결 어미 ‘-고’ (어떤 일의 결과의 상 아이를 안고 있으니 가 뒤에 쓰임 태가) 계속 지속되다 슴이 뭉클해졌다. 동사의 보조적 (어떤 상태나 어떤 일 모든 식품은 비닐로 포 연결 어미 ‘-아 의 결과의 상태가) 계 장되어 있다. /어’ 뒤에 쓰임 속되다/지속되다. (무엇이) 생기다
있다2 (보조 동사) 있다3 (보조 형용사)
분류기호
빈도수
비율(%) 11.0 8
111
976
112
262
113
36
0.41
121
383
4.35
122
13
0.15
123
167
1.89
124
21
0.24
131
113
1.28
132
38
1274
2.97
584
14.4 6
6.63
0.43 730
8.29
133
454
5.16
134
125
1.42
14
20
0.23
15
85
0.97
16
16
0.18
17
4
0.04
0
1938
22.01
21
1558 2661
22
30.2 2
1493
16.97
누계
8805
100 (98.81)
오류
106
(1.19)
합계
8911
(100)
- 104 -
3
1103
17.6 9 12.5 3
7.3.3. 꾸밈씨(수식언) ‘이’ 의미 빈도 표제어
의미 항목 별 분류
이1
한글의 홀소리 자모 ‘ㅣ’의 이름 사람이나 동물에서 음식물을 씹는 데 쓰이는 기관 그릇의 아가리나 연장의 날 등의 이지러진 부분
(명사)
이2 (명사)
이3 (명사)
이4(利) (명사) 이5(理) (명사)
예
빈도수
1
0
아기가 이가 나기 시작했다.
21
0
이가 빠진 그릇에 무얼 담아 먹는 것까지도 엄하게 말리던 할머니였다.
22
0
[숙어] 이(가) 갈리다/이(를) 너희들도 이제 이 악물고 살 갈다/이(를) 악물다 아야 한다. /이(빨) 빠진 호랑이
20
1
31
0
담에 기대어 졸고 있는 거지 … 사람에 붙어 사는 의 머리에 이가 기어가고 있 흡혈 곤충 었다. 호루라기를 냅다 불며 집안을 [숙어] 이 잡듯 이 잡듯 뒤졌으나 수확이라곤 아무것도 없었다.
30
0
비율(%) 0
1
0.06
0
0
이익이나 이득
아무리 계산해도 이가 안 남 는 장사였다.
4
0
0
0
이치
말의 이를 알면 일에 당해서 의심이 없을 뿐더러, …
5
0
0
0
6
2
2
0.11
7
62
62
3.52
81
0
82
9
9
0.51
91
1185
40년이란 역시 긴 세월인지 ‘사람’을 가리키는 것 라 그 때 일을 기억하는 이가 (의존명사) 그다지 많지 않았다. 도시 문제의 해결은 사회 문 제의 해결과 직결되어 있으며 이7 ‘이것’의 준말 이를 무시한 채 다른 것을 거 (대명사) 론하는 것은 극히 피상적인 짓이다. 이6
이8(二)
분류기호
둘
일에 이를 더하면 삼이다.
[관형사적으로 쓰이어] 일 층과 이 층은 세를 놓고 둘의 삼 층만 사무실로 쓰고 있다. 이 별장들은 그리스의 부자나 말하는 사람에게 외국인들이 휴양하기 위해서 가까이 있는 것을 지은 것이라는 이야기를 들었 이9 가리키는 말 다. (관형사) 이제는 참말이지 더 이상 땅 앞에 말한 것을 값이 오를 수가 없게 돼 있다 가리키는 말 이 말씀입니다. 누계 (수사)
67.33 1686
92
501
95.80 28.47
1760
100 (80.40)
오류
429
(19.60)
합계
2189
(100)
- 105 -
7.4. 결과의 분석 7.4.1. 작업상의 문제점 7.4.1.1. 용례의 정확성 문제 먼저, 말뭉치에서 그 원인을 찾을 수 있는 문제를 들 수 있다. 말뭉치의 구축과정에서 띄어쓰기나 맞춤법의 오류가 있을 수 있는데, 이 작업에서 사용한 말뭉치는 수정 작업이 완전하게 이루어지지 않아 대상 어휘의 용례를 완벽하게 추출할 수 없다 는 한계를 가지고 있다. 그리고, 이 빈도 조사 작업에서 사용한 용례 추출 도구는 ‘말씀’이었는데, 이 ‘말씀’의 일부를 구성하고 있는 형태소 분석기 에 대한 문제를 지적할 수 있다. 앞에서 제시한 ‘집, 있다, 이’의 경우에 잘못된 용례가 추출된 비율은 각기 2.89%, 1.19%, 19.60%로 양호한 편이었으나, 일부 어휘의 경우에는, 예를 들어 ‘몸’의 경우에는, 총 306개의 용례 중 95개만이 정확한 용례 이어서 잘못된 용례가 68.96%를 차지하고 있다. 꼬리표 달기와 통계 처리를 위해서는 주로 Excel을 이용하였는데, 구분자가 표시된 용례의 txt파일을 불러들이는 과정에서 구분자를 제대로 인식하지 못해 용례의 처리에 많은 시간이 소요되었다. 그러므로 자연언어를 제대로 처리하기 위해서는 더 나은 용례 추출 도구와 가공 도구의 개발이 필요하다고 판단된다.
7.4.1.2. 의미 분류 문제 이 연구에서는 의미 항목 별 빈도 조사를 위한 기반 사전으로 『연세한국어사전』을 사용하였다. 그런데, 사전에서 의미 항 목 간의 구별이 분명하게 이루어지지 않아 대상 어휘의 용례에서의 의미를 결정하기가 어려운 부분들이 있었다. 따르다1 ④
㉠ (관례, 법규 등을 본떠서) 그대로 하다 ㉡ (이미 결정되어 있는 것을) 그대로 좇다 ㉢ (가치 있다고 여기는 것을) 그대로 좇다 ㉣ 결정되거나 시키는 대로 좇아 하다
위에서 볼 수 있는 것처럼, ‘따르다’는 의미 항목 ④가 모두 4개의 소항목들로 다시 세분되는데, 이들 간의 구별이 과연 필 요한 것인가라는 의문이 들게 한다. 다음으로 사전에서의 의미 항목이 출현하지 않는 경우들 들 수 있다. 예를 들어 ‘놓다’는『연세한국어사전』에서 동형어 ‘놓 1
다 ’(움직씨)과 ‘놓다2’(도움풀이씨)로 나뉘고, 다시 ‘놓다1’은 Ⅰ-1∼Ⅰ-18, Ⅱ-1∼Ⅱ-6, Ⅲ-1∼8, Ⅳ로 의미 항목이 나뉘어, 모두 33가지 의미 항목으로 기술되어 있다. 그러나, 이 조사에서는 Ⅰ-2∼7, 10∼18, Ⅱ-1, Ⅲ-1, 4∼8의 의미 항목이 나타나 지 않아, 10가지 의미 항목만이 나타나고 있다. 이것은 말뭉치의 특성 때문에 나타나는 문제일 수도 있고, 조사된 용례의 수가 적기 때문에 나타나는 문제일 수도 있으므로, 더 다각적인 측면에서 검토될 필요가 있다.
7.4.2. 의의 7.4.2.1. 실제 사용 빈도의 조사
- 106 -
의미 빈도 조사는 기존의 빈도 조사가 가지는 한계 혹은 약점을 근본적으로 극복할 수 있다. 앞에서도 말한 것처럼, 단순한 형태 중심의 빈도 조사는 동형어를 구별할 수 없다. 동형어를 구별하지 못함으로써 개별 형태가 여러 개의 동형어를 가질 경 우, 조사 대상 형태의 출현 빈도는 실제와 다를 수밖에 없으며, 다른 어휘들과의 상대적인 빈도 역시 달라질 수밖에 없다. 이 러한 문제들은 개별 어휘의 의미 빈도를 조사함으로써 쉽게 해결되는 것으로, 각 어휘의 사용 빈도는 그 어휘의 의미 빈도의 총합으로 파악된다. 또한 위에서 지적한 바와 같은 말뭉치 구축 과정에서 발생한 오류도 어느 정도는 해소시킬 수 있다.
7.4.2.2. 용언의 격틀 빈도 파악 우리말의 기본 문형 설정은 학계에서 오랫동안 논의되었으나, 아직까지 해결되지 못하는 문제이다. 그런데, 『연세한국어사 전』처럼 풀이씨의 격틀을 의미 항목과 같이 제시하는 사전을 기반으로 의미 빈도 조사가 이루어질 경우, 개별 풀이씨가 보여 주는 격틀에 대한 빈도 조사도 동시에 달성된다. 이러한 격틀의 빈도는 우리말의 기본 문형 설정과 같은 문제에 해결책을 제 시해 줄 수 있다.
7.4.2.3. 사전의 모형 제시 의미 빈도 조사는 사전 편찬 분야에서도 어휘 의미 기술의 모형을 제시할 수 있다. 기존의 사전들에서는 각 어휘의 의미를 기술하는 데에 있어서 어떤 기준이나 원칙 같은 것을 찾기 힘들었으나, 의미 빈도를 활용하여, 의미 빈도순에 따른 의미 기술 이나 가장 많이 쓰이는 의미와의 관련성에 따른 의미 항목 기술과 같은 식의 모형을 제시할 수 있다.
7.4.3. 응용 의미 빈도 조사는 여러 가지 많은 분야들에 기초 자료로서 응용될 수 있다. 먼저 어떤 한 어휘가 특정 의미로 쓰였을 때, 그 어휘와 같이 출현하는 다른 어휘들을 파악할 수 있다. 이는 언어 현상에 대한 체계적 파악을 가능케 하는 것인데, 이로써 언어 사용에 따른 어휘들의 집합을 설정할 수 있고, 이는 다시 자연 언어 처리의 여러 분야에, 예를 들어 전자사전이나 기계 번역, 언어인식, 대화형 프로그램의 개발 등등에 이용될 수 있다. 또한 (한)국어 교육과 같은 분야에서, 단순한 형태 중심의 수 준별 어휘 분류가 아니라 실제 사용에 입각한 어휘 수준을 제시할 수 있어서, 사용자의 수준에 따른 단계적인 교재 편찬이나 교육과 같은 것들의 출발점으로 이용될 수 있다. 그리고 무엇보다도 의미 빈도 조사 작업을 통하여, 자연 언어 처리를 위한 출발점이 되는 ‘표준말뭉치’의 수준을 결정하는 데에 이바지할 수 있다.
7.5. 참고 문헌 강범모(1998), 빈도와 언어기술, 「언어정보의 개발과 이용」(연세대학교 언어정보개발연구원 제11회 언어 정보 연찬회), 연세대학교 언어 정보개발연구원. 강범모, 김흥규, 허명회(1998), 「통계적 방법에 의한 한국어 텍스트 유형 및 문체 분석」, 『언어학』 22, 한국언어학회. 강승식(1995), 상대적 출현빈도를 이용한 조사/어미 사전의 구성, 제7회 한글 및 한국어 정보처리 학술대회 논문집, 188-194ㅉ. 국립국어연구원 편(1993), 컴퓨터를 이용한 국어 자료 분석에 대한 기초적 연구, 국립국어연구원, 164ㅉ. 국립국어연구원(1997), 어휘 조사 단위에 대한 연구 - 일본 국립국어연구소의 각종 어휘 조사 단위를 중심으로-, 167ㅉ. 권종성(1994), 조선어 정보처리, 과학백과사전출판사, 평양. (1996, 한국문화사) 김경서, 윤준태, 박영환(1991), 말뭉치를 이용한 형태소 분석 단계에서의 중의성 해결에 관한 연구, 한글 및 한국어 정보처리 학술대회 가 을 학술발표논문집. 김광해(1993), 『국어 어휘론 개설』, 서울: 집문당. 김명순 편(1986), 한국어 어휘와 품사의 빈도에 관한 연구 -외국어로서의 한국어 교재를 중심으로-, 연세대 교육대학원 석사논문, 연세대
- 107 -
교육대학원. 김영채(1986), 한국어 어휘빈도 조사, 한국심리학회지 5-3, 217-285ㅉ. 김종학(1995), 한국어의 기초어휘 연구, 중앙대 국문과 석사 학위 논문. 김흥규, 강범모(1996), 고려대학교 한국어 말모둠1: 설계 및 구성, 한국어학 3, 233-258ㅉ. 김희진(1990), 중학교 교육용 어휘에 관한 연구, 국어교육 71,72, 349-409ㅉ. 남윤진(1997), 「현대국어의 조사에 대한 계량언어학적 연구」, 서울대학교 대학원 박사학위 논문. 남윤진(1997), 현대국어의 조사에 대한 계량언어학적 연구, 서울대 박사 학위 논문. 노용만(1985), 중학교 교과서의 어휘조사 연구, 영남대 교육대학원 석사 학위 논문. 류빈(1995), 「학습자 사전의 뜻풀이 어휘 선정을 위한 연구」, 울산대학교 교육대학원 석사학위 논문. 문교부(1955), 우리말에 쓰인 글자의 잦기 조사. 문교부(1956), 우리말 말수 사용의 잦기 조사. 문영호 외(편) (1993), 『조선어 빈도수 사전』, 평양: 과학백과사전 종합출판사. 문영호(1990), 『계산기 언어학 개론』, 평양: 사회과학 출판사. 문영호, 권종성, 리정용, 최병수, 박애순, 김길연, 서춘희, 리근용, 주향숙(1993), 『조선어빈도수사전』, 과학백과사전종합출판사, 평양.(1994 년 한국문화사 영인 발간) 박갑수(편) (1994), 『국어문체론』, 서울: 대한교과서. 박민규(1989), 어휘 조사의 전산 처리, 국어생활 16, 국립국어연구원. 박붕배(1975), 초등교육에 있어서 우리말 기본 학습 어휘에 관한 조사 연구, 서울교대논문집 8, 25-166ㅉ. 박영환, 김경서, 윤준태(1991), 말뭉치에 근거한 한국어 사전 표제어 구성, 한글 및 한국어정보처리 학술발표논문집. 서상규(1998a), 현대 한국어의 어휘 빈도(상·하), 연세대학교 언어정보개발연구원 내부 보고서(CLID-WP-98-02-28). 서상규(1998b), 말뭉치 분석에 기반을 둔 한국어 사전의 편찬, 제49회 조선학회 대회 발표 논문. 서정국(1969), 국민학교 '국어1' 어휘의 통계분석적 연구, 홍익공전 논문집1. 서정국(1975-78), 중학교 국어 교과에 쓰인 어휘의 조사 연구(1-4), 강릉교대 논문집 7,8,9,10. 송도규(1996), 『인지언어학과 자연언어 자동처리』, 서울: 홍릉과학출판사. 水野俊平(1993), 현대 한국어 어휘 구성의 계량적 고찰, 전남대 석사 학위 논문. 시스템공학연구소(1985), 어휘 조사 전산처리에 관한 연구, 한국과학기술원. 신익성(1972), 「국어의 어휘연구를 위한 통계언어학의 원리와 방법」, 『어학연구』 8-1, 서울대학교 어학연구소. 신인성(1972), 국어의 어휘연구를 위한 통계언어학의 원리와 방법, 어학연구 8-1, 서울대 어학연구소. 안승덕, 김재윤(1975), 국민학교 국어 교과서의 어휘 조사 연구, 청주교대논문집11, 125-181ㅉ. 이상섭(1988), 「뭉치언어학적으로 본 사전편찬의 실제문제」, 『사전편찬학 연구』 제2집, 서울:탑출판사. 이상섭(1990), 「낱말 빈도를 추정하기 위한 말뭉치 자료 수집의 실제」, 『사전편찬학연구』 제3집, 서울: 탑출판사. 이상섭(1990), 「뭉치언어학: 사전편찬의 필수적 개념」, 『사전편찬학 연구』 제3집, 서울:탑출판사. 이상섭(1990), 낱말 빈도를 추정하기 위한 말뭉치 자료 수집의 실제, 사전편찬학연구 3, 연세대 언어정보개발연구원 이상섭(1996), 뭉치 언어학의 기본 전제, 사전편찬학연구 5/6집, 29-60ㅉ. 이상섭, 이기동, 남기심, 정찬섭, 이익환, 최윤철(1991), “현대 한국어 사전 편찬을 위한 한국어 자료의 선정과 그 전산적 처리에 관한 연 구”, 1989년도 연세대학교 학술연구비 보고서, 1991.6. 연세대학교 한국어사전편찬실, 서울. 이상억 편(1989), 국어 어휘 목록의 형태, 음운론적 구조 연구 -계량언어학적 표준 조사-, 어학연구 25-1, 서울대 어학연구소 1-18ㅉ. 이상억(1986), 계량언어학: 어휘부의 음운, 형태, 의미론적 구조, 언어11-2, 한국언어학회, 323-339ㅉ. 이상억(1990), 국어 어휘부의 계량언어학적 연구, 기곡 강신항 선생 화갑기념논문집, 331-346ㅉ. 이성만 역(1994), 『텍스트언어학의 이해』, 서울: 한국문화사. Brinker, K.(199?), Linguistische Textanalyse . 이응백(1969), 국민학교 국어교과서 편찬을 위한 학습 기본어휘 설정에 관한 연구, 문교부 학술연구보고서(어문학계). 이응백(1972), 국민학교 학습용 기본어휘연구, 국어교육 18-20, 한국교육연구회,. 이응백(1975), 국민학교 입문기 학습용 기본어휘연구, 국어교육32, 183-246ㅉ. 이응백(1987), 신문, 잡지에 한자로 표기된 한자어 실태조사연구, 국립국어연구소 연구보고서 1집. 이충우(1994), 한국어 교육용어휘 연구, 국학자료원, 283ㅉ. 이호(1994), 『언어 정보 획득을 위한 한국어 코퍼스 분석 도구』, 고려대학교 대학원 전산과학과 석사학위 논문. 임광규(1981), 국민학교 국어 교과서 낱말 잦기 조사, 한글학회. 임지룡(1989), 국어의 기초어휘에 대한 연구, 국어교육연구 23집, 경북대 국어교육연구회 임칠성, 水野俊平, 北山一雄(1997), 한국어 계량 연구, 전남대 출판부. 장경희(1994), 「문체와 의미」, 박갑수(편) (1994). 장석배(1998), 연세말뭉치의 어절 빈도 연구, 「언어정보의 개발과 이용」(연세대학교 언어정보개발연구원 제11회 언어 정보 연찬회), 연세 대학교 언어정보개발연구원. 정광 외(1995), 『한국어 데이터베이스의 설계 및 응용을 위한 기초연구』, 대우학술총서 공동연구, 서울: 민음사.
- 108 -
정광(1996), 국어 어휘 데이터베이스 구축에 대한 연구, 연구보고서, 국립국어연구원. 정영미(1993), 국어 어휘의 통계적 특성과 이의 응용, 인문과학 69/70, 연세대 문과대학. 정우상(1987), 국민학교 교과서 어휘 연구, 국립국어연구소 연구보고서 1집, 651-872ㅉ. 정인상(1991), 국어자료의 전산처리 방안에 대한 연구, 서울대 박사 학위 논문. 정찬섭(1989), 한국어 어휘 뭉치의 표본 선정 기준, 한글 및 한국어정보처리 학술발표논문집. 정찬섭, 이상섭, 남기심, 한종철, 최영주(1990), 우리말 낱말 빈도 조사 표본의 선정기준, 사전편찬학연구 3, 연세대학교 한국어사전편찬실, 7-69ㅉ. 조남호(1990), 국어 어휘의 수집과 정리, 국어생활 22, 국립국어연구원. 한국과학기술정보센터(1980), 한글, 한자 잦기 조사 일람표(잦기순, 가나다순). 한영균(1993), 컴퓨터를 이용한 국어 자료 분석에 대한 기초적 연구, 국립국어연구원 한영균(1998), 韓國語 基本語彙 頻度用例 辭典 의 編纂을 위한 基礎的 硏究》 홍윤표(1990), 컴퓨터를 이용한 국어자료 처리 방안, 제17회 국어학회 공동연구회, 국어학회. 홍윤표(1994), 국어국문학 연구와 컴퓨터, 국어학 연구와 컴퓨터 1. Aarts, J.(1991), Intuition-based and Observation-based grammars, in Aijmer,K. & Altenberg, B. (ed.)(1991). Aijmer,K. & Altenberg, B. (ed.)(1991), English Corpus Linguistics, London & New York: Longman. Alford, M.H.T.(1971), Computer Assistance in Learning to Read Foreign Languages. , Literary and Linguistic Computing Centre of the University of Cambridge. Atkins, B. T. S. & Zampolli, A.(eds)(1994), Computational Approaches to the Lexicon, New York: Oxford University Press. Biber, D. & Finegan, E(1991), On the exploitation of computerized corpora in variation studies, in Aijmer,K. & Altenberg, B. (ed.)(1991) Biber, D.(1988), Dimensions of Register Variation: A Cross-linguistic Comparison, Cambridge: Cambridge University Press. Biber, D.(1994), Representativeness in Corpus Design, in Zampolli, A. (eds)(1994). Burnard, L. (1992), 「Tools and Techniques for Computer-assisted Text Processing」, in Butler (ed.)(1992). Butler, C. (ed.)(1992), Computers and Written Texts, Oxford UK & Cambridge USA: Blackwell. Church, K. W., Mercer, R. L. (1993), Introduction to the Special Issue on Computational Linguistics Using Large Corpora, Computational Linguistics 19-1, ACL, Cambridge Mass.: MIT Press. Engwall, G.(1994), Not Chance but Choice: Criteria in Corpus Creation, in Atkins, B. T. S. & Zampolli, A. (eds) (1994). Fries, C.C., A.A.Traver(1960), English Word Lists., Ann Arbor, MI: George Wahr. Garc a Hoz, V.(1953), Vocburario usual, vocabulario com n y vocabulario fundamental: determinac on y an lisis de sus factores. Madrid: Consejo Superior de Investigaciones Cient ficas. Garside, R., Leech G., Sampson, G. (eds)(1987), The Computational Analysis of English, London & New York: Longman. Halliday, M. A. K.(1991), Corpus studies and probablistic grammar, in Aijmer,K. & Altenberg, B. (ed.)(1991). Johson D.D.& Pearson P.D.(1984) Teaching Reading Vocabulary, Holt, Rinehart and Winston. Leech, G. & Fligelstone, S. (1992), Computer and Corpus Analysis, in Butler (ed.)(1992). Leech, G. (1991), The state of the art in corpus linguistics, in Aijmer,K. & Altenberg, B. (ed.)(1991). Liberman, M & Godfrey, J.(1993), The Linguistic Data Consortium, Proceedings of ROCLING VI, The Computational Linguistics Society of R.O.C.. McArthur, T.(1978), 'The Vocabulary Control Movement in the English language, 1844-1953', Indian Journal of Applied Linguistics 4(1): 47-68. McCrum R. et al.(1986), The Story of English. London: Faber & Faber. Nagy W. E.(1991), Teaching Vocabulary to Improve Reading Comprehension, IRA. Sinclair, J.(1987), Looking Up, London: Collins. Sinclair, J.(1991), Corpus, Concordance, Collocation, Oxford: Oxford University Press. Woods, A., Fletcher, P., Hughes, A. (1986), Statistics in Language Studies, Cambridge: Cambridge University Press. Zampolli, A. (eds)(1994), Current Issues in Computational Linguistics: In Honor of Don Walker, Kluwer Academic Publisher.
- 109 -