[21세기 세종계획 완료..2억어절 말뭉치 구축]

2007-12-11 アップロード · 141 視聴

[
(서울=연합뉴스) 고미혜 기자 = 국립국어원(원장 이상규)이 1998년부터 추진해온 국어 정보화사업인 21세기 세종계획이 10년 만에 완료돼 결실을 맺게 됐다.
이를 통해 소설권 4천권 분량인 2억 어절의 말뭉치(컴퓨터가 인식할 수 있도록 입력, 저장한 어절 묶음)가 구축됐으며 60만개에 달하는 어휘를 갖춘 전자사전도 개발됐다.
국립국어원은 11일 오전 국립중앙박물관 대강당에서 21세기 세종계획 사업의 성과발표회를 가졌다.
21세기 세종계획은 국어 연구 기반 마련과 우리말의 정보화, 세계화, 표준화라는 목표로 1998년부터 총 150억원의 예산을 들여 추진된 국어 정보화사업으로 연간 200여명의 연구진이 참여했다.
국립국어원은 우선 기초 언어자료 데이터베이스를 구축하기 위해 신문, 잡지, 소설 등 다양한 자료를 컴퓨터에 입력해 2억 어절 규모의 말뭉치를 확보했다.
이는 1991-1994년 구축된 영국 국가 말뭉치의 1억어절보다도 많은 세계 최다 수준으로, 대규모 말뭉치 구축을 통해 컴퓨터를 이용한 정교한 기계 번역과 문서 요약, 맞춤법 교정 등이 가능해진다고 국립국어원은 설명했다.
또 언어 정보의 자동처리를 위해 컴퓨터가 인식할 수 있는 60만 어휘 규모의 전자사전도 개발됐다.
이번 전자사전은 정보 검색과 텍스트의 분석과 산출, 자동번역, 다국어 사전 구축 또는 한국어 교육이나 순수 연구 등에 두루 활용될 수 있다.
이와 함께 한민족 언어 정보화 사업을 통해 남북한 언어 비교 자료, 방언 자료, 어휘 역사 자료 등이 구축됐으며 문자코드 표준화와 전문용어 정비, 글꼴 지원 등도 세종계획의 과제로서 추진됐다.
한편 이날 발표회에는 세계적으로 가장 높은 수준의 말뭉치를 구축한 것으로 평가받고있는 영국의 국가 말뭉치(BNC) 책임자 루 버나드 교수가 특별 강연자로 나서 BNC의 구축 과정과 운용 현황 등을 소개했다.
또 박동인 한국과학기술정보원 박사, 이상주 다음커뮤니케이션 박사, 홍윤표 전 연세대 교수 등이 국어정보화의 과제와 전망이라는 주제로 토론을 벌였다.
mihye@yna.co.kr

촬영: 김기현 VJ, 편집: 김해연 기자

(끝)

저작권자(c)연합뉴스.무단전재-재배포금지]

tag·21세기,세종계획,완료2억어절

非会員の場合は、名前/パスワードを入力してください。

書き込む
今日のアクセス
503
全体アクセス
15,975,518
チャンネル会員数
1,896

사회

リスト形式で表示 碁盤形式で表示

02:04

공유하기
[이 시각 주요뉴스]
9年前 · 100 視聴

01:34

공유하기
[이 시각 주요뉴스(오전)]
9年前 · 1,008 視聴