한국어 말뭉치 모으기

안녕하세요. 저희 연구팀은 인공지능 기반 한국어 맞춤법 검사기를 개발하는 프로젝트를 위해 한국어를 모국어로 사용하는 사람의 자연스러운 언어 습관에 따라 (어법 오류가 포함된) 문장을 연구 및 비상업적 목적으로 수집하고 있습니다.

참가자 분들은 주어진 문장을 읽어주는 음성 파일을 듣고, 평소 대화하는 습관대로 써주시면 됩니다. 이 실험은 한국어를 모국어로 사용하는 이용자들의 문법 오류를 수집하는 것이 목적이므로, 의식적으로 맞춤법에 맞는 문장을 쓰도록 노력하지 않으셔도 됩니다. 해당 목적에 따라, 참가자 분들은 주어진 문장을 읽어주는 음성 파일을 듣고 평소에 사용하시는 대화체 문장을 입력하시면 됩니다.

이 실험에서는 참가자들의 신규참여/재참여를 구분하기 위해 구글 로그인을 사용하여 이메일 주소를 수집합니다. 수집된 주소는 실험 종료 후 폐기될 예정이며, 별도의 개인정보를 수집하지 않습니다.

참가자 분들이 수집된 모든 문장은 전처리를 거쳐서, 인공지능 기반 한국어 맞춤법 검사기를 개발하고자 하는 연구자 혹은 개발자 누구나 사용할 수 있도록 오픈소스로 공개할 예정이니 많은 참여 바랍니다.

실험 참가자가 작성한 모든 데이터에 대한 저작권은 연구진에게 귀속됩니다.

구성원

공유하고 프로젝트 돕기