이번 프로젝트는 과학기술정보통신부 주관, 한국정보화진흥원(NIA)이 추진하는 ‘제2차 인공지능 학습용 데이터 구축 사업’의 일환으로 진행된다. 국내 노인, 소아 계층의 음성 대화 DB, 학습 데이터 등이 부족하다는 점에 착안, 양질의 데이터를 확보해 이를 필요로 하는 곳에 활용되도록 기여한다는 계획이다.
자유대화 분야 연구는 NHN을 비롯해 NHN다이퀘스트, NHN에듀, ㈜크라우드웍스, ㈜아임클라우드, 셀바스 AI, ㈜원더풀플랫폼, ㈜잉글리시헌트, EBS 등 인공지능, 클라우드, 교육 전문 기업·기관 등이 참여하고, 구축된 데이터의 실제 연구에 서강대, 성균관대, 건국대, 한국외대 등 4개 대학도 함께한다.
NHN은 인공지능 및 자연어 처리 기술에 대한 오랜 노하우를 바탕으로 관련 데이터 ▲수집, ▲가공, ▲검수, ▲학습, ▲유효성 검사 관리를 위한 시스템 개발 등 전 과정을 지원한다. 데이터 수집 과정에 인공지능 스피커, 음성 기반 채팅 서비스 등 효율적인 방식을 도입하고, EBS 교육채널, NHN 에듀 교육서비스 채널 등을 적극 활용해 다양한 테스터 및 DB를 확충해 나갈 예정이다.
또한, 크라우드 소싱 기반의 AI 데이터 구축을 통해 관련 일자리 창출에도 힘쓴다. 기초생활수급자, 자립아동, 독거노인 등 사회적 배려 대상자 약 6천여명을 모집할 계획이다.
구축된 데이터는 AI Hub를 통해 공개할 예정이며, 연구 기간 중 해커톤 등을 개최해 학습 데이터 활용 활성화에도 앞장선다는 계획이다.
한편, 과학기술정보통신부와 한국정보화진흥원은 지난 달 'AI 학습용 데이터 구축 사업 온라인 출범식 및 상생협약식'을 갖고, 사업의 성공적 추진을 통한 AI 산업 발전 및 일자리 창출에 기여할 것을 다짐했다.
편도욱 로이슈 기자 toy1000@hanmail.net