카테고리 없음

日, 와세다대, 책 읽어주는 로봇 개발

리첫 2009. 7. 10. 17:26

연구자: 카마타 세이치로(와세다대학교 공학부 교수)

 

2009년 6월 11일, 일본 와세다대학교 정보생산시스템연구소가 제49차 서일본 기계산업박람회의 일부인 키타큐슈의 로봇산업박람회에서 책읽는 로봇-- 니노미야 군--을 일반대중에게 공개했다. 책읽는 로봇의 첫데뷰이다. 니노미야 군은 단조로운 기계적인 목소리의 톤보다 더욱 부드러운 목소리로 어린 아이처럼 감성적인 목소리로 책을 읽을 줄 아는 로봇을 만들고자 하는 열망하에 탄생했다. 그러나 완전히 형성된 감정을 가진 성인처럼 읽을 수는 없다. 아직은 초등학생보다 약간 낮은 수준의 능력을 갖고 있기 때문이다. 현단계에서 이 로봇은 도서관의 어린이들, 요양시설과 개인보호시설의 연로자들과 시각장애인들에게 기쁨을 주기 위하여 만들어졌다.

 

땔나무 대신 등에 PC를 짊어진-- 니노미야 킨지로의 이미지

 

1년반 동안 우리의 연구개발 중 가장 어려웠던 것은 그 로봇에게 붙여줄 이름이었다. 우리는 이 로봇의 개발 초창기부터 디자인과 컨셉을 결정했다. 그 디자인은 니노미야 킨지로의 이미지를 담고, 컨셉은 그의 등에 장작(땔나무)더미 대신 PC를 짊어지게 하였다. 그러나 정작, 이 로봇의 이름을 지을때, 결정하기가 어려웠다. 이름 중에는 "킨짱", "지로군" 등이 있었다. 마침내 이 로봇의 이름이 "니노미야군"으로 결정된 것은 박람회에서 공개되기 불과 1달 전이었다. 따라서 박람회의 브로우셔에는 그의 이름이 빠져 있다.

 

카메라를 통한 문자인식과 음성합성

 

니노미야군의 두가지 중요한 특징은 문장인식과 음성합성이다. 각각의 눈에 내장된 디지틀 카메라가 책 한 페이지를 캡처한 다음 그 페이지의 문자를 하나씩 인식한다. 이 로봇은 몇가지 유형의 폰트는 인식할 수 있으나 손으로 직접 쓴 것은 인식하지 못한다. 문자인식 단위는 텍스트포맷의 데이터로 만들어진다. 그 데이터는 Text-To-Speech 소프트웨어로 즉시 음성으로 인식되며, 음성은 로봇의 아래쪽에 장착된 스피커로 듣게 된다. 현재는 히라카나, 카타카나, 한자 및 기호를 포함하여 약 2,300개의 문자가 내장되어 있으며, 향후 더욱 많은 숫자의 문자가 추가될 것이다. 이 로봇의 약점은 번개와 글씨의 폰트 크기에 대한 반응이며, 그래서 스캐너 대신 디지틀 카메라가 장착되어 있다. 우리는 이러한 약점을 극복하고 동작인식을 개선하고 중이다. 현단계에서 이 로봇은 오직 각각의 문자를 하나씩 소리내어 읽을 뿐이고, 문맥관계나 감정을 실어서 읽는 것은 불가능하다.

 

국제적 파트너쉽을 통한 성공 

 

이 연구개발은 국제적 파트너쉽 계획과 상호 협력을 통하여 이뤄졌고 여기에 참가한 연구진은 상하이의 쟈오통 대학의 쟈오쿤페이 교수와 주지에 교수 및 키타큐슈 기술대학의 야마우치 코지 부교수 등이다. 이 국제적 파트너쉽 연구는 2007년 10월 31일, 키타큐슈시의 키타큐슈 고등과학기술재단(FAIS)과 상하이 쟈오통 대학 간에 맺은 과학기술의 증진과 인적자원 교류에 대한 협정을 맺은 것에서 비롯되었다. 이 협정으로 상하이 쟈오통대학과 와세다대학 내에 키타큐슈연구소를 열게 되면서부터 국제적 파트너쉽 연구가 시작되었다. 이 연구는 또한 교육과학기술성에 의해 추진된 지식클러스터 이니셔티브(제2단계)에 수록된 "고속유형 매칭서킷트와 응용"에 관한 연구개발과도 맞물려 있다. 와세다와 상하이 쟈오통 대학은 책읽는 로봇의 동체를 각각 독립적으로 설계하기로 협약하였으므로 로봇의 형태가 상당히 다르다. 상하이 쟈오통 대학이 개발한 로봇은 중국어와 영어를 말할 줄 안다.

 

2~년내에 상용화 가능성

 

약 25년전, 내가 NEC의 중앙연구소 연구원으로 있을 때부터 문자인식을 연구하기 시작했다. 그때부터 지금까지, 나는 와세다 대학교 정보생산시스템 대학원의 교수로서 이미지 프로세싱과 패턴인식의 연구활동에 매진해 왔다. 나는 항상 기초부터 응용단계까지, 가장 유용하고도 사회기여도가 높은 연구논문을 선정하려고 노력했다. 지난 10여년 동안 나는 수학적 분석의 기초과정에서 대체로 배웠던 매우 유망한 "space-filling curve"를 집중 연구하고 있다. 나는 그 곡선의 특징을 유용화하는 이미지 프로세싱 앨거리즘을 개발했고 지금은 그것을 원격모니터링시스템에 응용시키고 있다. 가능한 한, 이 로봇의 사회기여도를 촉진하기 위하여 나는 2~3년내에 "니노미야군"을 시장에서 상용화할 수 있도록 내 연구개발을 계속할 것이다.

 

번역:리첫(blog.daum.net/rofaenglish)

 

** 번역에 관한 저작권은 리첫에게 있음을 양지하시기 바랍니다!