인공윤리에이전트(AMA)

HRI기술은 로봇이 사용자의 의도를 판단하고, 적합한 반응과 행동을 수행함으로써 인간과의 의사소통 및 상호협력을 가능하게 하는 인식(Perception)-판단(Cognition)-표현(Expression) 기술로서 소셜 로봇의 핵심기술 중 하나이다. 현재 개발 단계인 HRI2.0은 시장 참여자와 기술 공급자가 Big Data와 Cloud, IoT(Internet of Things) 환경에서 목표성능을 공유하고 효율적으로 컴퓨팅 자원을 사용하여 실제 서비스에 대한 대응력을 높이는 시장지향의 개방형 HRI 기술로 진화하고 있다.

	HRI 1.0 과거 ~ 2012	HRI 2.0 2012 ~ 2017	HRI 3.0 2017 ~
연구목표	상황을 인식하는 HRI	상황을 판단하고 표현하는 HRI	상황에 맞춰 스스로 서비스하는 HRI
개발방향	Short Term * 개별적 기능 위주 개발 -"Who am I"(얼굴인식, 화자인식) - "Do it"(제스처인식, 음원추적, 음원강조) - "Follow me"(휴먼 추종)	Mid Term * 실 환경 적용 위주 개발 - 환경 센서 연동 및 인식 강인성 확보 - 인식/판단/표현의 유기적 연계 - 분산자원 및 실 DB 활용	Long Term * HRI/HMI/MMI의 통합인터렉션 개발 - HRI 인식 강인성확보 - 휴먼/기기/로봇간 상호연동 인터렉션 - 휴먼인지 모방 서비스
대표도

HRI 기술 개발 로드맵, [KEIT PD 이슈 리포트 8권, 2011].

HRI 인식 기술에는 카메라나 마이크를 이용한 얼굴인식, 표정인식, 제스처인식, 물체인식, 휴먼 추종, 음원 인식, 음성인식 등의 기술 및 FSR(Force Sensing Register)이나 비접촉 터치 센서를 이용한 사용자의 접촉 인식, 매개체인 리모콘이나 아이콘 명령과 같은 매개인터페이스 기술 등이 있다.대표적인 오픈소스 음성인식 기술로서 Google에서는 음성을 문자 포맷으로 변환하는 STT(Speech To Text) Web Speech API를 2013년 발표했으며, Apple의 Siri와 유사한 기능을 하는 Google Voice Search Hotword를 그 이후에 발표했다. 그 외의 유명한 오픈소스 음성인식 엔진들로는 다음과 같은 것이 있다.

- CMU의 Sphinx그룹과 Sun Microsystems 연구소, Mitsubishi Electric Research Labs(MERL), HP 등이 협력하여 연구개발 중인 음성엔진인 CMUSPhinx

- MIT에서 개발 중이며 iPhone, iPod Touch 모바일 웹브라우저에서 음성인식을 하는 toolkit인 WAMI

Google Cloud Vision API의 개념도와 영상을 통한 물체와 감정인식의 적용 사례

최신의 영상인식 기술로는 2016년 2월에 Google에서 모든 개발자에게 공개한, 영상 인식과 분류(classification)가 가능한 Cloud Vision API이다. 이 API는 수천만 장의 사진 DB와 Deep Learning 기술을 활용하여 현재의 영상에서 물체인식이 가능하고, 사람의 경우 얼굴 검출을 통해 표정을 인식할 수 있다.리눅스 Ubuntu 환경에서 음성 합성을 위한 대표적인 TTS 오픈소스로는 영국 에딘버러 대학에서 개발한 Festival Speech Synthesis System과 Google Android 플랫폼에서 채택된 SVOX사(현재 Nuance사에 합병)의 Pico 등이 있다.