"상품을 통해 세상을 본다" >buyking NEWS
바이킹 안내

기업 서비스

 
 
  신상품   이벤트
  전문가 리뷰   프리뷰   포토뷰
  가이드   현장
ID     PW       ID/PW 분실   아이디 저장
 

 

   
칼럼
음성을 통한 사용자 인터페이스, 어디까지 진화할까?
모바일, 텔레매틱스 등 다양한 분야에 사용되는 음성UI를 알아본다

2009년 04월 30일

오랫동안 음성으로 기기를 컨트롤하는 것은 사람들이 꿈꾸던 전형적인 미래의 모습 중 하나였다. 하지만 기계가 사람의 말을 알아듣고 구분하여 만족스러운 수준의 퍼포먼스를 보이는 데는 꽤나 오랜 시간이 걸리는 것이 사실이다. 국내 음성인식 기술은 1990년대부터 ETRI를 중심으로 본격적으로 시작되었지만 아직까지 소비시장에서의 위력은 걸음마 단계이다.

빠르게 실현될 줄 알았던 미래가 한 차례 주춤한 이후에도 사람들은 꿈을 버리지 못하고 조금씩 진보해나가고 있다. 불가능하다고 생각되었던 음성인식 기술은 어디까지 왔으며 얼마나 발전할 것인가?

■ 모바일과 음성인식

말만하면 걸리는 휴대폰이 있었다. ‘우리 집’이라고 말하면 집으로 전화가 걸리던 때가 있었다. 그 때 당시만 해도 이러한 기술은 혁신적인 것으로 많은 부가가치를 창출할 것 같았다. 하지만 음성 기술은 기술상의 한계를 극복하고 실용화되는 데 꽤 오랜 시간을 소비하고 있다. 최근 음성을 활용한 사용자 인터페이스의 발전 양상은 빠르게 진행되는 징후를 보이고 있는데, 특히 모바일 분야에서의 응용이 활발히 이루어지고 있다는 점이 주목해야 할 부분이다.

최근에 출시된 휴대폰 중 독특한 컨셉으로 소개된 휴대폰이 눈에 띈다. 스카이 윈드(IM-S410)는 입으로 부는 바람으로 휴대폰을 조작할 수 있는 기능을 가지고 있는데, 변형된 음성인식 기술이 독특하다. 이 제품은 사실 바람을 감지하는 것이 아니고 사람이 바람을 불 때 내는 소리를 마이크가 감지하여 반응하는 방식으로 작동한다. 손쉽게 접근하기 힘든 음성인식 기술을 재치 있게 UI로 적용한 예로서 호평을 받고 있다.

음성인식 및 음성을 기초로 한 휴대폰 UI의 트렌드는 앞으로 지속적으로 발전할 것으로 보인다. IT 트렌드를 선도하고 만들어내는 경향이 짙은 애플의 움직임을 봐도 그렇다. 애플이 6월 이후 선보일 예정인 아이폰에는 음성인식 기능이 들어갈 것으로 많은 사람들이 예상하고 있다. 최근 아이폰 OS3,0에서는 재블러(Jabbler)라는 음성인식 기술을 적용할 것이라고 애플은 발표했는데, 이는 터치 인터페이스의 한계를 음성인식 기술로 넘어서겠다는 의도로 보인다.

또한, 지난 달 출시된 아이팟 셔플을 보아도 그렇다. 아이팟 셔플은 액정이 없기 때문에 컨트롤되는 상황을 음성으로 알려 주는데, 이 점을 볼 때 애플이 음성을 이용한 UI에 대한 실험을 서서히 진행하고 있는 듯한 인상을 준다. 한 박자 앞서가는 제품 컨셉으로 많은 사람들의 관심을 받고 있는 애플의 행보는 앞으로의 제품트렌드를 짐작하는데 참고할 가치가 있다.

■ 차량과 함께 진화하는 음성UI

차량에 관련한 서비스는 음성인식이 가장 활발하게 발달할 수 있는 분야이다. 차량을 운전할 때에는 다른 감각을 사용하기가 어렵다. 운전은 눈, 손, 귀, 발 등 신체의 감각기관이 종합적으로 사용되기 때문에 음성을 통한 입력 서비스가 사용될 수 있는 여지가 많다. 하지만 차량 운전 시에는 주변 소음이 많을 수 있어 소음을 필터링하는 기술은 앞으로 개선해야 할 부분이다.

또한, 텔레매틱스 분야는 음성인식을 적극적으로 필요로 할 것으로 예상된다. 특히, 이번 상하이 모터쇼에서 SK텔레콤이 발표한 모바일 텔레매틱스 서비스는 스마트폰이 차량제어에 본격적으로 사용될 것임을 예고하고 있는데, 그렇게 되면 휴대폰 및 스마트폰의 음성인식 기술은 더욱 필요할 것으로 예상된다.

■ 똑똑해지는 전자사전

음성인식 기술은 전자사전에서도 활발하게 사용되고 있다. 최근에 나오는 전자사전들은 초창기 ARS 시스템에 탑재되어 있던 어색한 발음보다 훨씬 더 사람 목소리에 가까운 소리를 내주고 있다. 최근 출시되는 많은 전자사전에는 텍스트를 음성으로 변환시키는 TTS(Text To Speech) 기술이 탑재되어 있는데, 이는 음성 UI의 활용 가능성을 높이고 있다. 특히, 엑타코의 전자사전인 NTL 시리즈는 음성인식 기능을 갖추고 통역기의 역할을 한다. 70만 원 대로 현재로서는 높은 가격이지만 보급이 늘어나는 추세다.

■ 음성인식의 활용 가능성

여러 분야에서 음성을 통한 UI가 사용되고 있지만 그 중에서도 모바일 분야는 입력에 대해 끊임없이 고민하고 있기 때문에 활용 가능성이 높다. 오늘날의 모바일 기기들은 쿼티 키보드냐, 터치 키보드냐, 광마우스냐 터치펜이냐를 끊임없이 고민하고 있는 형편이다.

음성인식 기술이 발전한다면 모바일이 가장 큰 수혜를 얻을 것이다. 긴 내용을 타이핑해야 할 경우에 유용하고 좁은 창에서 웹 서핑을 해야 할 경우 편한 도구로 발전할 수 있기 때문이다. 특히, 이동성을 높이기 위해 쿼티자판을 사용하지 않는 MID의 경우, 음성인식이 입력에 큰 도움을 줄 것이다. 하지만 음성인식이 모든 입력방식을 대체할 것으로 보이지는 않는다.

소리를 내면 안 되는 자리에서의 사용이 어렵고, 보안상의 문제도 있다. 휴대폰용 핸즈프리가 나온 지 오래 되었지만 사람들은 많이 사용하지 않는 것처럼 알리고 싶지 않은 사실을 말해야 할 때에는 사용이 어려울 수 밖에 없다. 공공장소에서 대상 없이 말하는 것은 사용자에게 편리하지만은 않다. 기술적인 면을 떠나, 핸즈프리를 쓰면서 허공에 이야기하는 것은 우스워 보이기까지 한다. 과시욕구나 프레스티지 마케팅적인 측면에서 보아도 음성인식이 만능의 입력방법이 되지는 않을 거라는 예상이다.

■ UI의 미래는 음성과 제스처

앞으로의 UI는 키보드 등의 전통적인 입력방식과 함께 음성과 제스처가 통합된 UI가  확대되어 갈 것으로 예상된다. 이미 파인드라이브 등 네비게이션에 적용되는 음성인식 기술은 상당한 수준에 이르렀고, 휴대폰과 TV 등에서는 동작을 감지하여 컨트롤하는 기술들이 속속 등장하고 있다. 실제로 2009년 CES에서 도시바는 제스처로 조작 가능한 TV를 선보였는데, 음성 UI와 제스처 UI가 합쳐진다면 키보드 등의 전통적 입력방식을 많은 부분 대체할 것으로 보인다. 아직은 멀게만 느껴지지만 1988년에 개봉한 영화인 '다이 하드'에서 나왔던 터치스크린이 휴대폰 속으로 들어오는데 20여 년이 걸렸다. 따라서 음성인식도 충분히 가능성이 있으며, 사용자의 요구가 계속되는 한 음성 및 제스처 UI의 발전은 지속될 것이다.

김용진 기자(nimby3@buyking.com)
상품전문 미디어, 바이킹 보도자료/기사제보(news@buyking.com)

 
바이킹 안내 기업 서비스 책임의 한계
 
Copyright(c) 1999-2009 DECA Communications, Inc. All Rights Reserved.