세상 이야기/잡학사전

DIY AI 스피커 만들기

운산티앤씨 2018. 9. 26. 10:11








이하 인용---
스피커가 다 만들어진 뒤 ‘KT API 링크’ 홈페이지에 접속해 각종 소프트웨어 개발도구(SDK)를 내려받으면 된다. 과거 기가지니 개발자포털에서 제공하던 기능으로, 추석 연휴 직전 KT는 관련 데이터베이스를 API 링크 홈페이지로 이관했다.

이 홈페이지에서 아이디와 패스워드를 입력해 계정을 생성산 뒤 음성인식 스피커에 필요한 기본적인 SW를 내려받으면 된다. 직접 음성인식 프로그래밍을 할 필요없이 라즈베리파이 노드JS 기반에서 곧바로 이용할 수 있는 음성인식 도구를 이용하는 식이다.

스피커 이용자의 음성명령을 기계가 인식하고, 문자를 음성으로 합성하거나 대화 맥락을 이해하는 기능을 곧바로 직접 조립한 AI 스피커에 이식할 수 있는 식이다. 기가지니 스피커에서 이해할 수 없는 대화 맥락도 만들어낼 수 있다.

이를테면 일반적인 대화 맥락이 아니라 개발자가 의도한 특정 문장이 지시하는 내용을 나만의 스피커에 대입할 수 있다는 뜻이다. 나만의 발화 세트를 마련하는 셈이다. 메이커스 키트 개발자가 의도한 대화 맥락이 쓰일 수 있는지 홈페이지 안에서 시험할 수도 있다. KT의 AI 서버에서 특정 대화 맥락이 훈련됐는지 시뮬레이터로 알아보는 방식이다.

기본적인 예제 외에도 다양한 응용 프로그램을 실행할 수 있다는 점이 특징이다. 단 파이썬 언어에 대한 기본적인 지식은 필요하다. 코딩 명령어의 반복적인 패턴을 일부 수정해 기본적인 응용도 가능하다.

메이커스 키트 AI 스피커를 활용해 RC카를 제어하는 서비스를 만들어볼 수도 있다. 음성명령으로 무선 장난감 자동차를 앞뒤로 움직이고 자동차에 탑재된 카메라도 움직여볼 수 있다.
조금만 더 응용해본다면 스피커로 와이파이 신호가 도달하는 실내 환경 정도에서 드론을 조종할 수도 있을 것으로 보인다. 다만 RC카를 직접 만드는 일이 더욱 어려워보여 시도하지 않았다.
--- 인용 끝

조금 황당한 생각이지만 코딩을 통해 명령어가 조절되고 와이파이 환경 하이 존재하는 한 대상물 조정이 가능하다면 이를 응용한 실험도 가능하지 싶습니다.

공용 와이파이가 충분하지 않으니 현재의 스마트 폰 통신환경으로 전환이 가능할텐데. 예를 들어 드론에 스마트폰 자체나 폰의 모듈을 장착해서 ,역시 GPS 기능과 연동시킬 수 있다면 원하는 목적지까지 배달도 가능하지 않을까요? 

아마 아마존이나 중국 IT 업체에서 채용하려는 드른 배달이 이 방식이 아닐까 싶습니다. 그렇다면 이건 곧바로 토마호크란 순항 미사일과 같은 개념이 될 수 있습니다.

과거와는 달리 요즘 추세는 개발된 기술의 개방입니다. 즉 어떤 플랫폼을 생성하고 그 안에 누구나 참여가 가능하도록 완전 개방을 한 뒤, 오고사는 정보를 플랫폼 내에 축적시켜 다음 단계로의 발전을 도모하는 방식입니다.

전술한 바와 같이 이런 기술은 누군가 나쁜 마음을 먹는다면 얼마든지 악의적인 도구로 활용될 수 있습니다.

한편 이 기술은 우리가 갖고 있는 오디오에도 곧바로 적용할 수 있으니 대단히 흥미있습니다. 문젠 키트가 가진 출력입니다. 현재로썬 채널당 출력은 3와트 이상은 어려울 것으로 보입니다만 누군가 고출력 앰프 기능을 접합해 줄 수 있다면 나만의 AI 스피커는  또 다른 형태로도 만들어질 수 있을 겁니다.

하지만 AI가 고작 음악 틀어줘 따위에만 쓰인다면 그건 기술의 낭비입니다. 기사 내용엔 온습도계를 부착해 현재 온도를 음성으로 듣는 방법도 나옵니다.

바야흐로 우린 과거 공상과학 소설에서나 볼 수 있었던 장면들이 현실로 보이는 시대로 접어들고 있습니다.