무슨 일인가

3월 26일, Google이 Gemini 3.1 Flash Live를 Google AI Studio에서 무료 프리뷰로 공개했습니다. 실시간으로 사람과 대화하는 AI 서비스 — 고객 상담 봇, 음성 안내 서비스, AI 통화 비서 등 — 를 만들 수 있는 API(프로그램 연결 도구)입니다.

이번 모델의 핵심은 '지연 없는 자연스러운 대화'입니다. 기존 음성 AI가 질문을 받고 잠깐 멈췄다가 답하는 느낌이었다면, Gemini 3.1 Flash Live는 대화 속도에 맞춰 즉시 반응합니다. 또한 카페처럼 시끄러운 환경에서도 사람 목소리를 정확히 인식하고, 복잡한 지시 사항도 대화 흐름이 바뀌어도 잊지 않고 따릅니다.

음성만이 아닙니다. 화면이나 영상을 실시간으로 '보면서' 대화하는 것도 가능해, 이미 디자인 툴 Stitch와 RPG 게임 서비스에서 이를 활용하고 있습니다.

핵심

  • 지금 바로 무료 사용 가능 — Google AI Studio에서 프리뷰로 즉시 이용 가능

  • 90개 이상 언어 지원 — 한국어 포함 실시간 다국어 음성 대화 가능

  • 음성 + 비전 동시 처리 — 소리를 들으면서 화면도 볼 수 있는 멀티모달(여러 감각을 함께 처리하는) 방식

음성 AI 서비스의 진입 장벽이 낮아지고 있다

전화 ARS, 음성 안내, 실시간 통역 같은 서비스는 그동안 대기업만 구축할 수 있는 영역이었습니다. 이제 기획자나 1인 창업자도 이런 도구를 활용해 음성 기반 서비스를 실험해볼 수 있게 됐습니다. 당장 개발이 어렵더라도, '이런 게 가능하다'는 감각을 갖고 있는 것만으로도 아이디어 기획 방식이 달라질 수 있습니다.