Overview
Coursera Flash Sale
40% Off Coursera Plus for 3 Months!
Grab it
이 컨퍼런스 발표에서는 LLM과의 자연스러운 음성 대화를 위한 혁신적인 음성합성 기술을 탐구해보세요. LLM의 텍스트 중심 한계를 극복하고 실시간 대화형 음성 인터페이스를 구현하는 SK텔레콤의 최신 연구 성과를 살펴보며, 기존 TTS 방식의 구조적 한계와 이를 해결하기 위한 Language Model Streaming Vocoder 기반 2단계 TTS 시스템의 설계 원리를 이해하세요. 음질과 응답 속도라는 상충되는 요구사항을 균형있게 만족시키는 기술적 접근법을 배우고, 응답 지연 및 발화 부자연성 문제를 효과적으로 해결하는 방법론을 습득하세요. LLM 환경에서의 실시간 음성 출력이 직면한 기술적 난제와 이를 극복한 구조적 솔루션, 그리고 실제 서비스 환경에 적용 가능한 수준까지 안정화된 기술의 성능 성과를 구체적으로 분석해보며, AI Agent와의 자연스러운 음성 대화 인터페이스 구현을 위한 실무적 인사이트를 얻으세요.
Syllabus
소리 내어 말하는 LLM: AI와의 자연스러운 대화를 위한 음성합성 기술 | SK텔레콤 이준모
Taught by
SK AI SUMMIT 2024