일레븐랩스(ElevenLabs):창업 이야기부터 AI음성 기술의 미래까지

Notice

Recent Posts

Recent Comments

Link

250x250

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

컴공생의 태블릿

일레븐랩스(ElevenLabs):창업 이야기부터 AI음성 기술의 미래까지 본문

카테고리 없음

일레븐랩스(ElevenLabs):창업 이야기부터 AI음성 기술의 미래까지

R3DTOMATO 2025. 4. 11. 23:56

728x90

일레븐랩스의 시작

일레븐랩스(ElevenLabs)는 2022년 설립된 AI 음성 합성 스타트업으로, 폴란드 출신의 마티 스타니슈브스키(Mati Staniszewski)와 표트르 담브코우스키(Piotr Dąbkowski)가 공동 창업했습니다(unicornfactory.co.kr). 두 창업자는 어린 시절부터 친구 사이로 알려져 있으며, 각각 빅데이터 기업 팔란티어(Staniszewski)와 구글(Dąbkowski)에서 경력을 쌓은 머신러닝 전문가였습니다(techfundingnews.com). 창업 아이디어의 출발점은 폴란드의 독특한 영화 더빙 관행에 대한 불만이었습니다. 폴란드에서는 해외 영화가 한 명의 단조로운 목소리로 일괄 더빙되는데, 어린 시절 이를 보고 자란 두 사람은 “만약 AI를 통해 영화 속 각 캐릭터의 목소리를 원어 그대로 모든 언어로 들을 수 있다면 얼마나 좋을까?”라는 문제의식을 갖게 되었습니다(sifted.eu). 이러한 ‘폴란드식 더빙’에 대한 좌절이 일레븐랩스 창업의 계기가 되었고, 결국 2022년 4월 주말 프로젝트로 시작된 아이디어를 정식 스타트업으로 발전시켰습니다(turingpost.co.kr).

위 사진은 표트르 담브코우스키(왼쪽) 와 마티 스타니슈브스키(오른쪽) 이다

일레븐랩스는 창업 초기부터 “모든 언어, 모든 목소리로 고품질 콘텐츠에 보편적 접근성을 제공한다”는 사명을 내걸었습니다(turingpost.co.kr). 마티가 CEO, 표트르는 CTO를 맡아 연구 중심 회사로 출발했으며, 초창기에는 별도의 사무실 없이 15명 내외의 인원으로 운영되었습니다(turingpost.co.kr). 두 공동창업자는 첫 6개월간 텍스트-음성 변환(TTS) 기술 개발에 집중하여, 딥러닝 기반으로 감정과 억양까지 자연스럽게 표현해내는 자체 모델을 구축했습니다(turingpost.co.kr). 2023년 1월에는 베타 버전의 첫 제품을 출시하여 웹 플랫폼을 공개했고, 마티 CEO가 직접 잠재 고객인 콘텐츠 크리에이터들과 연락을 취하며 기술의 활용 사례를 발굴하는 등 현장 피드백을 적극 수집했습니다(turingpost.co.kr). 이러한 노력 덕분에 출시 초기에 확보한 사용자 사례와 입소문이 투자자들의 관심을 끌었고, 일레븐랩스는 설립 1년 만에 초기 투자 유치에 성공하며 본격적인 성장 궤도에 올라섰습니다(sifted.eu).

성장 현황과 최신 동향

급속 성장과 사업 규모: 일레븐랩스는 불과 2년 만에 음성합성 분야의 유니콘 기업으로 성장했습니다. 2024년 1월 세콰이어 캐피탈 등이 참여한 시리즈 B 투자를 통해 기업가치 11억 달러(약 1.4조 원)를 인정받았고(unicornfactory.co.kr), 2025년 1월에는 시리즈 C 투자 유치로 기업가치가 약 33억 달러(약 4조 원)로 세 배 상승했습니다(elevenlabs.io). 현재 직원 수는 120명 이상으로 증가하여 런던, 뉴욕, 바르샤바 등에 거점을 둔 글로벌 팀을 이루고 있으며(elevenlabs.io), 본사는 미국 뉴욕에 있습니다(techfundingnews.com). 서비스 출시 첫 해에 이미 100만 명 이상의 사용자를 확보했으며(unicornfactory.co.kr), 2025년 초 기준으로 “수백만 명의 사용자”가 일레븐랩스의 음성합성 도구를 이용하고 있습니다(elevenlabs.io). 그동안 생성된 오디오 콘텐츠 분량은 누적 1,000년에 달하며, Fortune 500 기업의 60% 이상에서 직원들이 ElevenLabs 플랫폼이나 API를 활용하고 있을 정도로 광범위한 산업 분야에 침투해 있습니다(elevenlabs.io).

언어 지원과 글로벌 확장: 일레븐랩스는 다국어 음성합성에 강점을 지니고 있어, 현재 30개 이상 언어를 지원합니다(unicornfactory.co.kr). 처음에는 영어 중심의 서비스로 시작했으나, 2023년 후반부터는 AI 더빙 스튜디오를 통해 30여 개 언어로 오디오를 자동 번역하면서도 원본 화자의 목소리 특징을 유지하는 기능을 선보였습니다(techfundingnews.com). 예를 들어, 우크라이나 대통령 젤렌스키와 미국 팟캐스터 렉스 프리드먼의 대담을 일레븐랩스 기술로 영어, 우크라이나어, 러시아어로 실시간 번역·합성했을 때, 젤렌스키 고유의 목소리 톤과 억양이 언어를 넘나들며 그대로 보존되는 놀라운 데모를 보여주기도 했습니다(turingpost.co.kr). 이러한 다국어 지원은 창업 초기부터 내세운 “모든 언어로 접근 가능하게 한다”는 비전을 구현한 것으로, 회사는 아시아, 남미 등 비영어권 시장으로의 확장을 위해 폴란드와 인도에 R&D 거점을 마련하는 등 글로벌 행보를 가속화하고 있습니다(elevenlabs.io,elevenlabs.io).

요금제와 서비스 구조: 일반 사용자가 손쉽게 이용할 수 있도록 부분 유료화(freemium) 모델을採用하고 있습니다. 누구나 웹사이트에 가입하면 매월 1만 자(텍스트 기준 약 10분 분량)의 음성 합성을 무료로 체험할 수 있으며, 상업적 이용을 원할 경우 유료 구독을 통해 더 많은 분량과 고급 기능을 사용할 수 있습니다. 개인 크리에이터를 위한 Starter 플랜은 월 $5 수준으로 3만 자(약 30분) 분량 합성이 가능하고 음성 클로닝 기능도 포함됩니다. Creator 플랜(월 $22)은 10만 자(약 100분)로 용량이 늘고 더 높은 음질의 오디오 출력과 ‘프로페셔널’ 음성 클로닝을 지원합니다(elevenlabs.io). 전문 콘텐츠 제작사나 기업을 위한 Pro 플랜(월 $99)은 50만 자 이상을 처리할 수 있고 API를 통한 고음질 출력 등의 추가 기능을 제공합니다(elevenlabs.io). 이 밖에도 Scale 및 Business 플랜으로 분당 요금을 낮춘 대용량 구독 옵션과 엔터프라이즈 대상의 맞춤형 요금제도 마련되어 있어, 1인 크리에이터부터 대기업까지 규모에 맞는 서비스를 선택할 수 있습니다(elevenlabs.io).

투자 내역: 일레븐랩스는 설립 직후부터 유수의 투자사들로부터 러브콜을 받으며 빠르게 자금을 확보했습니다. 아래는 주요 투자 유치 내역입니다:

프리시드 (Pre-seed) – 2023년 1월: $200만 투자 유치 (Credo Ventures, Concept Ventures 주도)(techfundingnews.com). 초기 제품 개발 및 인재 채용을 위한 시드 자금.
시리즈 A – 2023년 6월: $1,900만 투자 유치 (Andreessen Horowitz 주도, Nat Friedman 등 참여)(techfundingnews.com). 제품 고도화와 시장 확장 자금으로 활용.
시리즈 B – 2024년 1월: $8,000만 투자 유치 (a16z, 세콰이어 캐피탈 등 참여)(techfundingnews.com). 기업가치 약 11억 달러로 평가받으며 유니콘 반열에 오름(unicornfactory.co.kr). 다국어 더빙 등 신규 기능 개발 가속화.
시리즈 C – 2025년 1월: $1억 8,000만 투자 유치 (ICONIQ Growth 및 a16z 공동 주도)(elevenlabs.io). 투자 후 기업가치 약 33억 달러로 상승(elevenlabs.io). 총 누적 투자액은 약 $2억 8,100만에 이릅니다. 이 라운드에는 NEA, 세일즈포스 벤처스, LG기술벤처스 등 전략적 투자자들도 새롭게 참여하여 글로벌 진출과 연구개발을 지원하고 있습니다(elevenlabs.ioelevenlabs.io).

최근 업데이트 (2024~2025): 2023년부터 2024년에 걸쳐 일레븐랩스는 제품군 확장과 기술 고도화에 주력했습니다. 2023년 말 출시된 ElevenLabs Conversational AI는 실시간 대화형 음성 에이전트를 만들 수 있는 플랫폼으로, 출시 두 달 만에 25만 개 이상의 AI 음성 에이전트가 제작되는 등 호응을 얻었습니다(elevenlabs.io). 또한 Eleven Reader라는 모바일 앱을 선보여 사용자가 전자책(PDF/뉴스)을 AI 음성이 읽어주도록 하고, Voice Design 기능을 통해 텍스트로 설명된 스타일의 새로운 목소리를 생성할 수 있게 했습니다(elevenlabs.io). 2024년에는 Flash 라는 초고속 TTS 모델(75밀리초 지연)과 Sound Effects 모델 등 음성 외에 효과음까지 생성하는 기능도 추가되며 오디오 AI 전반으로 기술 범위를 넓혔습니다(elevenlabs.ioelevenlabs.io). 한편, 음성 복제 윤리 논란에 대응하여, 유명인의 목소리를 합성해 퍼뜨린 사용자를 추적해 차단하는 등 적극적인 조치를 취했고(unicornfactory.co.kr), 2024년 미국 선거를 앞두고 OpenAI, Anthropic 등과 함께 AI 음성의 오남용 방지 협약을 체결하며 기술 악용 방지에도 힘쓰고 있습니다(unicornfactory.co.kr). 이러한 기술적·정책적 업데이트를 통해 일레븐랩스는 품질과 책임성 양 측면에서 업계 선도 입지를 공고히 다지고 있습니다.

AI 음성 시장과 일레븐랩스의 행보

AI 음성 시장의 성장 가능성: 전문가들은 향후 몇 년간 AI 음성 합성 시장이 폭발적으로 성장할 것으로 내다보고 있습니다. 음성은 인간에게 가장 자연스러운 인터페이스인 만큼, 개인 비서부터 콜센터용 자동 응대, 오디오 광고, 게임 NPC, 맞춤형 오디오북에 이르기까지 수많은 분야에서 자연스러운 기계 음성 수요가 급증할 전망입니다nea.com. 일레븐랩스의 공동창업자 마티 스타니슈브스키 CEO는 “오디오 분야의 OpenAI 같은 존재가 되고 싶다”고 밝힐 만큼, 음성 합성 분야의 플랫폼 표준을 노리고 있습니다sifted.eu. 실제로 일레븐랩스는 **“가장 포괄적인 오디오 AI 플랫폼 구축”**을 목표로 내세우고 연구개발을 이어가고 있는데elevenlabs.io, 이는 단순한 TTS를 넘어 음성으로 소통하는 디지털 인터랙션의 새 시대를 열겠다는 야심을 반영합니다.

경쟁 구도와 일레븐랩스의 강점: 현재 AI 음성합성 분야에서는 빅테크 기업들과 스타트업들이 경쟁하고 있습니다. 구글, 아마존, 마이크로소프트 등도 각자의 AI 음성 기술(WaveNet, Polly, Azure TTS 등)을 보유하고 있고, 오픈소스 커뮤니티에서도 VALL-E나 Bark 등의 모델이 등장하고 있습니다. 이런 경쟁 속에서 일레븐랩스가 두각을 나타내는 강점은 탁월한 음질과 표현력, 그리고 손쉬운 접근성입니다. 자체 개발한 딥러닝 모델 **“Prime Voice AI”**는 텍스트의 문맥을 깊이 이해하여 인간 특유의 억양, 감정, 말투까지 담아내는 자연스러운 음성을 생성하는데, 작은 디테일 하나까지도 완성도를 높여 소위 **오디오 언캐니밸리(Uncanny Valley)**를 극복했다는 평가를 받습니다nea.com. 또한 웹 브라우저만으로 누구나 몇 분 만에 원하는 목소리를 만들어낼 수 있는 사용 편의성은 경쟁사 대비 큰 장점으로 꼽힙니다. 일레븐랩스 기술의 높은 완성도는 이미 여러 산업에서 입증되고 있으며, 창업 3년 만에 이룬 뛰어난 성장성과 효율성으로 **“카테고리를 정의하는 기업”**이라는 투자업계의 평가도 받고 있습니다nea.com.

업계 내 입지와 기업 전략: 일레븐랩스는 현재 생성형 음성합성 분야 1위 스타트업으로서 확고한 입지를 굳히고 있습니다. 2024년 기준 누적 투자액, 기업가치, 이용자 수 모든 면에서 경쟁 업체들을 앞서 나가고 있으며, 타임(Time)지가 선정한 AI 분야 혁신가 100인에 CTO 표트르 담브코우스키가 이름을 올릴 정도로 기술 리더십도 인정받았습니다elevenlabs.io. 한편으로 회사는 파트너십과 생태계 구축을 핵심 전략으로 삼고 있습니다. 2023년 디즈니가 주관하는 액셀러레이터 프로그램에 선정되어 할리우드 엔터테인먼트 분야와 협업을 모색했고sifted.eu, 유명 영화배우 유산 관리 단체들과 협의하여 고(故) 주디 갈랜드, 제임스 딘 등의 목소리를 정식 라이선스로 서비스에 포함시키는 등techfundingnews.com 콘텐츠 업계와의 협력에도 적극 나서고 있습니다. 이를 통해 향후 영화 더빙 시장이나 오디오북 산업에서도 윤리적이며 대규모로 확장 가능한 사업 모델을 구축하려는 것으로 보입니다. 또한 기업용 시장을 위해 엔터프라이즈 솔루션 강화, 아시아와 남미 지역 현지화, 그리고 음성합성 AI 안전성 확보를 위한 선제적 조치에 투자를 늘리고 있습니다elevenlabs.ioelevenlabs.io. 마티 CEO는 “디지털 상호작용이 결국 음성으로 이뤄지는 미래를 그리고 있으며, 이를 위해 앞으로 수십 년을 내다보는 긴 호흡으로 회사를 이끌겠다”는 포부를 밝힌 바 있습니다sifted.eu. 이런 비전 아래 일레븐랩스는 지속적인 연구개발 투자와 선별적인 자금 조달 전략을 병행하며 (뚜렷한 목표가 서지 않으면 추가 자금을 받지 않겠다고 밝힘sifted.eu), AI 음성 기술 분야의 글로벌 선두주자로 자리매김하기 위한 행보를 이어갈 전망입니다.

대표적인 활용 사례: 유튜브부터 교육까지

일레븐랩스의 기술은 이미 다양한 분야에서 활용되며 그 가치를 증명하고 있습니다. 주요 활용 사례별 예시는 다음과 같습니다.

콘텐츠 크리에이터 (유튜브 등): 다국어 시청자층을 가진 유튜버와 팟캐스터들이 일레븐랩스를 활용해 자신의 콘텐츠를 여러 언어로 더빙하고 있습니다. 예를 들어 인기 유튜브 채널을 운영하는 한 크리에이터는 영어 영상에 스페인어와 일본어 음성을 입혀 글로벌 조회수를 높였으며, 유명 팟캐스터 렉스 프리드먼도 일레븐랩스로 인터뷰 영상을 영어 외에 우크라이나어, 러시아어 버전으로 제공했습니다(turingpost.co.kr). 일레븐랩스의 자연스러운 음성 합성 덕분에 시청자들은 마치 크리에이터가 직접 해당 언어로 말하는 듯한 경험을 하고 있습니다(unicornfactory.co.kr).
출판 및 오디오북: 전통적인 출판사와 작가들도 AI 음성을 적극 도입하고 있습니다. 영국 대형 출판사 **하퍼콜린스(HarperCollins)**는 일레븐랩스와 파트너십을 맺고 베스트셀러 소설의 오디오북을 AI 음성으로 제작하고 있습니다(unicornfactory.co.kr). 특히 성우 섭외가 어려운 다수 언어로 동시 출간하거나, 저자의 목소리를 클로닝하여 작가 본인이 직접 낭독하는 듯한 오디오북을 내놓는 실험도 이루어지고 있습니다. 일레븐랩스는 고전 영화배우들의 목소리를 AI로 복원해 책을 읽어주는 프로젝트도 진행했는데, 주디 갈랜드나 제임스 딘의 음성으로 옛 명작 소설을 낭독하게 한 사례는 큰 화제를 모았습니다(techfundingnews.com). 이처럼 출판 업계는 AI 음성을 활용해 오디오북 제작 비용을 획기적으로 낮추고 다국어 콘텐츠를 확산하는 데 힘쓰고 있습니다.
게임: 게임 개발사들도 일레븐랩스의 기술을 활용하여 게임 캐릭터 대사를 생성하고 있습니다. 대표적으로 **패러독스 인터랙티브(Paradox Interactive)**는 방대한 스크립트의 게임에서 조연 캐릭터들의 음성을 일레븐랩스로 생성함으로써 개발 비용과 시간을 절감했습니다(elevenlabs.io). 또 인디 게임 스튜디오는 목소리 연기자가 없는 초기 프로토타입 단계에서 AI 음성으로 캐릭터 대사를 입혀 게임 분위기를 테스트하는 등 창작 과정에 활용하고 있습니다(techfundingnews.com). 일레븐랩스의 음성은 감정 표현이 풍부하여, 게임 내에서 NPC의 감정 변화나 상황 연출에도 유용하며, 플레이어가 만든 모드(mod) 콘텐츠에서 원하는 캐릭터 음성을 합성하는 등 커뮤니티 활용 사례도 나타나고 있습니다.
광고 및 미디어: 광고, 방송 분야에서도 AI 성우에 대한 수요가 높습니다. 글로벌 광고회사 **퍼블리시스(Publicis)**는 광고 더빙에 일레븐랩스 음성을 시험 적용했고, 미국 라디오 방송사 **오더시(Audacy)**는 라디오 광고 녹음에 AI 보이스를 일부 도입했습니다(unicornfactory.co.kr). ESPN 등 스포츠 매체는 하이라이트 영상의 내레이션을 여러 언어의 AI 음성으로 자동 생성해 지역별 시청자에게 제공합니다(elevenlabs.io). **타임(Time)**지와 워싱턴포스트(WP) 같은 언론사는 자사 기사 웹페이지에 “AI 보이스로 듣기” 기능을 도입했는데, 일레븐랩스 기술을 통해 기사를 부드러운 내레이션으로 제공하고 있습니다(unicornfactory.co.kr). 이처럼 미디어 업계는 대량의 멀티언어 음성 콘텐츠를 빠르게 생산하기 위해 일레븐랩스를 활용하고 있으며, 개인 맞춤형 광고나 지역화된 방송에도 응용이 확산되고 있습니다.
교육 및 접근성: 교육 현장에서는 일레븐랩스의 기술이 학습자료 오디오화와 언어 교육 등에 활용됩니다. 예를 들어 Chess.com과 같은 온라인 교육 플랫폼은 체스 강좌나 기보 해설을 여러 언어의 음성으로 제공하여 이용자 편의를 높였고(elevenlabs.io), Praktika.ai 등의 언어학습 앱은 AI 원어민 튜터의 목소리로 발음 교정을 해주는 기능을 선보였습니다(elevenlabs.io). 또한 장애인의 정보 접근성을 위해 시각장애인 지원 기관들이 일레븐랩스와 제휴하여 텍스트 콘텐츠를 음성으로 변환해 제공하고 있습니다(techfundingnews.com). 일레븐랩스는 ALS(루게릭병) 환자처럼 목소리를 잃어가는 이들을 위해 본인의 옛 음성 녹음을 학습시켜 잃어버린 목소리를 되찾아주는 프로젝트도 진행 중입니다(nea.com). 이처럼 교육 및 접근성 분야에서 일레븐랩스는 AI 낭독자이자 맞춤형 음성 교사로서 역할을 톡톡히 하고 있습니다.

일레븐랩스 활용한 동영상 입니다.(elevenlab youtube)

TTS부터 음성 클로닝까지

일레븐랩스의 핵심 경쟁력은 최첨단 텍스트-음성 변환(TTS) 기술과 음성 클로닝(Voice Cloning) 기술을 결합하여, 누구나 손쉽게 원하는 목소리로 자연스러운 음성을 만들어낼 수 있다는 점입니다. 기술적인 특장점을 몇 가지로 정리하면 다음과 같습니다.

고품질 텍스트-음성 변환 (TTS): 일레븐랩스의 TTS 엔진은 딥러닝 엔드투엔드 모델로 구축되어 문자 입력을 사람처럼 자연스러운 음성으로 변환합니다. 내부적으로 텍스트 정규화 -> 음소 변환 -> 시퀀스투시퀀스 변환 -> 보코더 합성의 단계를 거치며, 최신 Transformer 계열 모델과 WaveNet 계열 신경망 보코더를 활용해 발음, 운율, 억양을 정교하게 재현합니다(turingpost.co.kr). 그 결과 출력 음성은 기존 TTS에서 종종 느껴지던 기계적 어색함을 크게 줄였고, 사람이 말할 때의 미묘한 끊어 읽기, 강세, 감정 변화까지 포착하여 전달합니다(nea.com). 예를 들어 문장의 맥락에 따라 말끝을 올리거나 감탄하는 억양까지 표현해내어 듣는 이로 하여금 AI가 아닌 실제 사람이 말하는 것 같은 몰입감을 줍니다.
음성 클로닝과 보이스 디자인: 일레븐랩스는 사용자가 임의의 목소리를 복제하거나 새로 디자인할 수 있는 도구를 제공합니다. Instant Voice Cloning 기능을 이용하면 단 1분 정도 분량의 음성 샘플만 업로드해도 해당 화자의 목소리 특징을 캡처하여 새로운 문장을 말하게 할 수 있습니다(unicornfactory.co.kr). 더 긴 30분 분량의 음성을 학습시킬 경우 억양이나 말투까지 원본 화자와 거의 구분 불가능한 고정밀 복제가 이루어지며(unicornfactory.co.kr), 이를 프로페셔널 클로닝이라 부릅니다. 또한 Voice Design 기능을 통해 특정 성별·연령대의 목소리 스타일이나 감정을 텍스트로 묘사하면 AI가 그에 맞는 새로운 목소리를 생성해줍니다(elevenlabs.io). 이로써 사용자는 실제로 존재하지 않는 가상의 목소리도 만들어낼 수 있어, 콘텐츠에 맞춤형 캐릭터 보이스를 입히는 등 창의적인 활용이 가능합니다. 일레븐랩스는 이렇게 생성된 음성을 모아 **Voice Library(음성 라이브러리)**를 구축하고 있으며, 타 사용자가 공개한 AI 목소리를 활용하거나 상업적으로 라이선스할 수도 있게 하는 음성 마켓플레이스도 운영하고 있습니다(techfundingnews.comtechfundingnews.com).
다국어 합성과 음성 이식: 일레븐랩스 기술의 뛰어난 점之一는 하나의 목소리 모델로 여러 언어를 구사할 수 있다는 것입니다. 즉, 영어로 된 음성 프로파일을 만들었다면 동일한 목소리로 한국어, 스페인어, 일본어 등 다른 언어의 텍스트도 말할 수 있습니다. 이는 언어에 상관없이 화자의 고유 음색과 억양을 유지하는 기술 덕분인데, 실제로 젤렌스키 대통령의 영어 연설을 그의 목소리로 중국어로 실시간 통역하는 시연에서 그 정확도가 입증되었습니다(unicornfactory.co.krunicornfactory.co.kr). 현재 30여 개 언어에서 이러한 멀티링귤 모델이 적용되어 있으며(techfundingnews.com), 특히 2024년 업데이트로 발표된 AI 더빙 스튜디오는 원본 영상의 음성을 타语言로 자동 변환하면서 음색과 감정을 보존해주는 도구로 주목받고 있습니다(techfundingnews.com). 이 기능을 통해 영화나 영상 콘텐츠를 다른 언어로 입술 동기화까지 자연스럽게 더빙하는 것이 가능해져, 향후 영화 산업의 판도를 바꿀 기술로 평가됩니다.
스타일 및 감정 조절: 일레븐랩스의 AI 음성은 단순히 글자를 읽는 것을 넘어 감정과 말투를 담아냅니다. 기본적으로 모델 자체가 훈련된 데이터에서 다양한 화자의 감정 표현 패턴을 익혔기 때문에, 물음표나 느낌표, 슬픈 내용의 문장 등 맥락에 따른 어조 변화를 자연스럽게 적용합니다(nea.com). 사용자도 합성 설정에서 Stability(안정성)와 Clarity(명료도) 등의 파라미터를 조정하여 음성의 톤을 다소 차분하게 혹은 활기차게 튜닝할 수 있습니다. 예컨대 Stability 값을 낮추면 음성이 더 격정적이고 감정 기복이 커지며, 높이면 단조롭지만 안정된 톤을 얻게 됩니다 (이 기능은 마치 감정 조절 장치처럼 활용됩니다). 또한 앞서 언급한 다국어 더빙에서는 원언어 화자의 감정까지 타언어로 이식되는데, 일레븐랩스는 번역 과정에서 문장의 뉘앙스를 파악해 최대한 원 발화자의 감정 곡선을 유지하려고 합니다(techfundingnews.com). 이러한 세밀한 스타일 컨트롤은 성난 목소리, 웃는 목소리, 속삭이는 톤 등 콘텐츠에 필요한 특별한 연출도 가능하게 해주며, 사용자들은 별도 튜닝 없이도 콘텍스트만으로 감정이 실린 음성을 얻을 수 있다고 평가합니다.
기타 기술적 요소: 이외에도 일레븐랩스는 실시간 음성 변환(Speech-to-Speech) 기술을 연구하여 한 사람의 목소리로 입력된 음성을 다른 목소리로 바꿔주는 기능도 선보였습니다(techfundingnews.com). 이는 통역이나 목소리 변조가 필요한 분야에 응용될 수 있습니다. 또 배경 잡음이 섞인 음성에서 순수한 목소리만 추출하는 Voice Isolator 기술도 개발하여, 녹음 퀄리티가 낮은 음성 샘플도 깨끗하게 정제한 후 클로닝할 수 있도록 지원합니다(elevenlabs.io). 이러한 부가 기술들과 통합적인 API 제공으로, 일레븐랩스는 단순한 TTS 서비스에 머무르지 않고 종합 음성 AI 플랫폼으로 발전하고 있습니다.

창업자들의 주요 활동과 행보

일레븐랩스의 두 공동창업자는 창업 이후 사업 성장과 더불어 기술 전파와 책임 윤리 실현을 위해 다양한 활동을 펼치고 있습니다.

투자 유치와 전략적 성장: 마티 스타니슈브스키 CEO와 표트르 담브코우스키 CTO는 초기부터 유수 VC들을 설득하여 대규모 투자를 유치했고, 회사를 공격적으로 성장시키면서도 신중한 자금 운용 원칙을 지켜왔습니다. 2023년 초 어렵게 프리시드 투자를 받은 이후 제품이 주목받자 Andreessen Horowitz, Sequoia Capital 같은 세계 최정상 투자자들을 끌어들이는 데 성공했고(sifted.eu), 2년도 채 되지 않아 누적 투자금 2억 달러를 넘길 만큼 재무적 성과를 이뤄냈습니다. 그러나 마티 CEO는 **“구체적 목표가 없으면 펀드레이징을 하지 않는다”**고 밝히는 등(sifted.eu), 필요 이상으로 자본을 끌어들이지 않고 목표 지향적으로 투자금을 활용하는 모습을 보이고 있습니다. 이런 전략 덕분에 현재까지 자본 효율성을 유지하며 회사를 운영하고 있고, 투자자들에게도 신뢰를 주고 있습니다. 또한 디즈니 액셀러레이터 참여(sifted.eu)와 Deutsche Telekom, LG 등 전략적 투자자 유치를 통해 단순한 자금 조달을 넘어 업계 거물들과 파트너십을 맺는 기회로 삼는 등 영리한 행보를 이어가고 있습니다.

SNS 소통과 비전 공유: 마티 스타니슈브스키는 트위터(X)를 비롯한 SNS에서도 적극적으로 소통하며 회사의 비전과 성과를 공유합니다. 그의 트위터 소개에는 **“우리의 미션은 콘텐츠를 어떤 언어나 목소리로든 모두에게 접근 가능하게 만드는 것”**이라고 명시되어 있는데(twstalker.com), 이는 창업 때부터 일관된 회사의 목표이기도 합니다. 그는 주요 제품 업데이트나 데모 영상을 자신의 SNS에 올려 팔로워들과 흥분을 나누고, 때로는 기술의 영향력에 대한 견해를 밝히기도 합니다. 2025년 1월 시리즈 C 투자 소식을 전하며 “모든 AI 에이전트에 목소리를 부여하기 위한 새로운 장이 열렸다”는 멘트와 함께 성과를 알린 것(twitter.com)처럼, 중요한 이정표마다 대중과 투명하게 소통하며 커뮤니티의 지지를 얻고 있습니다. 이러한 적극적인 온라인 활동 덕분에 일레븐랩스는 입소문을 타고 개발자, 크리에이터 커뮤니티에서 빠르게 인지도を 높였고, 사용자 피드백을 실시간으로 제품에 반영하는 민첩한 개발 문화도 구축했습니다.

윤리적 이슈 대응: 창업자들은 AI 음성 기술이 초래할 수 있는 윤리적 문제에 대해서도 책임감 있는 태도를 보이고 있습니다. 2023년 초 일부 사용자가 일레븐랩스의 음성 복제를 악용해 유명인(조 바이든 미국 대통령)의 가짜 음성 메시지를 유포한 사건이 발생했을 때, 회사는 즉각 해당 사용자 계정을 차단하고 재발 방지 대책을 발표했습니다(unicornfactory.co.kr). 이후 클로닝 기능을 악용하지 못하도록 음성 모니터링 시스템과 이용자 인증 절차를 강화했고, 필요 시 법적 대응도 불사하겠다고 밝히며 악용 사례에 강경하게 대처했습니다. 또한 미국 선거를 앞둔 상황에서 생성형 AI의 오용을 막기 위해 OpenAI, 구글 등과 함께 AI 윤리 서약에 동참하였고, 정치인 음성 합성에 대한 가이드라인도 수립했습니다(unicornfactory.co.kr). 마티 CEO는 언론 인터뷰에서 “AI 음성 기술은 엄청난 잠재력을 지닌 만큼, 규제 당국과 협력하여 악용 방지 장치를 마련하는 데 최선을 다할 것”이라고 강조하며 딥페이크 등의 위험성에 정면 대응하는 입장을 밝혔습니다(sifted.eusifted.eu). 이러한 노력은 기술 혁신과 사회적 책임을 균형 있게 추구하려는 창업자들의 철학을 보여주는 대목입니다.

업계 및 대중과의 교류: 일레븐랩스 창업자들은 각종 컨퍼런스와 인터뷰, 미디어를 통해 업계 인사이트를 공유하고 대중과 교류하고 있습니다. 마티 스타니슈브스키는 2024년 <타임>지 “Next 100” 인터뷰에서 음성 기술이 지닌 힘에 대해 이야기했고, Sifted와의 인터뷰에서는 “우리는 오디오 분야의 판도를 바꾸고 있다. 목표는 모든 콘텐츠를 모든 사람에게 전달하는 것”이라는 비전을 재확인했습니다(sifted.eu). 또한 2023년에는 핀란드 Slush, 미국 SXSW 등 스타트업 이벤트 무대에 올라 일레븐랩스의 데모를 시연하고 투자자들과 패널 토론을 하는 등 적극적인 홍보 활동을 펼쳤습니다. 2025년 초에는 경제지 <월스트리트저널> 주최 CEO 서밋에 초청받아 생성 AI의 미래에 대해 견해를 나누기도 했습니다. 이처럼 창업자들은 회사 경영뿐만 아니라 업계 오피니언 리더로서도 활약하며, AI 음성 생태계 전반의 성장을 이끄는 모습입니다.

일레븐랩스는 혁신적인 기술력과 발 빠른 전략 실행으로 단기간에 음성 AI 분야의 선두에 올라섰습니다. 창업자들의 비전과 실행력, 그리고 급변하는 시장에 대응하는 민첩함이 어우러져, 전 세계 수많은 사람들이 일레븐랩스의 기술로 생성된 목소리를 일상에서 접하고 있습니다. 앞으로도 일레븐랩스가 언어 장벽을 허무는 보편적 음성 기술 플랫폼으로 진화하며, 콘텐츠 접근성의 지평을 얼마나 넓혀나갈지 주목됩니다(techfundingnews.com). AI 음성 기술의 미래를 궁금해하는 일반 독자라면, 일레븐랩스의 행보를 통해 다가올 변화를 미리 엿볼 수 있을 것입니다.

참고 자료: 공식 웹사이트 및 블로그, 투자 발표 자료, 주요 매체 인터뷰와 기사 등을 기반으로 작성했습니다. 모든 수치와 사실은 출처를 명시하여 신뢰도를 높였습니다. 일레븐랩스 관련 보다 자세한 정보는 해당 출처 링크를 통해 확인할 수 있습니다.(techfundingnews.comunicornfactory.co.kr)

728x90

컴공생의 태블릿

일레븐랩스(ElevenLabs):창업 이야기부터 AI음성 기술의 미래까지 본문

일레븐랩스(ElevenLabs):창업 이야기부터 AI음성 기술의 미래까지

일레븐랩스의 시작

성장 현황과 최신 동향

AI 음성 시장과 일레븐랩스의 행보

대표적인 활용 사례: 유튜브부터 교육까지

TTS부터 음성 클로닝까지

창업자들의 주요 활동과 행보

티스토리툴바