일레븐랩스

AI 리더인 ElevenLabs는 최근 1억 8천만 달러의 막대한 자금 조달 라운드로 지원받은 획기적인 움직임으로 오디오 생성을 넘어 영역을 확장하고 있습니다. 다양한 음성 애플리케이션을 구동하는 것으로 이미 알려진 이 회사는 이제 새로운 제품인 Scribe 로 경쟁이 치열한 음성-텍스트 시장에 진출하고 있습니다. 이 대담한 출시는 ElevenLabs가 오디오 생성에서 탁월할 뿐만 아니라 필사 기술을 지배하여 이 분야의 기존 업체에 도전하려는 야망을 보여줍니다.
음성 인식 분야에서 ElevenLabs Scribe의 특징은 무엇입니까?
33억 달러의 가치를 지닌 ElevenLabs는 AI 음성 인식 분야에 생소하지 않습니다. 이전에 이 회사는 방대한 음성 라이브러리를 통해 수많은 음성-텍스트 솔루션을 지원했습니다. 그러나 Scribe는 그들의 첫 번째 독립형 음성-텍스트 모델을 나타내며 Gladia, Speechmatics, AssemblyAI, Deepgram, 심지어 OpenAI의 Whisper와 같은 업계 거인과 경쟁합니다. 그렇다면 Scribe가 이처럼 경쟁이 치열한 분야에서 두각을 나타내는 이유는 무엇일까요?
- 비교할 수 없는 언어 지원 범위 : Scribe는 처음부터 99개 이상의 언어를 지원하여 진정한 글로벌 필사 솔루션으로 자리매김했습니다.
- 주요 언어에서 뛰어난 정확도 : ElevenLabs는 영어(정확도 97%), 프랑스어, 독일어, 힌디어, 일본어, 스페인어를 포함한 25개 이상의 언어에서 뛰어난 정확도(단어 오류율 5% 미만)를 주장합니다. 언어 정확도에 대한 이러한 집중은 주요 차별화 요소입니다. 이러한 주장이 인상적이기는 하지만, 제3자 테스트를 통한 추가 검증은 이러한 수치에 대한 확신을 강화할 수 있습니다.
- 업계를 선도하는 성능 : FLEURS 및 Common Voice와 같은 벤치마크 테스트에서 Scribe는 Google Gemini 2.0 Flash 및 Whisper Large V3와 같은 최고 모델을 능가하는 것으로 알려졌으며, 이는 최첨단 기능을 강조합니다. 이 벤치마크 성공은 AI 기반 필사 모델에서 상당한 도약을 나타내며, 법률 또는 의료 필사와 같이 높은 정확도가 필요한 분야에서 중요할 수 있는 뛰어난 성능을 제공합니다.
ElevenLabs는 원래 대화형 AI 플랫폼을 위해 음성-텍스트 기술을 개발했지만 Scribe 를 통해 이 기술을 독립형 모델로 제공하여 사용자 기반을 확대했습니다.
Scribe의 독특한 기능 탐색
최근 Bitcoin World 와의 인터뷰에서 ElevenLabs CEO Mati Staniszewski는 음성 인식을 개선하기 위한 회사의 비전에 대해 논의했습니다. 그는 회사의 목표가 단순히 콘텐츠를 생성하는 것이 아니라 대화를 더 잘 이해하는 것이라고 강조했습니다. Staniszewski는 또한 음성-텍스트 변환이 완벽하게 해결된 문제라는 오해에 대해 언급했습니다. 특히 정확도가 역사적으로 부족했던 언어의 경우 더욱 그렇습니다. 그에 따르면 회사의 주요 이점 중 하나는 우수한 모델을 개발하는 데 기여하는 사내 데이터 주석 팀에 있습니다.
핵심적인 필사 외에도 Scribe는 여러 가지 뛰어난 기능을 제공합니다.
- 스마트 스피커 대화 : 이 기능은 말하는 사람을 구별할 수 있어 여러 사람이 대화하는 데 이상적입니다.
- 단어 수준 타임스탬프 : Scribe는 각 단어에 대한 정확한 타임스탬프를 제공하여 원활한 자막 생성과 상세한 분석이 가능합니다.
- 사운드 이벤트 자동 태그 지정 : 이 모델은 웃음이나 박수 소리와 같은 사운드 이벤트를 감지하고 태그를 지정하여 필사본에 귀중한 맥락을 추가할 수 있습니다.
현재 ElevenLabs는 Scribe를 스튜디오에 통합하여 사용자가 자막과 캡션을 위해 비디오 콘텐츠를 필사할 수 있도록 했습니다. 현재 사전 녹음된 오디오를 지원하지만, 이 회사는 곧 저지연 실시간 버전이 출시될 것이라고 약속하며, 이는 라이브 회의 필사 및 음성 메모 작성에 대한 새로운 가능성을 열어줄 수 있습니다.
가격과 경쟁: Scribe를 사용할 만한 가치가 있을까?
ElevenLabs는 Scribe를 시간당 $0.40의 경쟁력 있는 가격으로 제공합니다. 일부 경쟁업체는 더 낮은 가격을 제공하지만, 제공되는 기능, 특히 Scribe가 제공하는 정확성과 언어 지원과 비교하는 것이 중요합니다.
다른 공급업체와의 간단한 가격 비교는 다음과 같습니다.
공급자 | 모델 | 강점 | 가격 (대략 1시간당) |
일레븐랩스 | 학자 | 광범위한 언어 지원, 높은 정확도, 벤치마크 성능 | 0.40달러 |
딥그램 | 노바-2 | 실시간 전사, 확장성, 개발자 중심 | 다양하다 |
어셈블리AI | 컨포머-2 | 풍부한 기능, 오디오 인텔리전스, 요약 | 다양하다 |
스피치매틱스 | 글로벌 영어 | 높은 정확도, 악센트 이해 | 다양하다 |
글라디아 | 다양한 모델 | 전문 모델, 소음 강건성 | 다양하다 |
장단점
장점:
- 글로벌 리치(Global Reach) : 99개 이상의 언어를 지원하여 국제적인 애플리케이션에 적합한 다재다능한 도구입니다.
- 높은 정확도 : 영어(정확도 97%)를 포함한 25개 이상의 주요 언어에 대해 낮은 단어 오류율(5% 미만)을 보장합니다.
- 최첨단 성능 : 벤치마크 테스트에서 Google Gemini와 OpenAI의 Whisper와 같은 주요 모델보다 우수한 성능을 보입니다.
- 스마트 대화 : 말하는 사람을 구별하며, 복잡한 여러 사람 대화에 적합합니다.
- 실시간 기능 곧 출시 : 곧 출시될 실시간 음성 변환 기능은 라이브 이벤트와 회의에 큰 변화를 가져올 것입니다.
- 저렴한 가격 : Scribe는 시간당 0.40달러로 고품질 필사본에 대한 경쟁력 있는 가격을 제공합니다.
단점:
- 검증되지 않은 주장 : 정확도 수치가 인상적이기는 하지만, 제3자 검증을 추가로 실시하면 신뢰를 더욱 공고히 하는 데 도움이 될 수 있습니다.
- 제한적인 실시간 지원 : 현재는 사전 녹음된 오디오에만 사용할 수 있지만, 실시간 버전이 곧 제공될 예정입니다.
- 가격 비교 : 저렴하지만, 일부 경쟁업체는 더 낮은 가격을 제시하는 경우가 있습니다. 그러나 가격이 다르거나 정확도가 낮을 수 있습니다.
결론
음성-텍스트 환경이 점점 더 경쟁이 치열해짐에 따라 ElevenLabs의 Scribe는 글로벌 언어 지원, 뛰어난 정확성, 혁신적인 기능의 고유한 조합으로 강력한 영향을 미칠 준비가 되었습니다. ElevenLabs는 보다 정확하고 접근 가능한 필사 솔루션에 대한 수요가 증가함에 따라 이 시장에서 핵심 플레이어가 될 수 있는 무대를 마련했습니다. 정확한 필사에 크게 의존하는 법률, 의료, 미디어와 같은 산업은 이 기술에서 가장 큰 혜택을 볼 가능성이 높습니다. 이 도구가 계속 발전함에 따라 사용자는 더욱 진보된 기능을 기대할 수 있으며, Scribe 는 구어 데이터의 모든 잠재력을 끌어내는 강력한 도구로 자리 매김할 것입니다.
Plisio는 또한 다음을 제공합니다.
2번의 클릭으로 암호화 송장 생성 and 암호화폐 기부 수락
14 통합
- BigCommerce
- Ecwid
- Magento
- Opencart
- osCommerce
- PrestaShop
- VirtueMart
- WHMCS
- WooCommerce
- X-Cart
- Zen Cart
- Easy Digital Downloads
- ShopWare
- Botble
10 가장 많이 사용되는 프로그래밍 언어용 라이브러리
19 암호화폐와 12 블록체인
- Bitcoin (BTC)
- Ethereum (ETH)
- Ethereum Classic (ETC)
- Tron (TRX)
- Litecoin (LTC)
- Dash (DASH)
- DogeCoin (DOGE)
- Zcash (ZEC)
- Bitcoin Cash (BCH)
- Tether (USDT) ERC20 and TRX20 and BEP-20
- Shiba INU (SHIB) ERC-20
- BitTorrent (BTT) TRC-20
- Binance Coin(BNB) BEP-20
- Binance USD (BUSD) BEP-20
- USD Coin (USDC) ERC-20
- TrueUSD (TUSD) ERC-20
- Monero (XMR)