SebelasLabs

Dalam sebuah langkah inovatif, ElevenLabs, pemimpin AI yang baru-baru ini didorong oleh pendanaan besar sebesar $180 juta, memperluas jangkauannya di luar pembuatan audio. Sudah dikenal karena mendukung berbagai aplikasi suara, perusahaan ini sekarang merambah pasar ucapan-ke-teks yang kompetitif dengan penawaran barunya, Scribe . Peluncuran yang berani ini menandai ambisi ElevenLabs untuk tidak hanya unggul dalam pembuatan audio tetapi juga mendominasi teknologi transkripsi, menantang pemain mapan di bidang tersebut.
Apa yang Membedakan ElevenLabs Scribe dalam Pengenalan Ucapan?
Dengan valuasi sebesar $3,3 miliar, ElevenLabs tidak asing lagi dengan bidang pengenalan suara AI. Sebelumnya, perusahaan tersebut mendukung banyak solusi ucapan ke teks melalui pustaka suaranya yang luas. Namun, Scribe menandai model ucapan ke teks mandiri pertama mereka, yang memposisikan mereka melawan raksasa industri seperti Gladia, Speechmatics, AssemblyAI, Deepgram, dan bahkan Whisper milik OpenAI. Jadi, apa yang membuat Scribe menonjol di bidang yang begitu kompetitif?
- Cakupan Bahasa yang Tak Tertandingi : Scribe mendukung lebih dari 99 bahasa sejak awal, memposisikannya sebagai solusi transkripsi yang benar-benar global.
- Akurasi Luar Biasa dalam Bahasa Utama : ElevenLabs mengklaim akurasi luar biasa (dengan rasio kesalahan kata di bawah 5%) dalam lebih dari 25 bahasa, termasuk bahasa Inggris (akurasi 97%), Prancis, Jerman, Hindi, Jepang, dan Spanyol. Fokus pada ketepatan bahasa ini merupakan pembeda utama. Meskipun klaim ini mengesankan, validasi lebih lanjut melalui pengujian pihak ketiga dapat memperkuat keyakinan terhadap angka-angka ini.
- Performa Terkemuka di Industri : Dalam uji benchmark seperti FLEURS dan Common Voice, Scribe dilaporkan mengungguli model-model teratas seperti Google Gemini 2.0 Flash dan Whisper Large V3, yang menonjolkan kemampuan mutakhirnya. Keberhasilan benchmark ini menunjukkan lompatan maju yang signifikan dalam model transkripsi yang digerakkan oleh AI, yang menawarkan performa superior yang dapat menjadi krusial dalam sektor-sektor yang membutuhkan akurasi tinggi, seperti transkripsi hukum atau medis.
ElevenLabs awalnya mengembangkan teknologi ucapan ke teks ini untuk platform AI percakapannya, tetapi dengan Scribe , teknologi ini sekarang tersedia sebagai model mandiri, sehingga memperluas basis penggunanya.
Menjelajahi Fitur-fitur Unik Scribe
Selama wawancara baru-baru ini dengan Bitcoin World , CEO ElevenLabs Mati Staniszewski membahas visi perusahaan untuk meningkatkan pengenalan ucapan. Ia menekankan bahwa tujuan perusahaan adalah untuk lebih memahami percakapan dan bukan hanya menghasilkan konten. Staniszewski juga membahas kesalahpahaman bahwa mengubah ucapan menjadi teks adalah masalah yang sepenuhnya dapat diatasi, terutama untuk bahasa-bahasa yang akurasinya secara historis kurang. Menurutnya, salah satu keunggulan utama perusahaan terletak pada tim anotasi data internalnya, yang berkontribusi dalam mengembangkan model-model yang unggul.
Selain transkripsi inti, Scribe menawarkan beberapa fitur menonjol:
- Diarisasi Speaker Cerdas : Fitur ini dapat membedakan antara speaker, membuatnya ideal untuk percakapan dengan banyak orang.
- Cap Waktu Tingkat Kata : Scribe menyediakan cap waktu yang tepat untuk setiap kata, memungkinkan pembuatan subtitel yang lancar dan analisis terperinci.
- Penandaan Otomatis Peristiwa Suara : Model dapat mendeteksi dan menandai peristiwa suara seperti tawa dan tepuk tangan, menambahkan konteks yang berharga ke transkripsi.
Saat ini, ElevenLabs telah mengintegrasikan Scribe ke dalam studionya, yang memungkinkan pengguna untuk mentranskripsikan konten video untuk subtitel dan teks. Meskipun saat ini mendukung audio yang telah direkam sebelumnya, perusahaan tersebut menjanjikan bahwa versi real-time dengan latensi rendah akan segera hadir, yang dapat membuka kemungkinan baru untuk transkripsi rapat langsung dan pencatatan suara.
Harga dan Persaingan: Apakah Scribe Layak?
ElevenLabs menawarkan Scribe dengan harga yang kompetitif sebesar $0,40 per jam untuk transkripsi audio. Meskipun beberapa pesaing menawarkan harga yang lebih rendah, penting untuk mempertimbangkan hal ini dengan fitur yang ditawarkan—terutama akurasi dan dukungan bahasa yang disediakan Scribe .
Berikut perbandingan harga cepat dengan penyedia lain:
Penyedia | Model | Kekuatan | Harga (sekitar per jam) |
SebelasLabs | Penulis | Dukungan bahasa yang luas, akurasi tinggi, kinerja benchmark | Rp 0,40 |
Bahasa Inggris Deepgram | Baru-2 | Transkripsi waktu nyata, skalabilitas, berfokus pada pengembang | Bervariasi |
MajelisAI | Konformer-2 | Kaya fitur, kecerdasan audio, ringkasan | Bervariasi |
pidato | Bahasa Inggris Global | Akurasi tinggi, pemahaman aksen | Bervariasi |
Gladia | Berbagai model | Model khusus, ketahanan terhadap kebisingan | Bervariasi |
Pro dan Kontra
Kelebihan:
- Jangkauan Global : Mendukung lebih dari 99 bahasa, menjadikannya alat serbaguna untuk aplikasi internasional.
- Akurasi Tinggi : Mengklaim tingkat kesalahan kata yang rendah (di bawah 5%) untuk lebih dari 25 bahasa utama, termasuk bahasa Inggris (akurasi 97%).
- Performa Tercanggih : Mengungguli model terkemuka seperti Google Gemini dan OpenAI's Whisper dalam uji benchmark.
- Diarisasi Cerdas : Membedakan pembicara, ideal untuk percakapan kompleks yang melibatkan banyak orang.
- Kemampuan Real-Time Segera Hadir : Transkripsi real-time yang akan datang akan menjadi pengubah permainan untuk acara dan rapat langsung.
- Harga Terjangkau : Dengan $0,40 per jam, Scribe menawarkan harga yang kompetitif untuk transkripsi berkualitas tinggi.
Kontra:
- Klaim yang Belum Diverifikasi : Meskipun angka akurasinya terdengar mengesankan, validasi pihak ketiga lebih lanjut dapat membantu memperkuat kepercayaan.
- Dukungan Waktu Nyata Terbatas : Saat ini hanya tersedia untuk audio pra-rekaman, meskipun versi waktu nyata dijanjikan segera.
- Perbandingan Harga : Meskipun terjangkau, pesaing tertentu mungkin menawarkan harga lebih rendah, tetapi dengan rangkaian fitur yang berbeda atau akurasi yang lebih rendah.
Kesimpulan
Seiring dengan semakin kompetitifnya lanskap ujaran ke teks, Scribe dari ElevenLabs siap memberikan dampak yang kuat dengan kombinasi uniknya berupa dukungan bahasa global, akurasi yang luar biasa, dan fitur-fitur yang inovatif. Dengan memanfaatkan permintaan yang terus meningkat akan solusi transkripsi yang lebih akurat dan mudah diakses, ElevenLabs telah menyiapkan diri untuk menjadi pemain kunci di pasar ini. Industri seperti hukum, perawatan kesehatan, dan media, yang sangat bergantung pada transkripsi yang tepat, kemungkinan besar akan memperoleh manfaat paling besar dari teknologi ini. Seiring dengan terus berkembangnya alat ini, pengguna dapat mengharapkan kemampuan yang lebih canggih, yang memposisikan Scribe sebagai alat yang ampuh untuk membuka potensi penuh data bahasa lisan.
Harap diperhatikan bahwa Plisio juga menawarkan kepada Anda:
Buat Faktur Kripto dalam 2 Klik and Terima Donasi Kripto
14 integrasi
- BigCommerce
- Ecwid
- Magento
- Opencart
- osCommerce
- PrestaShop
- VirtueMart
- WHMCS
- WooCommerce
- X-Cart
- Zen Cart
- Easy Digital Downloads
- ShopWare
- Botble
10 perpustakaan untuk bahasa pemrograman paling populer
- PHP Perpustakaan
- Python Perpustakaan
- React Perpustakaan
- Vue Perpustakaan
- NodeJS Perpustakaan
- Android sdk Perpustakaan
- C#
- Ruby
- Java
- Kotlin
19 cryptocurrency dan 12 blockchain
- Bitcoin (BTC)
- Ethereum (ETH)
- Ethereum Classic (ETC)
- Tron (TRX)
- Litecoin (LTC)
- Dash (DASH)
- DogeCoin (DOGE)
- Zcash (ZEC)
- Bitcoin Cash (BCH)
- Tether (USDT) ERC20 and TRX20 and BEP-20
- Shiba INU (SHIB) ERC-20
- BitTorrent (BTT) TRC-20
- Binance Coin(BNB) BEP-20
- Binance USD (BUSD) BEP-20
- USD Coin (USDC) ERC-20
- TrueUSD (TUSD) ERC-20
- Monero (XMR)