SebelasLabs

SebelasLabs

Dalam sebuah langkah inovatif, ElevenLabs, pemimpin AI yang baru-baru ini didorong oleh pendanaan besar sebesar $180 juta, memperluas jangkauannya di luar pembuatan audio. Sudah dikenal karena mendukung berbagai aplikasi suara, perusahaan ini sekarang merambah pasar ucapan-ke-teks yang kompetitif dengan penawaran barunya, Scribe . Peluncuran yang berani ini menandai ambisi ElevenLabs untuk tidak hanya unggul dalam pembuatan audio tetapi juga mendominasi teknologi transkripsi, menantang pemain mapan di bidang tersebut.

Apa yang Membedakan ElevenLabs Scribe dalam Pengenalan Ucapan?

Dengan valuasi sebesar $3,3 miliar, ElevenLabs tidak asing lagi dengan bidang pengenalan suara AI. Sebelumnya, perusahaan tersebut mendukung banyak solusi ucapan ke teks melalui pustaka suaranya yang luas. Namun, Scribe menandai model ucapan ke teks mandiri pertama mereka, yang memposisikan mereka melawan raksasa industri seperti Gladia, Speechmatics, AssemblyAI, Deepgram, dan bahkan Whisper milik OpenAI. Jadi, apa yang membuat Scribe menonjol di bidang yang begitu kompetitif?

  1. Cakupan Bahasa yang Tak Tertandingi : Scribe mendukung lebih dari 99 bahasa sejak awal, memposisikannya sebagai solusi transkripsi yang benar-benar global.
  2. Akurasi Luar Biasa dalam Bahasa Utama : ElevenLabs mengklaim akurasi luar biasa (dengan rasio kesalahan kata di bawah 5%) dalam lebih dari 25 bahasa, termasuk bahasa Inggris (akurasi 97%), Prancis, Jerman, Hindi, Jepang, dan Spanyol. Fokus pada ketepatan bahasa ini merupakan pembeda utama. Meskipun klaim ini mengesankan, validasi lebih lanjut melalui pengujian pihak ketiga dapat memperkuat keyakinan terhadap angka-angka ini.
  3. Performa Terkemuka di Industri : Dalam uji benchmark seperti FLEURS dan Common Voice, Scribe dilaporkan mengungguli model-model teratas seperti Google Gemini 2.0 Flash dan Whisper Large V3, yang menonjolkan kemampuan mutakhirnya. Keberhasilan benchmark ini menunjukkan lompatan maju yang signifikan dalam model transkripsi yang digerakkan oleh AI, yang menawarkan performa superior yang dapat menjadi krusial dalam sektor-sektor yang membutuhkan akurasi tinggi, seperti transkripsi hukum atau medis.

ElevenLabs awalnya mengembangkan teknologi ucapan ke teks ini untuk platform AI percakapannya, tetapi dengan Scribe , teknologi ini sekarang tersedia sebagai model mandiri, sehingga memperluas basis penggunanya.

Menjelajahi Fitur-fitur Unik Scribe

Selama wawancara baru-baru ini dengan Bitcoin World , CEO ElevenLabs Mati Staniszewski membahas visi perusahaan untuk meningkatkan pengenalan ucapan. Ia menekankan bahwa tujuan perusahaan adalah untuk lebih memahami percakapan dan bukan hanya menghasilkan konten. Staniszewski juga membahas kesalahpahaman bahwa mengubah ucapan menjadi teks adalah masalah yang sepenuhnya dapat diatasi, terutama untuk bahasa-bahasa yang akurasinya secara historis kurang. Menurutnya, salah satu keunggulan utama perusahaan terletak pada tim anotasi data internalnya, yang berkontribusi dalam mengembangkan model-model yang unggul.

Selain transkripsi inti, Scribe menawarkan beberapa fitur menonjol:

  • Diarisasi Speaker Cerdas : Fitur ini dapat membedakan antara speaker, membuatnya ideal untuk percakapan dengan banyak orang.
  • Cap Waktu Tingkat Kata : Scribe menyediakan cap waktu yang tepat untuk setiap kata, memungkinkan pembuatan subtitel yang lancar dan analisis terperinci.
  • Penandaan Otomatis Peristiwa Suara : Model dapat mendeteksi dan menandai peristiwa suara seperti tawa dan tepuk tangan, menambahkan konteks yang berharga ke transkripsi.

Saat ini, ElevenLabs telah mengintegrasikan Scribe ke dalam studionya, yang memungkinkan pengguna untuk mentranskripsikan konten video untuk subtitel dan teks. Meskipun saat ini mendukung audio yang telah direkam sebelumnya, perusahaan tersebut menjanjikan bahwa versi real-time dengan latensi rendah akan segera hadir, yang dapat membuka kemungkinan baru untuk transkripsi rapat langsung dan pencatatan suara.

Harga dan Persaingan: Apakah Scribe Layak?

ElevenLabs menawarkan Scribe dengan harga yang kompetitif sebesar $0,40 per jam untuk transkripsi audio. Meskipun beberapa pesaing menawarkan harga yang lebih rendah, penting untuk mempertimbangkan hal ini dengan fitur yang ditawarkan—terutama akurasi dan dukungan bahasa yang disediakan Scribe .

Berikut perbandingan harga cepat dengan penyedia lain:

Penyedia

Model

Kekuatan

Harga (sekitar per jam)

SebelasLabs

Penulis

Dukungan bahasa yang luas, akurasi tinggi, kinerja benchmark

Rp 0,40

Bahasa Inggris Deepgram

Baru-2

Transkripsi waktu nyata, skalabilitas, berfokus pada pengembang

Bervariasi

MajelisAI

Konformer-2

Kaya fitur, kecerdasan audio, ringkasan

Bervariasi

pidato

Bahasa Inggris Global

Akurasi tinggi, pemahaman aksen

Bervariasi

Gladia

Berbagai model

Model khusus, ketahanan terhadap kebisingan

Bervariasi

Pro dan Kontra

Kelebihan:

  • Jangkauan Global : Mendukung lebih dari 99 bahasa, menjadikannya alat serbaguna untuk aplikasi internasional.
  • Akurasi Tinggi : Mengklaim tingkat kesalahan kata yang rendah (di bawah 5%) untuk lebih dari 25 bahasa utama, termasuk bahasa Inggris (akurasi 97%).
  • Performa Tercanggih : Mengungguli model terkemuka seperti Google Gemini dan OpenAI's Whisper dalam uji benchmark.
  • Diarisasi Cerdas : Membedakan pembicara, ideal untuk percakapan kompleks yang melibatkan banyak orang.
  • Kemampuan Real-Time Segera Hadir : Transkripsi real-time yang akan datang akan menjadi pengubah permainan untuk acara dan rapat langsung.
  • Harga Terjangkau : Dengan $0,40 per jam, Scribe menawarkan harga yang kompetitif untuk transkripsi berkualitas tinggi.

Kontra:

  • Klaim yang Belum Diverifikasi : Meskipun angka akurasinya terdengar mengesankan, validasi pihak ketiga lebih lanjut dapat membantu memperkuat kepercayaan.
  • Dukungan Waktu Nyata Terbatas : Saat ini hanya tersedia untuk audio pra-rekaman, meskipun versi waktu nyata dijanjikan segera.
  • Perbandingan Harga : Meskipun terjangkau, pesaing tertentu mungkin menawarkan harga lebih rendah, tetapi dengan rangkaian fitur yang berbeda atau akurasi yang lebih rendah.

Kesimpulan

Seiring dengan semakin kompetitifnya lanskap ujaran ke teks, Scribe dari ElevenLabs siap memberikan dampak yang kuat dengan kombinasi uniknya berupa dukungan bahasa global, akurasi yang luar biasa, dan fitur-fitur yang inovatif. Dengan memanfaatkan permintaan yang terus meningkat akan solusi transkripsi yang lebih akurat dan mudah diakses, ElevenLabs telah menyiapkan diri untuk menjadi pemain kunci di pasar ini. Industri seperti hukum, perawatan kesehatan, dan media, yang sangat bergantung pada transkripsi yang tepat, kemungkinan besar akan memperoleh manfaat paling besar dari teknologi ini. Seiring dengan terus berkembangnya alat ini, pengguna dapat mengharapkan kemampuan yang lebih canggih, yang memposisikan Scribe sebagai alat yang ampuh untuk membuka potensi penuh data bahasa lisan.

Harap diperhatikan bahwa Plisio juga menawarkan kepada Anda:

Buat Faktur Kripto dalam 2 Klik and Terima Donasi Kripto

14 integrasi

10 perpustakaan untuk bahasa pemrograman paling populer

19 cryptocurrency dan 12 blockchain

Ready to Get Started?

Create an account and start accepting payments – no contracts or KYC required. Or, contact us to design a custom package for your business.

Make first step

Always know what you pay

Integrated per-transaction pricing with no hidden fees

Start your integration

Set up Plisio swiftly in just 10 minutes.