OnzeLabs

OnzeLabs

ElevenLabs, leader de l'intelligence artificielle récemment renforcé par une levée de fonds de 180 millions de dollars, étend sa portée au-delà de la génération audio. Déjà connue pour ses nombreuses applications vocales, la société se lance désormais sur le marché concurrentiel de la conversion de la parole en texte avec sa nouvelle offre, Scribe . Ce lancement audacieux marque l'ambition d'ElevenLabs non seulement d'exceller dans la création audio, mais également de dominer la technologie de transcription, défiant ainsi les acteurs établis dans ce domaine.

Qu'est-ce qui distingue ElevenLabs Scribe en matière de reconnaissance vocale ?

Avec une valorisation de 3,3 milliards de dollars, ElevenLabs n'est pas un inconnu dans le domaine de la reconnaissance vocale par l'IA. Auparavant, l'entreprise prenait en charge de nombreuses solutions de conversion de la parole en texte grâce à sa vaste bibliothèque vocale. Cependant, Scribe marque son premier modèle de conversion de la parole en texte autonome, ce qui le positionne face à des géants du secteur comme Gladia, Speechmatics, AssemblyAI, Deepgram et même Whisper d'OpenAI. Alors, qu'est-ce qui distingue Scribe dans un domaine aussi concurrentiel ?

  1. Couverture linguistique inégalée : Scribe prend en charge plus de 99 langues dès le départ, ce qui le positionne comme une solution de transcription véritablement mondiale.
  2. Précision exceptionnelle dans les langues clés : ElevenLabs revendique une précision exceptionnelle (avec un taux d'erreur de mots inférieur à 5 %) dans plus de 25 langues, dont l'anglais (précision de 97 %), le français, l'allemand, l'hindi, le japonais et l'espagnol. Cette attention portée à la précision linguistique est un facteur de différenciation clé. Bien que ces affirmations soient impressionnantes, une validation supplémentaire par des tests tiers pourrait renforcer la confiance dans ces chiffres.
  3. Performances de pointe : dans des tests de référence tels que FLEURS et Common Voice, Scribe surpasserait les meilleurs modèles comme Google Gemini 2.0 Flash et Whisper Large V3, mettant en évidence ses capacités de pointe. Ce succès de référence indique un bond en avant significatif dans les modèles de transcription pilotés par l'IA, offrant des performances supérieures qui pourraient être cruciales dans les secteurs nécessitant une grande précision, comme la transcription juridique ou médicale.

ElevenLabs a initialement développé cette technologie de conversion de la parole en texte pour sa plateforme d'IA conversationnelle, mais avec Scribe , la technologie est désormais disponible en tant que modèle autonome, élargissant ainsi sa base d'utilisateurs.

Découvrir les fonctionnalités uniques de Scribe

Lors d'une récente interview avec Bitcoin World , le PDG d'ElevenLabs, Mati Staniszewski, a évoqué la vision de l'entreprise pour améliorer la reconnaissance vocale. Il a souligné que l'objectif de l'entreprise est de mieux comprendre les conversations et pas seulement de générer du contenu. Staniszewski a également abordé l'idée fausse selon laquelle la conversion de la parole en texte est un problème entièrement résolu, en particulier pour les langues où la précision a toujours été insuffisante. L'un des principaux avantages de l'entreprise, selon lui, réside dans ses équipes internes d'annotation de données, qui contribuent au développement de modèles de qualité supérieure.

En plus de la transcription de base, Scribe offre plusieurs fonctionnalités exceptionnelles :

  • Smart Speaker Diarization : cette fonctionnalité peut différencier les haut-parleurs, ce qui la rend idéale pour les conversations à plusieurs.
  • Horodatages au niveau des mots : Scribe fournit des horodatages précis pour chaque mot, permettant une génération transparente de sous-titres et une analyse détaillée.
  • Marquage automatique des événements sonores : le modèle peut détecter et étiqueter des événements sonores tels que des rires et des applaudissements, ajoutant ainsi un contexte précieux aux transcriptions.

ElevenLabs a intégré Scribe dans son studio, ce qui permet aux utilisateurs de retranscrire du contenu vidéo pour les sous-titres et les légendes. Bien qu'il prenne actuellement en charge l'audio préenregistré, la société promet qu'une version à faible latence et en temps réel sera bientôt disponible, ce qui pourrait ouvrir de nouvelles possibilités pour la transcription de réunions en direct et la prise de notes vocales.

Prix et concurrence : Scribe en vaut-il la peine ?

ElevenLabs propose Scribe à un tarif compétitif de 0,40 $ par heure de transcription audio. Bien que certains concurrents proposent des tarifs plus bas, il est important de les comparer aux fonctionnalités proposées, en particulier la précision et la prise en charge linguistique fournies par Scribe .

Voici une comparaison rapide des prix avec d’autres fournisseurs :

Fournisseur

Modèle

Points forts

Tarifs (environ par heure)

OnzeLabs

Scribe

Prise en charge linguistique étendue, haute précision, performances de référence

0,40 $

Deepgram

Nova-2

Transcription en temps réel, évolutivité, axée sur le développeur

Varie

AssemblageAI

Conformateur-2

Riche en fonctionnalités, intelligence audio, résumé

Varie

Speechmatics

Anglais mondial

Haute précision, compréhension de l'accent

Varie

Gladia

Différents modèles

Modèles spécialisés, robustesse au bruit

Varie

Avantages et inconvénients

Avantages :

  • Portée mondiale : prend en charge plus de 99 langues, ce qui en fait un outil polyvalent pour les applications internationales.
  • Haute précision : revendique un faible taux d'erreur de mots (moins de 5 %) pour plus de 25 langues principales, dont l'anglais (précision de 97 %).
  • Performances de pointe : surpasse les principaux modèles tels que Google Gemini et Whisper d'OpenAI dans les tests d'évaluation comparative.
  • Smart Diarization : Différencie les locuteurs, idéal pour les conversations complexes à plusieurs.
  • Fonctionnalités en temps réel à venir : la transcription en temps réel à venir changera la donne pour les événements et les réunions en direct.
  • Prix abordables : à 0,40 $ de l’heure, Scribe propose un prix compétitif pour une transcription de haute qualité.

Inconvénients :

  • Allégations non vérifiées : Bien que les chiffres de précision semblent impressionnants, une validation supplémentaire par un tiers pourrait contribuer à renforcer la confiance.
  • Prise en charge limitée en temps réel : actuellement disponible uniquement pour l'audio préenregistré, bien qu'une version en temps réel soit promise prochainement.
  • Comparaison des prix : Bien qu'abordables, certains concurrents peuvent proposer des tarifs inférieurs, mais avec des fonctionnalités différentes ou moins de précision.

Conclusion

Alors que le marché de la transcription vocale devient de plus en plus concurrentiel, Scribe d'ElevenLabs est sur le point d'avoir un impact fort grâce à sa combinaison unique de prise en charge linguistique mondiale, de précision exceptionnelle et de fonctionnalités innovantes. En exploitant la demande croissante de solutions de transcription plus précises et plus accessibles, ElevenLabs a préparé le terrain pour devenir un acteur clé sur ce marché. Les secteurs tels que le droit, la santé et les médias, qui dépendent fortement de la transcription précise, sont susceptibles de bénéficier le plus de cette technologie. À mesure que l'outil continue d'évoluer, les utilisateurs peuvent s'attendre à des fonctionnalités encore plus avancées, positionnant Scribe comme un outil puissant pour exploiter tout le potentiel des données de langage parlé.

Sachez que Plisio vous propose également :

Créez des factures cryptographiques en 2 clics and Accepter les dons cryptographiques

14 intégrations

10 bibliothèques pour les langages de programmation les plus populaires

19 crypto-monnaies et 12 blockchains

Ready to Get Started?

Create an account and start accepting payments – no contracts or KYC required. Or, contact us to design a custom package for your business.

Make first step

Always know what you pay

Integrated per-transaction pricing with no hidden fees

Start your integration

Set up Plisio swiftly in just 10 minutes.