إليفن لابس

في خطوة رائدة، تعمل ElevenLabs، الشركة الرائدة في مجال الذكاء الاصطناعي والتي حصلت مؤخرًا على تمويل ضخم بقيمة 180 مليون دولار، على توسيع نطاقها إلى ما هو أبعد من توليد الصوت. تشتهر الشركة بالفعل بتشغيل تطبيقات صوتية مختلفة، وهي الآن تغامر بدخول سوق تحويل الكلام إلى نص التنافسي بعرضها الجديد، Scribe . يمثل هذا الإطلاق الجريء طموح ElevenLabs ليس فقط للتفوق في إنشاء الصوت ولكن أيضًا للهيمنة على تقنية النسخ، مما يشكل تحديًا للاعبين الراسخين في هذا المجال.
ما الذي يميز ElevenLabs Scribe في التعرف على الكلام؟
مع تقييم بقيمة 3.3 مليار دولار، فإن ElevenLabs ليست غريبة على مجال التعرف على الكلام بالذكاء الاصطناعي. في السابق، دعمت الشركة العديد من حلول تحويل الكلام إلى نص من خلال مكتبة الصوت الضخمة الخاصة بها. ومع ذلك، يمثل Scribe أول نموذج مستقل لتحويل الكلام إلى نص، مما يضعهم في مواجهة عمالقة الصناعة مثل Gladia وSpeechmatics وAsemblyAI وDeepgram وحتى Whisper من OpenAI. إذن، ما الذي يجعل Scribe تبرز في مثل هذا المجال التنافسي؟
- تغطية لغوية لا مثيل لها : يدعم Scribe أكثر من 99 لغة منذ البداية، مما يجعله بمثابة حل نسخ عالمي حقيقي.
- دقة متميزة في اللغات الرئيسية : تزعم ElevenLabs دقة استثنائية (بمعدل خطأ في الكلمات أقل من 5%) في أكثر من 25 لغة، بما في ذلك الإنجليزية (دقة 97%) والفرنسية والألمانية والهندية واليابانية والإسبانية. ويشكل هذا التركيز على دقة اللغة عاملاً مميزًا. ورغم أن هذه الادعاءات مثيرة للإعجاب، فإن المزيد من التحقق من خلال اختبارات الجهات الخارجية قد يعزز الثقة في هذه الأرقام.
- أداء رائد في الصناعة : في اختبارات المقارنة مثل FLEURS وCommon Voice، أفادت التقارير أن Scribe يتفوق على أفضل النماذج مثل Google Gemini 2.0 Flash وWhisper Large V3، مما يسلط الضوء على قدراته المتطورة. يشير نجاح هذا الاختبار إلى قفزة كبيرة إلى الأمام في نماذج النسخ التي تعتمد على الذكاء الاصطناعي، مما يوفر أداءً متفوقًا يمكن أن يكون حاسمًا في القطاعات التي تتطلب دقة عالية، مثل النسخ القانوني أو الطبي.
قامت شركة ElevenLabs في الأصل بتطوير تقنية تحويل الكلام إلى نص لمنصة الذكاء الاصطناعي المحادثة الخاصة بها، ولكن مع Scribe ، أصبحت التقنية متاحة الآن كنموذج مستقل، مما يوسع قاعدة مستخدميها.
استكشاف ميزات Scribe الفريدة
خلال مقابلة أجريت مؤخرًا مع Bitcoin World ، ناقش الرئيس التنفيذي لشركة ElevenLabs، ماتي ستانيسزوسكي، رؤية الشركة لتحسين التعرف على الكلام. وأكد أن هدف الشركة هو فهم المحادثات بشكل أفضل وليس مجرد إنشاء المحتوى. كما تناول ستانيسزوسكي المفهوم الخاطئ بأن تحويل الكلام إلى نص هو مشكلة تم حلها بالكامل، وخاصة بالنسبة للغات التي كانت الدقة فيها غير كافية تاريخيًا. ووفقًا له، فإن إحدى المزايا الرئيسية للشركة تكمن في فرق التعليق التوضيحي للبيانات الداخلية، والتي تساهم في تطوير نماذج متفوقة.
بالإضافة إلى النسخ الأساسي، يوفر Scribe العديد من الميزات البارزة:
- تدوين ملاحظات المتحدث الذكي : يمكن لهذه الميزة التمييز بين المتحدثين، مما يجعلها مثالية للمحادثات متعددة الأشخاص.
- علامات زمنية على مستوى الكلمة : يوفر Scribe علامات زمنية دقيقة لكل كلمة، مما يتيح إنشاء ترجمة سلسة وتحليل مفصل.
- وضع علامات تلقائية على الأحداث الصوتية : يمكن للنموذج اكتشاف الأحداث الصوتية ووضع علامات عليها مثل الضحك والتصفيق، مما يضيف سياقًا قيمًا إلى النصوص المنقولة.
حاليًا، قامت ElevenLabs بدمج Scribe في الاستوديو الخاص بها، مما يسمح للمستخدمين بنسخ محتوى الفيديو للترجمة والتعليقات التوضيحية. وبينما يدعم البرنامج حاليًا الصوت المسجل مسبقًا، تعد الشركة بإصدار نسخة منخفضة الكمون في الوقت الفعلي قريبًا، مما قد يفتح إمكانيات جديدة لنسخ الاجتماعات الحية وتدوين الملاحظات الصوتية.
التسعير والمنافسة: هل يستحق Scribe العناء؟
تقدم ElevenLabs خدمة Scribe بسعر تنافسي يبلغ 0.40 دولارًا أمريكيًا لكل ساعة من الصوت المنقول. وفي حين تقدم بعض الشركات المنافسة أسعارًا أقل، فمن المهم موازنة هذا السعر بالميزات المقدمة—خاصة الدقة ودعم اللغة الذي توفره خدمة Scribe .
فيما يلي مقارنة سريعة للأسعار مع مقدمي الخدمات الآخرين:
مزود | نموذج | نقاط القوة | التسعير (تقريبا لكل ساعة) |
إليفن لابس | كاتب | دعم لغوي واسع النطاق، ودقة عالية، وأداء معياري | 0.40 دولار |
ديبجرام | نوفا-2 | النسخ في الوقت الفعلي، وقابلية التوسع، والتركيز على المطور | يختلف |
الجمعية AI | المطابق-2 | غني بالميزات، ذكاء صوتي، تلخيص | يختلف |
علم الكلام | الإنجليزية العالمية | دقة عالية وفهم اللهجة | يختلف |
غلاديا | نماذج مختلفة | نماذج متخصصة، مقاومة الضوضاء | يختلف |
الإيجابيات والسلبيات
الايجابيات:
- النطاق العالمي : يدعم أكثر من 99 لغة، مما يجعله أداة متعددة الاستخدامات للتطبيقات الدولية.
- دقة عالية : يدعي معدل خطأ منخفض في الكلمات (أقل من 5%) لأكثر من 25 لغة رئيسية، بما في ذلك اللغة الإنجليزية (دقة 97%).
- أداء متطور : يتفوق على النماذج الرائدة مثل Google Gemini و OpenAI's Whisper في اختبارات المعايير.
- التقسيم الذكي للكلمات : يميز المتحدثين، وهو مثالي للمحادثات المعقدة التي يشارك فيها عدة أشخاص.
- ستتوفر إمكانيات النسخ الفوري في الوقت الفعلي قريبًا : ستكون إمكانية النسخ الفوري في الوقت الفعلي بمثابة تغيير جذري للأحداث والاجتماعات المباشرة.
- أسعار معقولة : بمبلغ 0.40 دولارًا في الساعة، تقدم Scribe سعرًا تنافسيًا للنسخ عالي الجودة.
سلبيات:
- مزاعم غير مؤكدة : في حين تبدو أرقام الدقة مثيرة للإعجاب، إلا أن المزيد من التحقق من قبل جهات خارجية قد يساعد في تعزيز الثقة.
- دعم محدود في الوقت الفعلي : متاح حاليًا فقط للصوت المسجل مسبقًا، على الرغم من أنه من المقرر إصدار إصدار في الوقت الفعلي قريبًا.
- مقارنة الأسعار : على الرغم من أنها معقولة التكلفة، إلا أن بعض المنافسين قد يقدمون أسعارًا أقل، ولكن مع مجموعات مختلفة من الميزات أو دقة أقل.
خاتمة
مع تزايد المنافسة في مجال تحويل الكلام إلى نص، فإن برنامج Scribe من ElevenLabs على استعداد لإحداث تأثير قوي بفضل مزيجه الفريد من الدعم اللغوي العالمي والدقة الاستثنائية والميزات المبتكرة. ومن خلال الاستفادة من الطلب المتزايد على حلول النسخ الأكثر دقة وسهولة في الوصول، مهدت ElevenLabs الطريق لتصبح لاعباً رئيسياً في هذه السوق. ومن المرجح أن تستفيد الصناعات مثل القانون والرعاية الصحية والإعلام، التي تعتمد بشكل كبير على النسخ الدقيق، أكثر من غيرها من هذه التكنولوجيا. ومع استمرار تطور الأداة، يمكن للمستخدمين توقع قدرات أكثر تقدمًا، مما يضع Scribe كأداة قوية لإطلاق العنان للإمكانات الكاملة لبيانات اللغة المنطوقة.
يرجى ملاحظة أن Plisio يقدم لك أيضًا:
قم بإنشاء فواتير تشفير بنقرتين and قبول التبرعات المشفرة
14 تكاملات
- BigCommerce
- Ecwid
- Magento
- Opencart
- osCommerce
- PrestaShop
- VirtueMart
- WHMCS
- WooCommerce
- X-Cart
- Zen Cart
- Easy Digital Downloads
- ShopWare
- Botble
10 مكتبات لغات البرمجة الأكثر شيوعًا
19 عملات مشفرة و 12 بلوكشين
- Bitcoin (BTC)
- Ethereum (ETH)
- Ethereum Classic (ETC)
- Tron (TRX)
- Litecoin (LTC)
- Dash (DASH)
- DogeCoin (DOGE)
- Zcash (ZEC)
- Bitcoin Cash (BCH)
- Tether (USDT) ERC20 and TRX20 and BEP-20
- Shiba INU (SHIB) ERC-20
- BitTorrent (BTT) TRC-20
- Binance Coin(BNB) BEP-20
- Binance USD (BUSD) BEP-20
- USD Coin (USDC) ERC-20
- TrueUSD (TUSD) ERC-20
- Monero (XMR)