إيليفن لابز: نظرة داخلية على مولد الصوت بالذكاء الاصطناعي الذي تبلغ قيمته 11 مليار دولار

إيليفن لابز: نظرة داخلية على مولد الصوت بالذكاء الاصطناعي الذي تبلغ قيمته 11 مليار دولار

ربما سمعتَ عن ElevenLabs، لكنك لم تكن تعلم. الراوي في فيديوهات الشرح على يوتيوب، والحوار المدبلج في الأفلام الأجنبية، والصوت على الطرف الآخر من خط الدعم: الكثير من هذه الأصوات يتم توليدها الآن، والكثير منها يعمل بواسطة شركة واحدة لا يعرفها معظم الناس خارج مجال التقنية. ElevenLabs تُنتج أصواتًا بتقنية الذكاء الاصطناعي. في فبراير 2026، جمعت الشركة تمويلًا بقيمة 11 مليار دولار لهذا الغرض تحديدًا. أسسها صديقان من بولندا عام 2022، واليوم يُستخدم مُولّد الصوت بتقنية الذكاء الاصطناعي الخاص بها في تطبيقات يستخدمها أكثر من مليار شخص. إذًا، ما الذي تفعله تحديدًا؟ ما تكلفتها بالدولار؟ ولماذا يُقلق هذا الأمر خبراء السلامة باستمرار؟

ما تقدمه ElevenLabs: أصوات الذكاء الاصطناعي والمزيد

بدأ الأمر كأداة متواضعة لتحويل النص إلى كلام. والآن، أصبح نظامًا صوتيًا متكاملًا، والأصوات ليست سوى الجزء الذي تلاحظه أولًا. أما اتساع نطاق الميزات الأخرى فهو ما يبرر سعره. تناول المؤسسان المشكلة من زوايا غير مألوفة: كان بيوتر دابكوفسكي مهندسًا للتعلم الآلي في جوجل، وماتي ستانيشيفسكي استراتيجيًا في بالانتير. كان إحباطهما المشترك بسيطًا: الكلام الاصطناعي آنذاك كان ينطق الكلمات لكنه لم يكن قادرًا على تمثيلها. فكرا: حلّ هذه المشكلة، وسيتبعها كل شيء آخر. ولا تزال معظم منتجات الشركة تنبع من هذا الرهان.

تحويل النص إلى كلام وأصوات الذكاء الاصطناعي الواقعية

ابدأ بالأساس: يحوّل النص المكتوب إلى صوت منطوق. أحدث إصدار، Eleven v3 ، صدر في يونيو 2025. يدعم أكثر من 70 لغة، ويقبل علامات مضمنة مثل [يهمس] أو [يضحك]، ما يتيح لك توجيه الأداء سطرًا بسطر. هل تحتاج إلى سرعة أكبر؟ يتوفر إصدار أخف يُسمى Flash، يُضحي ببعض اللمسات النهائية مقابل إخراج فوري تقريبًا، وهو أمر بالغ الأهمية للتطبيقات المباشرة. والنتيجة صوت واقعي للغاية. لهذا السبب، يلجأ المبدعون إلى ElevenLabs للتعليق الصوتي، والبودكاست، والسرد في فيديوهات الذكاء الاصطناعي، حيث أن القراءة الآلية ستفسد التجربة.

ما يُميّز الإصدار الثالث هو التحكم. كانت المحركات القديمة تقرأ كل شيء بنبرة رتيبة. ليس هذا المحرك. بمجرد تحديد جملة ليتم همسها أو نطقها بسرعة أو حتى مع تنهيدة، يبدأ النص في أداءٍ حقيقي. في المرة الأولى التي تسمعه فيها يُلقي جملة ساخرة، قد تشعر بشيء من الغرابة. لا يزال الإصدار الثاني متعدد اللغات الأقدم يدعم 29 لغة، ويُعتبر الخيار الافتراضي للسرد الطويل والمستقر، حيث تُعدّ الاتساق أهم من التنوع.

استنساخ الصوت، والدبلجة، والصوت متعدد اللغات

هناك ميزتان تجعلانها تتجاوز مجرد التعليق الصوتي. الأولى هي استنساخ الصوت. ما عليك سوى إدخال عينة صوتية قصيرة، وستقوم بنسخ صوت محدد، إما استنساخ سريع وفوري من مقطع صوتي مدته دقيقة تقريبًا، أو صوت احترافي أكثر وضوحًا. أما الثانية فهي الدبلجة بالذكاء الاصطناعي. ما عليك سوى إدخال فيديو جاهز، وستقوم بإعادة دبلجته بالكامل إلى لغة أخرى مع الحفاظ على نبرة المتحدث، مما يجعل عملية الترجمة متعددة اللغات، التي كانت تتطلب سابقًا حجز استوديو، تتم ببضع نقرات فقط. كما يوجد مكتبة صوتية مشتركة، حيث ينشر المستخدمون أصواتهم ويرخصونها لبعضهم البعض.

النسخة الاحترافية هي التي تهم الاستوديوهات. امنحها ثلاثين دقيقة من الصوت النقي وتحقق من الموافقة. في المقابل، تُحاكي هذه النسخة إيقاع ولهجة الصوت الأصلي بدقة متناهية، لدرجة أن ممثلي الأداء الصوتي يرخصون الآن نسخهم الخاصة ويحصلون على نسبة من أرباحهم حتى أثناء نومهم. أما النسخة الفورية فهي أسرع وأقل دقة، ومناسبة لنموذج أولي سريع، ويسهل تمييزها كنسخة اصطناعية.

كاتب، موسيقى الذكاء الاصطناعي، ووكلاء المحادثة

تعمل هذه المجموعة في الاتجاه المعاكس أيضًا، من الصوت إلى النص. Scribe هو نموذج تحويل الكلام إلى نص، حيث يقوم بنسخ الكلام مع تحديد المتحدث والطوابع الزمنية، ويدعم الإصدار الثاني منه 99 لغة مع تحديد هوية المتحدث بدقة تصل إلى 98%. كما أُضيفت خدمة Eleven Music في عام 2025، والتي تُنتج مقاطع موسيقية خلفية مُنقّحة عند الطلب. أما وكلاء الذكاء الاصطناعي التفاعلي، فيتجاوزون ذلك بكثير: إذ يجمعون بين تحويل الكلام إلى نص، ونموذج اللغة، وتحويل النص إلى كلام، ليتمكن الروبوت من الاستماع والإجابة في الوقت الفعلي، ثم تحويل المحادثة إلى مُتحدث بشري بسلاسة تامة. ويُكمّل ذلك المؤثرات الصوتية وعزل الصوت لمعالجة التسجيلات الصوتية المشوّشة.

يُظهر برنامج Scribe عمق هذه المنصة الحقيقي. فهو لا يقتصر على إنتاج نص مكتوب فحسب، بل يقوم بتصنيف الأصوات غير الكلامية، وتحديد الطوابع الزمنية على مستوى الكلمات، وفصل المتحدثين المتداخلين، ولهذا السبب يعتمد عليه مُنتجو البودكاست والباحثون لتحويل التسجيلات غير المنظمة إلى نصوص قابلة للبحث والتعديل. ويُباع الإصدار الثاني منه بسعر أقل بنحو 40% من الإصدار الأول. منتج ذكاء اصطناعي يتحسن ويقل سعره في آن واحد؟ هذا نادر.

elevenlabs-ai

كيف أصبحت شركة ElevenLabs شركة ذكاء اصطناعي بقيمة 11 مليار دولار

تتجاهل صفحات المنتج الجزء الأكثر إثارة للدهشة: التمويل. لكن بالنظر إلى التمويل، يتضح أن النمو يتجاوز المألوف. ففي أوائل عام 2025، جمعت شركة ElevenLabs تمويلًا بقيمة 180 مليون دولار في جولة التمويل من الفئة C، مما رفع قيمتها إلى 3.3 مليار دولار، بقيادة مشتركة من Andreessen Horowitz وICONIQ Growth. وبعد 13 شهرًا، قادت Sequoia جولة تمويل من الفئة D بقيمة 500 مليون دولار ، لتصل قيمة الشركة إلى 11 مليار دولار. أي ثلاثة أضعاف، في غضون عام واحد، لنفس الشركة.

تُفسر الإيرادات هذا الإقبال الكبير. فقد تجاوزت إيرادات ElevenLabs السنوية المتكررة 330 مليون دولار بنهاية عام 2025. لكن ما يُثير قلق المستثمرين هو سرعة النمو. عشرون شهرًا للوصول إلى 100 مليون دولار، ثم عشرة أشهر لمضاعفتها، ثم خمسة أشهر فقط للوصول إلى 330 مليون دولار. كل دورة أقصر من سابقتها. وبحسب إحصاءات الشركة نفسها في يناير 2025، فقد استخدم أكثر من 60% من موظفي شركات Fortune 500 المنصة.

دائري تاريخ نشأ تقييم
السلسلة ب يناير 2024 80 مليون دولار 1.1 مليار دولار
السلسلة ج يناير 2025 180 مليون دولار 3.3 مليار دولار
السلسلة د فبراير 2026 500 مليون دولار 11 مليار دولار

جمعت شركة ElevenLabs ما يقارب 781 مليون دولار أمريكي عبر خمس جولات تمويلية، وقد ناقش مؤسسوها علنًا إمكانية طرح أسهمها للاكتتاب العام. ما يُقنع المستثمرين ليس التطبيق المُخصص للمستهلكين، بل البنية التحتية الداعمة له: فكل شركة تُضيف ميزة الصوت إلى منتجها تُعدّ عميلًا مُحتملًا، وسوق الكلام الاصطناعي كان شبه معدوم قبل ثلاث سنوات. الرهان هو أن يصبح الصوت واجهة افتراضية كما حدث مع شاشة اللمس.

أسعار ElevenLabs: خطط مجانية ومدفوعة

يمكنك استخدام ElevenLabs مجانًا، والخطة المجانية ليست مجرد تجربة أولية. تمنحك الخطط المدفوعة رصيدًا شهريًا إضافيًا، يُستهلك مع كل عملية إنتاج صوتي، بدلًا من فتح ميزات جديدة كليًا. إليك هيكل 2026 .

يخطط السعر / شهرياً الرصيد الشهري
حر 0 دولار 10000
بداية 6 دولارات 30,000
الخالق 22 دولارًا 121,000
محترف 99 دولارًا 600,000
حجم 299 دولارًا 1,800,000
عمل 990 دولارًا 6,000,000

تُعادل الأرصدة تقريبًا عدد الأحرف الصوتية، لذا تكفي باقة مجانية بقيمة 10,000 رصيد لبضع دقائق من الصوت شهريًا. تُعدّ باقة "المبدع" بسعر 22 دولارًا نقطة انطلاق عملية لأي شخص ينشر بانتظام، وتُفعّل حقوق الاستخدام التجاري في الباقات المدفوعة. يدفع المطورون مقابل كل استخدام عبر واجهة برمجة التطبيقات (API) بدلًا من رسوم شهرية ثابتة.

فوق باقة الأعمال، توجد باقة المؤسسات المخصصة التي توفر دعمًا فنيًا متخصصًا، وحدود استخدام أعلى، والشروط التعاقدية التي تتطلبها معظم الشركات الكبيرة. يتم احتساب استخدام واجهة برمجة التطبيقات (API) بناءً على عدد الأحرف المُولّدة، لذا فإن التطبيقات ذات حركة المرور العالية تدفع بما يتناسب مع الاستخدام الفعلي بدلاً من تحديد خطة مسبقة. لكن انتبه، لا يتم ترحيل الرصيد، لذا فإن أي شهر غير مستخدم يُعد خسارة مالية.

من يستخدم ElevenLabs ولأي غرض؟

المستخدمون المثيرون للاهتمام ليسوا هواةً يصنعون مقاطع فيديو مبتكرة، بل هم شركات تستبدل وقت الاستوديوهات. ناشرو الكتب الصوتية يروون كتالوجات كاملة دون الحاجة إلى ممثلين. يضيف مستخدمو يوتيوب ومنشئو الدورات التدريبية تعليقات صوتية بلغة لا يتحدثونها. استوديوهات الألعاب تؤدي أصوات شخصيات ثانوية على نطاق واسع. تطبيقات تسهيل الوصول تقرأ المقالات بصوت عالٍ عبر تطبيق ElevenReader. مراكز الاتصال تُشغّل وكلاء محادثة يجيبون على الأسئلة الروتينية قبل تدخل موظف بشري. فرق التوطين تُدبلج مقاطع فيديو تدريبية للموظفين حول العالم.

هذا الانتشار الواسع هو ما يُبرر استمرار قيمة الشركة. تقول الشركة إن واجهة برمجة التطبيقات (API) الخاصة بها تُشغّل منتجات تخدم مجتمعةً أكثر من مليار مستخدم، ومن بين عملائها شركات مثل Meta وEpic Games وSalesforce. بالنسبة لمعظم هؤلاء المشترين، تُعدّ ElevenLabs بمثابة بنية تحتية صوتية غير مرئية داخل منتج يحمل اسمًا آخر.

تُوضّح بعض الأمثلة حجم هذا التطور. يقرأ تطبيق ElevenReader المقالات وملفات PDF والكتب الإلكترونية بصوتٍ مُختار، ما جعله أداةً فعّالةً لتسهيل الوصول للأشخاص الذين يعانون من عسر القراءة أو ضعف البصر. تُنشئ غرف الأخبار نسخًا صوتيةً تلقائيًا للقصص المكتوبة. يمنح مطورو الألعاب المستقلون الشخصيات غير القابلة للعب أصواتًا مميزةً كانت تتطلب سابقًا ميزانيةً للتسجيل لم تكن متوفرةً لديهم. القاسم المشترك هو جودة الصوت الإنتاجية التي كانت تتطلب استوديو، والتي أصبحت الآن تُستخرج من مربع نص.

مشكلة التزييف العميق وسلامة الصوت المدعوم بالذكاء الاصطناعي

الأصوات المتقنة كهذه سلاحٌ أيضاً. وقد تعلمت شركة ElevenLabs ذلك بطريقةٍ قاسية. ففي يناير 2024، وجّهت رسالةٌ آليةٌ مزيفةٌ بصوت الرئيس بايدن ناخبي نيو هامبشاير إلى مقاطعة الانتخابات التمهيدية. لم يكن هو المتحدث الحقيقي بالطبع. قامت شركة Pindrop الأمنية بتحليل المقطع، وتتبعت مصدره إلى ElevenLabs، وأفادت بتطابقٍ بنسبة 84% مع بياناتها. وعلى إثر ذلك، حظرت الشركة الحساب المسؤول عن هذا المقطع.

أثارت تلك الحادثة مسألة السلامة بشكل علني. تُشغّل شركة ElevenLabs الآن مُصنِّفًا صوتيًا يعمل بالذكاء الاصطناعي يتحقق مما إذا كان المقطع الصوتي صادرًا عن أدواتها، ويمنع استنساخ أصوات شخصيات عامة معينة عالية الخطورة، ويطلب التحقق من الهوية قبل السماح باستنساخ الصوت الاحترافي. هل يعمل أيٌّ من ذلك بشكل كامل؟ كلا. فالكشف دائمًا ما يتأخر عن الإنتاج، ويمكن للمُحتال المُصمّم أن يلجأ ببساطة إلى مُزوّد خدمة أقل كفاءة. لذا، إليكم الحقيقة: لقد وضعت الشركة ضوابط حقيقية حول أداة ذات استخدام مزدوج في جوهرها، ولا يزال السباق بين إنتاج الأصوات المُزيّفة وكشفها مستمرًا.

لاحظت الجهات التنظيمية ذلك. فقد اتخذت عدة ولايات أمريكية إجراءات لتقييد المكالمات الآلية المُولّدة بالذكاء الاصطناعي بعد حادثة بايدن، وانضمت الشركة إلى جهود القطاع في مجال العلامات المائية الصوتية، وهي عبارة عن تضمين إشارات تبقى بعد الضغط وتساعد في تتبع المقطع الصوتي إلى مصدره. ويعترض النقاد قائلين إن العلامات المائية قابلة للإزالة، وأن الإجراءات الطوعية لا تُغني عن القانون. وتجد شركة ElevenLabs نفسها في موقفٍ مُحرج ولكنه صادق: فالأداة الأكثر كفاءة في فئتها تتحمل أكبر قدر من المسؤولية في مراقبتها.

elevenlabs-ai

مقارنة بين ElevenLabs ومولدات الصوت الأخرى التي تعمل بالذكاء الاصطناعي

يُعتبر برنامج ElevenLabs على نطاق واسع البرنامج الرائد في مجال توليد الصوت بالذكاء الاصطناعي من حيث الجودة، ولكنه ليس الخيار الوحيد، وليس دائمًا الخيار الأمثل. عادةً ما يتوقف الاختيار على مدى حاجتك إلى مستوى الواقعية مقابل المبلغ الذي ترغب في إنفاقه.

أداة نقطة القوة الرئيسية الأفضل لـ
مختبرات إيليفن أصوات واقعية للغاية، أكثر من 70 لغة، واجهة برمجة تطبيقات قوية إنتاج الصوت، الدبلجة
مورف واجهة بسيطة، تكلفة أقل التعليقات الصوتية السريعة للأعمال
بلاي.ht مكتبة صوتية ضخمة البودكاست والنصوص الطويلة
OpenAI / Azure مُدمجة مع خدمات الذكاء الاصطناعي الأخرى المطورون الموجودون بالفعل في تلك المجموعة

إذا كانت أولويتك هي الحصول على مخرجات طبيعية ودعم لغات متعددة، فإن ElevenLabs خيار يصعب منافسته - لم أسمع حتى الآن أي منافس يُضاهي الإصدار الثالث في معالجة جملة معقدة حقًا. أما إذا كنت تبحث عن أداة بسيطة ورخيصة لإنتاج فيديوهات تعريفية للشركات بين الحين والآخر، فقد تجد خيارًا منافسًا يُلبي احتياجاتك بشكل أفضل وبسعر أقل.

كيفية البدء باستخدام أصوات الذكاء الاصطناعي من ElevenLabs

يستغرق إنشاء أول مقطع صوتي باستخدام مولد الصوت بتقنية الذكاء الاصطناعي من ElevenLabs حوالي ثلاث دقائق. أنشئ حسابًا مجانيًا. افتح أداة النطق واختر صوتًا، إما من المكتبة أو من نسختك الخاصة. الصق النص، واختر النموذج واللغة، ثم اضغط على "إنشاء". استمع إلى التسجيل. إذا لم يكن الأداء مثاليًا، عدّل إعدادات الثبات والأسلوب وحاول مرة أخرى، ثم نزّل ملف MP3. هذه هي العملية كاملة.

يتجاوز المطورون لوحة التحكم ويستدعون واجهة برمجة التطبيقات مباشرةً باستخدام مفتاح، حيث يمررون نصًا ومعرّفًا صوتيًا ويستقبلون ردًا صوتيًا. هكذا تربط تطبيقات المليار مستخدم منتجات ElevenLabs بمنتجاتها الخاصة.

لماذا تتصدر ElevenLabs مجال توليد الصوت بالذكاء الاصطناعي؟

انتقلت شركة ElevenLabs من مشروع جانبي للنسخ الصوتي إلى منصة بقيمة 11 مليار دولار أسرع من أي شركة برمجيات أخرى تقريبًا، والأصوات التي تقدمها جيدة لدرجة أن الضجة المثارة حولها مستحقة إلى حد كبير. تتيح النسخة المجانية لأي شخص اختبار هذا الادعاء في دقائق. لكن الواقعية نفسها التي تجذب العملاء هي ما يقلق الجهات التنظيمية وباحثي الأمن، ولن تكون مكالمة بايدن الآلية هي الحادثة الأخيرة. التكنولوجيا موجودة وتتحسن شهريًا. السؤال المطروح هو ما إذا كانت القواعد وأدوات الكشف قادرة على مواكبة الأصوات التي تخدع معظم المستمعين بالفعل. أين سترسم الخط الفاصل؟

أي أسئلة؟

شركة ElevenLabs هي شركة متخصصة في الذكاء الاصطناعي، تأسست عام 2022، تُحوّل النصوص المكتوبة إلى كلام واقعي. تشمل أدواتها تحويل النص إلى كلام، واستنساخ الصوت، ودبلجة الصوت بالذكاء الاصطناعي، وتحويل الكلام إلى نص، ووكلاء الصوت التفاعليين. يُصنّفها معظم المستخدمين ضمن أكثر مولدات الصوت بالذكاء الاصطناعي طبيعية، وتُشغّل تقنيتها الصوت بسلاسة داخل التطبيقات التي تستخدمها بالفعل.

صحيح إلى حد ما. تمنحك الخطة المجانية 10,000 رصيد شهريًا، وهو ما يكفي لبضع دقائق من الصوت، وتغطي الميزات الأساسية للاختبار. أما الحقوق التجارية والحدود الأعلى فتتطلب خطة مدفوعة، والتي تبدأ من حوالي 6 دولارات شهريًا في باقة Starter.

حوالي 11 مليار دولار. جاء هذا التقييم بعد جولة تمويل من الفئة "د" بقيمة 500 مليون دولار بقيادة شركة سيكويا في فبراير 2026، أي ما يقارب ثلاثة أضعاف قيمتها البالغة 3.3 مليار دولار في جولة التمويل من الفئة "ج" قبل ثلاثة عشر شهرًا. ويعكس هذا الارتفاع نمو إيراداتها السنوية المتكررة لتصل إلى حوالي 330 مليون دولار بحلول نهاية عام 2025.

نعم، في الغالب. تُنتج ElevenLabs بعضًا من أكثر الأصوات الاصطناعية واقعيةً، لا سيما من خلال نموذج Eleven v3 الذي يدعم العلامات العاطفية المضمنة وأكثر من 70 لغة. قد تختلف الجودة باختلاف الصوت واللغة، وقد تتفاوت جودة المقاطع الطويلة جدًا، ولكن للاستخدام اليومي، يكون الناتج مقنعًا للغاية ويُحاكي الصوت البشري.

نعم، إذا كنت مشتركًا في إحدى الباقات المدفوعة. تمنح ElevenLabs حقوقًا تجارية في باقاتها المدفوعة، ما يسمح باستخدام التعليقات الصوتية في مقاطع الفيديو المُدرّة للدخل، والبودكاست، والكتب الصوتية، والإعلانات. أما الباقة المجانية فهي مخصصة للاختبار والاستخدام الشخصي؛ ويتطلب العمل التجاري عادةً باقة Starter أو Creator على الأقل، مع ذكر المصدر عند الحاجة.

بالتأكيد. يدعم جهاز Eleven v3 أكثر من 70 لغة، وتتيح ميزة الدبلجة إعادة دبلجة الصوت أو الفيديو إلى لغة أخرى مع الحفاظ على نبرة المتحدث. هذا الدعم متعدد اللغات هو أحد الأسباب الرئيسية التي تدفع المبدعين والشركات إلى استخدام ElevenLabs للترجمة العالمية.

Ready to Get Started?

Create an account and start accepting payments – no contracts or KYC required. Or, contact us to design a custom package for your business.

Make first step

Always know what you pay

Integrated per-transaction pricing with no hidden fees

Start your integration

Set up Plisio swiftly in just 10 minutes.