إيليفن لابز: نظرة داخلية على مولد الصوت بالذكاء الاصطناعي الذي تبلغ قيمته 11 مليار دولار

نشر على Jun 22, 2026 كتب بواسطة Mathis Curcio

ربما سمعتَ عن ElevenLabs، لكنك لم تكن تعلم. الراوي في فيديوهات الشرح على يوتيوب، والحوار المدبلج في الأفلام الأجنبية، والصوت على الطرف الآخر من خط الدعم: الكثير من هذه الأصوات يتم توليدها الآن، والكثير منها يعمل بواسطة شركة واحدة لا يعرفها معظم الناس خارج مجال التقنية. ElevenLabs تُنتج أصواتًا بتقنية الذكاء الاصطناعي. في فبراير 2026، جمعت الشركة تمويلًا بقيمة 11 مليار دولار لهذا الغرض تحديدًا. أسسها صديقان من بولندا عام 2022، واليوم يُستخدم مُولّد الصوت بتقنية الذكاء الاصطناعي الخاص بها في تطبيقات يستخدمها أكثر من مليار شخص. إذًا، ما الذي تفعله تحديدًا؟ ما تكلفتها بالدولار؟ ولماذا يُقلق هذا الأمر خبراء السلامة باستمرار؟

ما تقدمه ElevenLabs: أصوات الذكاء الاصطناعي والمزيد

بدأ الأمر كأداة متواضعة لتحويل النص إلى كلام. والآن، أصبح نظامًا صوتيًا متكاملًا، والأصوات ليست سوى الجزء الذي تلاحظه أولًا. أما اتساع نطاق الميزات الأخرى فهو ما يبرر سعره. تناول المؤسسان المشكلة من زوايا غير مألوفة: كان بيوتر دابكوفسكي مهندسًا للتعلم الآلي في جوجل، وماتي ستانيشيفسكي استراتيجيًا في بالانتير. كان إحباطهما المشترك بسيطًا: الكلام الاصطناعي آنذاك كان ينطق الكلمات لكنه لم يكن قادرًا على تمثيلها. فكرا: حلّ هذه المشكلة، وسيتبعها كل شيء آخر. ولا تزال معظم منتجات الشركة تنبع من هذا الرهان.

تحويل النص إلى كلام وأصوات الذكاء الاصطناعي الواقعية

ابدأ بالأساس: يحوّل النص المكتوب إلى صوت منطوق. أحدث إصدار، Eleven v3 ، صدر في يونيو 2025. يدعم أكثر من 70 لغة، ويقبل علامات مضمنة مثل [يهمس] أو [يضحك]، ما يتيح لك توجيه الأداء سطرًا بسطر. هل تحتاج إلى سرعة أكبر؟ يتوفر إصدار أخف يُسمى Flash، يُضحي ببعض اللمسات النهائية مقابل إخراج فوري تقريبًا، وهو أمر بالغ الأهمية للتطبيقات المباشرة. والنتيجة صوت واقعي للغاية. لهذا السبب، يلجأ المبدعون إلى ElevenLabs للتعليق الصوتي، والبودكاست، والسرد في فيديوهات الذكاء الاصطناعي، حيث أن القراءة الآلية ستفسد التجربة.

ما يُميّز الإصدار الثالث هو التحكم. كانت المحركات القديمة تقرأ كل شيء بنبرة رتيبة. ليس هذا المحرك. بمجرد تحديد جملة ليتم همسها أو نطقها بسرعة أو حتى مع تنهيدة، يبدأ النص في أداءٍ حقيقي. في المرة الأولى التي تسمعه فيها يُلقي جملة ساخرة، قد تشعر بشيء من الغرابة. لا يزال الإصدار الثاني متعدد اللغات الأقدم يدعم 29 لغة، ويُعتبر الخيار الافتراضي للسرد الطويل والمستقر، حيث تُعدّ الاتساق أهم من التنوع.

استنساخ الصوت، والدبلجة، والصوت متعدد اللغات

هناك ميزتان تجعلانها تتجاوز مجرد التعليق الصوتي. الأولى هي استنساخ الصوت. ما عليك سوى إدخال عينة صوتية قصيرة، وستقوم بنسخ صوت محدد، إما استنساخ سريع وفوري من مقطع صوتي مدته دقيقة تقريبًا، أو صوت احترافي أكثر وضوحًا. أما الثانية فهي الدبلجة بالذكاء الاصطناعي. ما عليك سوى إدخال فيديو جاهز، وستقوم بإعادة دبلجته بالكامل إلى لغة أخرى مع الحفاظ على نبرة المتحدث، مما يجعل عملية الترجمة متعددة اللغات، التي كانت تتطلب سابقًا حجز استوديو، تتم ببضع نقرات فقط. كما يوجد مكتبة صوتية مشتركة، حيث ينشر المستخدمون أصواتهم ويرخصونها لبعضهم البعض.

النسخة الاحترافية هي التي تهم الاستوديوهات. امنحها ثلاثين دقيقة من الصوت النقي وتحقق من الموافقة. في المقابل، تُحاكي هذه النسخة إيقاع ولهجة الصوت الأصلي بدقة متناهية، لدرجة أن ممثلي الأداء الصوتي يرخصون الآن نسخهم الخاصة ويحصلون على نسبة من أرباحهم حتى أثناء نومهم. أما النسخة الفورية فهي أسرع وأقل دقة، ومناسبة لنموذج أولي سريع، ويسهل تمييزها كنسخة اصطناعية.

كاتب، موسيقى الذكاء الاصطناعي، ووكلاء المحادثة

تعمل هذه المجموعة في الاتجاه المعاكس أيضًا، من الصوت إلى النص. Scribe هو نموذج تحويل الكلام إلى نص، حيث يقوم بنسخ الكلام مع تحديد المتحدث والطوابع الزمنية، ويدعم الإصدار الثاني منه 99 لغة مع تحديد هوية المتحدث بدقة تصل إلى 98%. كما أُضيفت خدمة Eleven Music في عام 2025، والتي تُنتج مقاطع موسيقية خلفية مُنقّحة عند الطلب. أما وكلاء الذكاء الاصطناعي التفاعلي، فيتجاوزون ذلك بكثير: إذ يجمعون بين تحويل الكلام إلى نص، ونموذج اللغة، وتحويل النص إلى كلام، ليتمكن الروبوت من الاستماع والإجابة في الوقت الفعلي، ثم تحويل المحادثة إلى مُتحدث بشري بسلاسة تامة. ويُكمّل ذلك المؤثرات الصوتية وعزل الصوت لمعالجة التسجيلات الصوتية المشوّشة.

يُظهر برنامج Scribe عمق هذه المنصة الحقيقي. فهو لا يقتصر على إنتاج نص مكتوب فحسب، بل يقوم بتصنيف الأصوات غير الكلامية، وتحديد الطوابع الزمنية على مستوى الكلمات، وفصل المتحدثين المتداخلين، ولهذا السبب يعتمد عليه مُنتجو البودكاست والباحثون لتحويل التسجيلات غير المنظمة إلى نصوص قابلة للبحث والتعديل. ويُباع الإصدار الثاني منه بسعر أقل بنحو 40% من الإصدار الأول. منتج ذكاء اصطناعي يتحسن ويقل سعره في آن واحد؟ هذا نادر.

elevenlabs-ai

كيف أصبحت شركة ElevenLabs شركة ذكاء اصطناعي بقيمة 11 مليار دولار

تتجاهل صفحات المنتج الجزء الأكثر إثارة للدهشة: التمويل. لكن بالنظر إلى التمويل، يتضح أن النمو يتجاوز المألوف. ففي أوائل عام 2025، جمعت شركة ElevenLabs تمويلًا بقيمة 180 مليون دولار في جولة التمويل من الفئة C، مما رفع قيمتها إلى 3.3 مليار دولار، بقيادة مشتركة من Andreessen Horowitz وICONIQ Growth. وبعد 13 شهرًا، قادت Sequoia جولة تمويل من الفئة D بقيمة 500 مليون دولار ، لتصل قيمة الشركة إلى 11 مليار دولار. أي ثلاثة أضعاف، في غضون عام واحد، لنفس الشركة.

تُفسر الإيرادات هذا الإقبال الكبير. فقد تجاوزت إيرادات ElevenLabs السنوية المتكررة 330 مليون دولار بنهاية عام 2025. لكن ما يُثير قلق المستثمرين هو سرعة النمو. عشرون شهرًا للوصول إلى 100 مليون دولار، ثم عشرة أشهر لمضاعفتها، ثم خمسة أشهر فقط للوصول إلى 330 مليون دولار. كل دورة أقصر من سابقتها. وبحسب إحصاءات الشركة نفسها في يناير 2025، فقد استخدم أكثر من 60% من موظفي شركات Fortune 500 المنصة.

دائري	تاريخ	نشأ	تقييم
السلسلة ب	يناير 2024	80 مليون دولار	1.1 مليار دولار
السلسلة ج	يناير 2025	180 مليون دولار	3.3 مليار دولار
السلسلة د	فبراير 2026	500 مليون دولار	11 مليار دولار

جمعت شركة ElevenLabs ما يقارب 781 مليون دولار أمريكي عبر خمس جولات تمويلية، وقد ناقش مؤسسوها علنًا إمكانية طرح أسهمها للاكتتاب العام. ما يُقنع المستثمرين ليس التطبيق المُخصص للمستهلكين، بل البنية التحتية الداعمة له: فكل شركة تُضيف ميزة الصوت إلى منتجها تُعدّ عميلًا مُحتملًا، وسوق الكلام الاصطناعي كان شبه معدوم قبل ثلاث سنوات. الرهان هو أن يصبح الصوت واجهة افتراضية كما حدث مع شاشة اللمس.

أسعار ElevenLabs: خطط مجانية ومدفوعة

يمكنك استخدام ElevenLabs مجانًا، والخطة المجانية ليست مجرد تجربة أولية. تمنحك الخطط المدفوعة رصيدًا شهريًا إضافيًا، يُستهلك مع كل عملية إنتاج صوتي، بدلًا من فتح ميزات جديدة كليًا. إليك هيكل 2026 .

يخطط	السعر / شهرياً	الرصيد الشهري
حر	0 دولار	10000
بداية	6 دولارات	30,000
الخالق	22 دولارًا	121,000
محترف	99 دولارًا	600,000
حجم	299 دولارًا	1,800,000
عمل	990 دولارًا	6,000,000

تُعادل الأرصدة تقريبًا عدد الأحرف الصوتية، لذا تكفي باقة مجانية بقيمة 10,000 رصيد لبضع دقائق من الصوت شهريًا. تُعدّ باقة "المبدع" بسعر 22 دولارًا نقطة انطلاق عملية لأي شخص ينشر بانتظام، وتُفعّل حقوق الاستخدام التجاري في الباقات المدفوعة. يدفع المطورون مقابل كل استخدام عبر واجهة برمجة التطبيقات (API) بدلًا من رسوم شهرية ثابتة.

فوق باقة الأعمال، توجد باقة المؤسسات المخصصة التي توفر دعمًا فنيًا متخصصًا، وحدود استخدام أعلى، والشروط التعاقدية التي تتطلبها معظم الشركات الكبيرة. يتم احتساب استخدام واجهة برمجة التطبيقات (API) بناءً على عدد الأحرف المُولّدة، لذا فإن التطبيقات ذات حركة المرور العالية تدفع بما يتناسب مع الاستخدام الفعلي بدلاً من تحديد خطة مسبقة. لكن انتبه، لا يتم ترحيل الرصيد، لذا فإن أي شهر غير مستخدم يُعد خسارة مالية.

من يستخدم ElevenLabs ولأي غرض؟

المستخدمون المثيرون للاهتمام ليسوا هواةً يصنعون مقاطع فيديو مبتكرة، بل هم شركات تستبدل وقت الاستوديوهات. ناشرو الكتب الصوتية يروون كتالوجات كاملة دون الحاجة إلى ممثلين. يضيف مستخدمو يوتيوب ومنشئو الدورات التدريبية تعليقات صوتية بلغة لا يتحدثونها. استوديوهات الألعاب تؤدي أصوات شخصيات ثانوية على نطاق واسع. تطبيقات تسهيل الوصول تقرأ المقالات بصوت عالٍ عبر تطبيق ElevenReader. مراكز الاتصال تُشغّل وكلاء محادثة يجيبون على الأسئلة الروتينية قبل تدخل موظف بشري. فرق التوطين تُدبلج مقاطع فيديو تدريبية للموظفين حول العالم.

هذا الانتشار الواسع هو ما يُبرر استمرار قيمة الشركة. تقول الشركة إن واجهة برمجة التطبيقات (API) الخاصة بها تُشغّل منتجات تخدم مجتمعةً أكثر من مليار مستخدم، ومن بين عملائها شركات مثل Meta وEpic Games وSalesforce. بالنسبة لمعظم هؤلاء المشترين، تُعدّ ElevenLabs بمثابة بنية تحتية صوتية غير مرئية داخل منتج يحمل اسمًا آخر.

تُوضّح بعض الأمثلة حجم هذا التطور. يقرأ تطبيق ElevenReader المقالات وملفات PDF والكتب الإلكترونية بصوتٍ مُختار، ما جعله أداةً فعّالةً لتسهيل الوصول للأشخاص الذين يعانون من عسر القراءة أو ضعف البصر. تُنشئ غرف الأخبار نسخًا صوتيةً تلقائيًا للقصص المكتوبة. يمنح مطورو الألعاب المستقلون الشخصيات غير القابلة للعب أصواتًا مميزةً كانت تتطلب سابقًا ميزانيةً للتسجيل لم تكن متوفرةً لديهم. القاسم المشترك هو جودة الصوت الإنتاجية التي كانت تتطلب استوديو، والتي أصبحت الآن تُستخرج من مربع نص.

مشكلة التزييف العميق وسلامة الصوت المدعوم بالذكاء الاصطناعي

الأصوات المتقنة كهذه سلاحٌ أيضاً. وقد تعلمت شركة ElevenLabs ذلك بطريقةٍ قاسية. ففي يناير 2024، وجّهت رسالةٌ آليةٌ مزيفةٌ بصوت الرئيس بايدن ناخبي نيو هامبشاير إلى مقاطعة الانتخابات التمهيدية. لم يكن هو المتحدث الحقيقي بالطبع. قامت شركة Pindrop الأمنية بتحليل المقطع، وتتبعت مصدره إلى ElevenLabs، وأفادت بتطابقٍ بنسبة 84% مع بياناتها. وعلى إثر ذلك، حظرت الشركة الحساب المسؤول عن هذا المقطع.

أثارت تلك الحادثة مسألة السلامة بشكل علني. تُشغّل شركة ElevenLabs الآن مُصنِّفًا صوتيًا يعمل بالذكاء الاصطناعي يتحقق مما إذا كان المقطع الصوتي صادرًا عن أدواتها، ويمنع استنساخ أصوات شخصيات عامة معينة عالية الخطورة، ويطلب التحقق من الهوية قبل السماح باستنساخ الصوت الاحترافي. هل يعمل أيٌّ من ذلك بشكل كامل؟ كلا. فالكشف دائمًا ما يتأخر عن الإنتاج، ويمكن للمُحتال المُصمّم أن يلجأ ببساطة إلى مُزوّد خدمة أقل كفاءة. لذا، إليكم الحقيقة: لقد وضعت الشركة ضوابط حقيقية حول أداة ذات استخدام مزدوج في جوهرها، ولا يزال السباق بين إنتاج الأصوات المُزيّفة وكشفها مستمرًا.

لاحظت الجهات التنظيمية ذلك. فقد اتخذت عدة ولايات أمريكية إجراءات لتقييد المكالمات الآلية المُولّدة بالذكاء الاصطناعي بعد حادثة بايدن، وانضمت الشركة إلى جهود القطاع في مجال العلامات المائية الصوتية، وهي عبارة عن تضمين إشارات تبقى بعد الضغط وتساعد في تتبع المقطع الصوتي إلى مصدره. ويعترض النقاد قائلين إن العلامات المائية قابلة للإزالة، وأن الإجراءات الطوعية لا تُغني عن القانون. وتجد شركة ElevenLabs نفسها في موقفٍ مُحرج ولكنه صادق: فالأداة الأكثر كفاءة في فئتها تتحمل أكبر قدر من المسؤولية في مراقبتها.

elevenlabs-ai

مقارنة بين ElevenLabs ومولدات الصوت الأخرى التي تعمل بالذكاء الاصطناعي

يُعتبر برنامج ElevenLabs على نطاق واسع البرنامج الرائد في مجال توليد الصوت بالذكاء الاصطناعي من حيث الجودة، ولكنه ليس الخيار الوحيد، وليس دائمًا الخيار الأمثل. عادةً ما يتوقف الاختيار على مدى حاجتك إلى مستوى الواقعية مقابل المبلغ الذي ترغب في إنفاقه.

أداة	نقطة القوة الرئيسية	الأفضل لـ
مختبرات إيليفن	أصوات واقعية للغاية، أكثر من 70 لغة، واجهة برمجة تطبيقات قوية	إنتاج الصوت، الدبلجة
مورف	واجهة بسيطة، تكلفة أقل	التعليقات الصوتية السريعة للأعمال
بلاي.ht	مكتبة صوتية ضخمة	البودكاست والنصوص الطويلة
OpenAI / Azure	مُدمجة مع خدمات الذكاء الاصطناعي الأخرى	المطورون الموجودون بالفعل في تلك المجموعة

إذا كانت أولويتك هي الحصول على مخرجات طبيعية ودعم لغات متعددة، فإن ElevenLabs خيار يصعب منافسته - لم أسمع حتى الآن أي منافس يُضاهي الإصدار الثالث في معالجة جملة معقدة حقًا. أما إذا كنت تبحث عن أداة بسيطة ورخيصة لإنتاج فيديوهات تعريفية للشركات بين الحين والآخر، فقد تجد خيارًا منافسًا يُلبي احتياجاتك بشكل أفضل وبسعر أقل.

كيفية البدء باستخدام أصوات الذكاء الاصطناعي من ElevenLabs

يستغرق إنشاء أول مقطع صوتي باستخدام مولد الصوت بتقنية الذكاء الاصطناعي من ElevenLabs حوالي ثلاث دقائق. أنشئ حسابًا مجانيًا. افتح أداة النطق واختر صوتًا، إما من المكتبة أو من نسختك الخاصة. الصق النص، واختر النموذج واللغة، ثم اضغط على "إنشاء". استمع إلى التسجيل. إذا لم يكن الأداء مثاليًا، عدّل إعدادات الثبات والأسلوب وحاول مرة أخرى، ثم نزّل ملف MP3. هذه هي العملية كاملة.

يتجاوز المطورون لوحة التحكم ويستدعون واجهة برمجة التطبيقات مباشرةً باستخدام مفتاح، حيث يمررون نصًا ومعرّفًا صوتيًا ويستقبلون ردًا صوتيًا. هكذا تربط تطبيقات المليار مستخدم منتجات ElevenLabs بمنتجاتها الخاصة.

لماذا تتصدر ElevenLabs مجال توليد الصوت بالذكاء الاصطناعي؟

انتقلت شركة ElevenLabs من مشروع جانبي للنسخ الصوتي إلى منصة بقيمة 11 مليار دولار أسرع من أي شركة برمجيات أخرى تقريبًا، والأصوات التي تقدمها جيدة لدرجة أن الضجة المثارة حولها مستحقة إلى حد كبير. تتيح النسخة المجانية لأي شخص اختبار هذا الادعاء في دقائق. لكن الواقعية نفسها التي تجذب العملاء هي ما يقلق الجهات التنظيمية وباحثي الأمن، ولن تكون مكالمة بايدن الآلية هي الحادثة الأخيرة. التكنولوجيا موجودة وتتحسن شهريًا. السؤال المطروح هو ما إذا كانت القواعد وأدوات الكشف قادرة على مواكبة الأصوات التي تخدع معظم المستمعين بالفعل. أين سترسم الخط الفاصل؟

Mathis Curcio

Mathis Curcio is a senior content strategist and NFT specialist at Plisio. With over 5 years of experience in the Web3 space, Mathis focuses on the evolution of NFT ecosystems, digital collectibles, and decentralized ownership models. He creates accessible, insight-driven content that bridges the gap between blockchain innovation and mainstream adoption. His expertise spans NFT market trends, use cases across art and gaming, and the infrastructure powering next-generation tokenized assets.