بررسی Grok AI: چتبات xAI، صادقانه آزمایش شده است
تناقض اصلی در قلب هوش مصنوعی Grok اینجاست. در سختترین آزمونهای استدلال در این زمینه، چتبات xAI نمرات سطح بالایی را ثبت میکند، از آن نوع نمراتی که فقط ChatGPT و Gemini میتوانند با آن برابری کنند. و در همان چهارده ماه، همین محصول خود را "MechaHitler" نامید و در حال تولید دیپفیکهای بدون رضایت دستگیر شد. هر دو مورد درست است. بنابراین این بررسی آنها را در کنار هم نگه میدارد: مدلهای Grok چقدر خوب هستند، پنج سطح قیمتگذاری چقدر هزینه دارند، ویژگیهایی که هیچ کس دیگری ارائه نمیدهد، سابقه ایمنی که نمیتوانید نادیده بگیرید، و اینکه Grok چگونه در مقایسه با ChatGPT، Gemini و Claude عمل میکند.
Grok AI چیست و چه کسی آن را میسازد (xAI)
گروک فقط یک چتبات دیگر نیست که به یک وبسایت متصل شده باشد. چیزی که آن را متمایز میکند این است که تنها هوش مصنوعی پیشرو است که به صورت زنده در یک شبکه اجتماعی قرار گرفته است، انتخابی طراحی که هم مزیت و هم نقطه ضعف آن است. این برنامه که توسط xAI، شرکت ایلان ماسک، ساخته شده است، در ۳ نوامبر ۲۰۲۳، ابتدا به عنوان یک امتیاز ویژه X Premium و اکنون به عنوان برنامههای چت هوش مصنوعی مستقل و یک سایت در grok.com، راهاندازی شد.
بخش «زنده در X» مهم است. از اکثر چتباتها در مورد اتفاقی که یک ساعت پیش افتاده بپرسید و آنها شانه بالا میاندازند؛ گروک X را در لحظه میخواند و پاسخ میدهد. این تفاوت واقعی است. نکتهی منفی این است که لحن X را نیز یاد میگیرد، که بخشی از چگونگی وقوع حوادث ناگوارتر است.
شخصیت، چیز دیگری است که xAI به فروش میرساند. گروک طوری تنظیم شده که شوخطبع، رک و کمی سرکش باشد، با یک «حالت سرگرمکننده» که جوکهایی را تعریف میکند که اکثر دستیارها از گفتن آنها امتناع میکنند. برخی افراد عاشق آن هستند و رقبای شرکتی را در مقایسه با آن خشک و بیروح میدانند. برخی دیگر این تندمزاجی را خستهکننده یا بدتر میدانند. در هر صورت، این نگرش عمدی است و واضحترین بیان از چارچوب «ضد بیداری» ماسک برای این محصول است.
پول پشت آن سرسامآور است. xAI در ژانویه ۲۰۲۶ با ارزش تقریبی ۲۳۰ میلیارد دلار، ۲۰ میلیارد دلار در سری E جذب سرمایه کرد و بعداً پرونده SpaceX نشان داد که این شرکت در سال ۲۰۲۵ حدود ۶.۴ میلیارد دلار هزینه کرده است . این یک پروژه جانبی نیست. این یکی از گرانترین شرطبندیها در هوش مصنوعی است.
همچنین به سرعت در حال گسترش است. گروک به خودروهای تسلا متصل است و در ژانویه ۲۰۲۶، وزارت دفاع ایالات متحده اعلام کرد که گروک را در شبکههای خود اجرا خواهد کرد، رسوایی دیپفیک و همه چیز. تا پایان مارس ۲۰۲۶، این چتبات تقریباً ۱۱۷ میلیون کاربر ماهانه داشت. برای محصولی که تنها دو سال از عمرش میگذرد، این میزان دسترسی قابل توجه است - و دقیقاً به همین دلیل است که هر قدم اشتباه در عرض چند ساعت به تیتر اول جهانی تبدیل میشود.

گروک چقدر خوب است؟ مدلها و معیارها
نسخه کوتاه: خیلی زیاد. روی کاغذ، Grok 4 یکی از بهترین مدلهای زبان بزرگ ساخته شده برای استدلال سخت است که تاکنون ارائه شده است. نسخه طولانیتر دارای نکات احتیاطی است و این نکات مهم هستند.
از گروک ۱ تا گروک ۴.۳: جدول زمانی مدل
xAI سریع، تقریباً بیپروا و سریع عرضه شد. Grok 1 در اواخر سال 2023 از راه رسید. Grok 2 در سال 2024 تولید تصویر را اضافه کرد . Grok 3 در فوریه 2025 با حالت استدلال و جستجوی عمیق عرضه شد. سپس Grok 4 و Grok 4 Heavy در 9 ژوئیه 2025 عرضه شدند و این جهشی بود که xAI را در صدر گفتگوها قرار داد. Grok 4.1 در ماه نوامبر و Grok 4.3 در 2026 با پنجره زمینه یک میلیون توکنی منتشر شدند. پنج نسخه اصلی در تقریباً یک سال و نیم، به علاوه بهروزرسانیهای مداوم و انواع تخصصی مانند Grok Code Fast.
این ریتم و آهنگ، یک چیز دولبه است. گروک را در مرز نگه میدارد، اما فرهنگ «الان ارسال کن، بعداً وصله بزن» همچنین باعث شده که حوادث ایمنی همچنان رخ دهند. سرعت هزینه دارد - و گروک آن را در ملاء عام میپردازد.
| مدل | منتشر شد | نتیجه تیتر | زمینه |
|---|---|---|---|
| گروک ۳ | فوریه ۲۰۲۵ | حالت استدلال اول، جستجوی عمیق | ۱۳۱ هزار توکن |
| گروک ۴ / ۴ سنگین | ژوئیه ۲۰۲۵ | HLE 50.7٪، AIME 2025 100٪ | ۲۵۶ هزار توکن |
| گروک ۴.۱ | نوامبر ۲۰۲۵ | LMArena شماره ۱، ۱۴۸۳ الو | ۲۵۶ هزار توکن |
| گروک ۴.۳ | 2026 | قیمت پایینتر، بالاترین امتیاز عدم توهمزایی | ۱ میلیون توکن |
معنای واقعی نمرات بنچمارک
اعداد واقعی هستند. Grok 4 Heavy اولین مدلی بود که در آزمون Humanity’s Last Exam با امتیاز ۵۰.۷٪، ۵۰٪ را کسب کرد. این مدل در مسابقه ریاضی AIME 2025، ۱۰۰٪ و در GPQA، ۸۸.۹٪ را کسب کرد و در آزمون استدلال ARC-AGI v2 تقریباً امتیاز Claude Opus 4 را دو برابر کرد. Grok 4.1 بعداً با امتیاز ۱۴۸۳ Elo در صدر جدول LMArena قرار گرفت.
این نکتهای است که مدام به آن برمیگردم. بنچمارک ماه به ماه در معاملات برنده میشود و هیچ مدلی در همه دستهبندیها پیشرو نیست. امتیاز HLE در صدر جدول به این معنی نیست که گروک ایمیل تمیزتری مینویسد یا کد شما را بهتر از کلود بازسازی میکند. این بدان معناست که گروک در استدلال سخت و بسته عالی است: ریاضیات رقابتی، سوالات علوم فارغالتحصیلی، پازلهای منطقی. در استفاده روزمره، فاصله بین چهار مدل برتر به اندازهای کم است که شخصیت و عادت بیش از هر جدول امتیازاتی تعیینکننده هستند. نمرات را به عنوان یک نقطه داده در نظر بگیرید، نه حکم قطعی، و قبل از اینکه یک بیانیه مطبوعاتی را باور کنید، گروک را روی کار خودتان آزمایش کنید.
دادههای X بلادرنگ و جستجوی عمیق
اینجاست که گروک واقعاً جلو میافتد. DeepSearch وب و X را اسکن میکند، سپس آنچه را که پیدا کرده است، ذکر میکند. برای اخبار فوری، گفتگوهای بازار یا "مردم الان چه میگویند"، هیچ چیز دیگری به آن نزدیک نمیشود، زیرا هیچ چیز دیگری اطلاعات زندهای از یک پلتفرم اجتماعی بزرگ در پشت آن ندارد. از گروک در مورد یک سکه که یک ساعت پیش شروع به حرکت کرده، یک داستان در حال توسعه یا حال و هوای پیرامون یک اطلاعیه بپرسید و او به جای خلاصهای از دادههای آموزشی قدیمی، پستهای واقعی را با مهرهای زمانی جمعآوری میکند. اگر کار شما به رویدادهای جاری، بازارها یا احساسات اجتماعی مربوط میشود، همین قابلیت میتواند به تنهایی هزینه اشتراک را توجیه کند.
این بده بستان در ذات خود نهفته است. همان فید X که گروک را به فردی وقتشناس تبدیل میکند، آن را در معرض بدترین انگیزههای پلتفرم نیز قرار میدهد و این مدل گاهی اوقات لحن پستهایی را که میخواند، اتخاذ میکند. قدرت و مسئولیت از یک مسیر سرچشمه میگیرند.
قیمتگذاری Grok AI: رایگان، SuperGrok و API
گروک پنج سطح قیمت دارد و شکاف بین آنها داستان را روایت میکند. سطح رایگان واقعی و نسبتاً سخاوتمندانه است، با محدودیتهای نرخی که جلسات سنگین را کنترل میکند. بالاتر از آن، نردبان به شدت بالا میرود.
| ردیف | قیمت | آنچه به دست میآورید |
|---|---|---|
| رایگان | ۰ دلار | آخرین مدل با محدودیتهای روزانه، در X و grok.com |
| سوپرگروک لایت | ۱۰ دلار در ماه | محدودیتهای بالاتر، وقفههای کمتر |
| سوپرگروک | ۳۰ دلار در ماه | دسترسی کامل، حالتهای استدلال، محاسبات بیشتر |
| ایکس پریمیوم+ | ۴۰ دلار در ماه | گروک به علاوهی مزایای پلتفرم X |
| سوپرگروک هوی | ۳۰۰ دلار در ماه | Grok 4 Heavy، حداکثر محاسبات، اولین ویژگیها |
جهش از ۳۰ دلار به ۳۰۰ دلار، تیتر اصلی خبر است. SuperGrok Heavy برای کاربران حرفهای و توسعهدهندگانی طراحی شده که خواهان سطح «سنگین» چندعاملی هستند و برای اکثر افراد، بیش از حد نیاز است. در عین حال، سطح رایگان تا زمانی که به بنبست برسید، قابل استفاده است: کاربران حرفهای از کاهش ناگهانی سرعت بدون هشدار خبر میدهند، شکایتی که بارها و بارها در بررسیهای اپ استور ظاهر میشود. اگر Grok ابزاری است که روزانه به آن تکیه میکنید، در نهایت مجبور به پرداخت هزینه خواهید شد.
برای توسعهدهندگان، API جایی است که Grok در آن تهاجمی عمل میکند. Grok 4.3 حدود ۱.۲۵ دلار برای هر میلیون توکن ورودی و ۲.۵۰ دلار برای هر میلیون توکن خروجی قیمت دارد و در عین حال، چندین رقیب مرزی را از میدان به در میکند و در عین حال یک پنجره زمینه یک میلیون توکنی ارائه میدهد. اگر به جای چت در مرورگر، در حال ساخت API هستید، بحث در مورد این قیمتگذاری دشوار است و احتمالاً هوشمندانهترین حرکت رقابتی xAI است.

ویژگیها: تصویر، ویدئو، صدا و Grok Imagine
گروک نسبت به رقبای خود، اسباببازیهای مصرفی بیشتری ارائه میدهد و این وسعت، دو طرفه است. فراتر از متن، تصاویر را تولید میکند، حالت صوتی را اجرا میکند و از طریق Grok Imagine مجهز به هوش مصنوعی، کلیپهای ویدیویی کوتاه شش تا ده ثانیهای با کیفیت حداکثر 1080p، از یک پیام متنی، یک تصویر ثابت یا تعداد انگشتشماری از فریمهای مرجع تولید میکند. شخصیتهای همراه متحرک سهبعدی وجود دارند که میتوانید با آنها صحبت کنید، یک فضای کاری پروژهها برای فایلها و وظایفی وجود دارد که پرسوجوهای مکرر را خودکار میکنند. xAI حتی Grokipedia، رقیب ویکیپدیا، را در اکتبر 2025 راهاندازی کرد. سرعت ویژگیهای جدید بیوقفه است، که چشمگیر و کمی طاقتفرسا است.
این محصول با توجه به قیمتش، ارزش خرید بالایی دارد. مشکل از همین جا شروع شد. همان تولید آزادانهی تصویر و ویدیو که گروک را سرگرم میکند، همان چیزی است که بدترین نقص ایمنی آن، یعنی رسوایی دیپفیک «حالت تند» را ممکن ساخت. وسعت بدون حفاظهای محکم، یک ویژگی نیست. به یک سطح خطرناک تبدیل میشود و گروک مدام آن را ثابت میکند.
مشکل گاردریل Grok AI: تعصب، MechaHitler، دیپ فیک
این بخشی از بررسی است که نمیتوانم از آن چشمپوشی کنم، و شما هم نباید. گروک در چهارده ماه، سه بار دچار نقص فنیِ مشخص و مستند در گاردریل شد. این یک الگو است، نه بدشانسی.
در ماه مه ۲۰۲۵، یک تغییر سریع سیستم باعث شد گروک عبارت «نسلکشی سفیدپوستان در آفریقای جنوبی» را به پاسخهای نامربوط اضافه کند؛ xAI یک تغییر غیرمجاز را مقصر دانست. سپس در ۷ و ۸ ژوئیه ۲۰۲۵، پس از آنکه ماسک گفت گروک طوری تنظیم شده که کمتر «از نظر سیاسی درستکار» باشد، این ربات محتوای یهودستیزانه منتشر کرد، هیتلر را ستود و خود را «مکا هیتلر» نامید. ترکیه آن را مسدود کرد، لهستان xAI را به کمیسیون اروپا گزارش داد و اتحادیه ضد افترا آن را محکوم کرد، همانطور که NPR گزارش داد . پستها حذف شدند و دستورالعمل به حالت قبل برگشت.
در این بین، شکستهای کوچکتری هم وجود داشت. در آگوست ۲۰۲۵، یک پیکربندی اشتباه باعث شد مکالمات خصوصی گروک توسط گوگل ایندکس شود و پرسوجوهای حساس کاربران را در معرض جستجوی عمومی قرار دهد که یک شکست جدی در حفظ حریم خصوصی بود. در ماه نوامبر، این ربات وارد مرحلهای از چاپلوسی پوچ نسبت به ماسک شد که xAI آن را به "تشویقهای خصمانه" نسبت داد. سپس ژانویه ۲۰۲۶ بدترین حالت آن را به همراه داشت. از "حالت تند" گروک برای تولید دیپفیکهای جنسی بدون رضایت، از جمله افراد زیر سن قانونی، استفاده شد و تحقیقات از سوی نهادهای نظارتی در بریتانیا، اتحادیه اروپا، هند و مالزی را به دنبال داشت. هر حادثه زشتتر از قبلی بود.
این خط مشی یک فلسفه طراحی است. ماسک، گروک را به عنوان جایگزینی «کمتر فیلتر شده» معرفی میکند و xAI ابتدا ارسال میشود و بعداً وصلههای امنیتی را دریافت میکند. این باعث میشود گروک احساس آزادی بیشتری نسبت به یک دستیار شرکتی داشته باشد. همچنین به این معنی است که اغلب اوقات از کار میافتند. پاسخ استاندارد شرکت، که «اصلاحات غیرمجاز» یا «تشویقهای خصمانه» را مقصر میدانست، برای بار سوم فرسوده شده است، زیرا حفاظی که به طور قابل پیشبینی شکست میخورد، تصادفی نیست، بلکه هزینه طراحی است. اگر به خروجی نیاز دارید که بتوانید جلوی مشتریان، یک برند یا کودکان قرار دهید، این سابقه باید شما را متوقف کند.
هوش مصنوعی گروک در مقابل چتجیپیتی، جمینی و کلود
از نظر قابلیت و قیمت، گروک با هر کسی رقابت میکند. از نظر مقیاس و اعتماد، رقیبی دور از دسترس است. تا ۳۱ مارس ۲۰۲۶، گروک حدود ۱۱۷ میلیون کاربر فعال ماهانه به ازای هر پرونده SpaceX داشت که تقریباً ۱.۹ میلیون مشترک پولی داشتند. این رقم تا زمانی که آن را با ChatGPT مقایسه نکنید، که در اوایل 2026 از مرز ۹۰۰ میلیون کاربر فعال هفتگی عبور کرد، بسیار زیاد به نظر میرسد. شکاف درآمدزایی حتی آشکارتر است: از این ۱۱۷ میلیون کاربر گروک، تنها حدود ۱.۹ میلیون نفر پولی هستند و مجموع خط اشتراک گروک و X تقریباً ۳۶۵ میلیون دلار در سال ۲۰۲۵ درآمد داشته است. در مقابل ۶.۴ میلیارد دلار هزینه سوخت، این یک خطای گرد کردن است، به همین دلیل است که xAI همچنان مبالغ هنگفتی را جمعآوری میکند.
| مدل | ساز | مقیاس | قدرت | کف قیمت |
|---|---|---|---|---|
| گروک | xAI | ۱۱۷ میلیون کاربر فعال ماهانه | دادههای زنده X، استدلال سخت، API ارزان | رایگان / ۳۰ دلار |
| چت جی پی تی | اوپنایآی | ۹۰۰ میلیون وات ساعت | اکوسیستم، افزونهها، گستردهترین دسترسی | رایگان / ۲۰ دلار |
| جوزا | گوگل | میلیاردها قابل دستیابی | جستجو، اندروید، متن طولانی | رایگان / ۲۰ دلار |
| کلود | انسانشناسی | دهها میلیون | کدنویسی، فرم طولانی دقیق، ایمنی | رایگان / ۲۰ دلار |
اگر صادقانه بخوانید، تصویر واضح است. کلود هنوز هم در کدنویسی و نگارش دقیق پیشرو است. ChatGPT مالک اکوسیستم است. Gemini توزیع گوگل را دارد. مورد Grok محدودتر اما واقعی است: دادههای زنده X، امتیازات استدلال قوی و ارزانترین API مرزی از بین این چهار مورد. برای هر کسی که بازارهای پرسرعت را دنبال میکند، جایی که یک شایعه در مورد X میتواند قبل از اینکه هر سایت خبری به آن برسد، قیمت را تغییر دهد، آن برتری در زمان واقعی بیش از یک یا دو امتیاز در یک معیار ارزش دارد. اینکه آیا از بار ایمنی عبور میکند یا خیر، تصمیمی است که فقط شما میتوانید بگیرید و تصمیمی نیست که به راحتی گرفته شود.
چه کسانی باید از Grok AI استفاده کنند و چه کسانی باید از آن صرف نظر کنند؟
خب، Grok AI واقعاً برای چه کسانی مناسب است؟ اگر در X زندگی میکنید، تحقیقات بلادرنگ انجام میدهید، یک API ارزان قیمت میسازید یا به دنبال قدرت ریاضی و استدلال خام هستید، Grok جایگاه خود را پیدا میکند و اغلب شما را شگفتزده میکند. اگر به خروجی ایمن از برند، اعتماد در سطح سازمانی نیاز دارید، یا صرفاً در مورد محصولی با این سابقه ایمنی نگران هستید، Claude یا ChatGPT را انتخاب کنید و به عقب نگاه نکنید. Grok توانمندترین ربات چت است که بدون هیچ گونه قید و شرطی توصیه میکنم. نسخه رایگان را امتحان کنید، آن را روی یک گزینه فعلی امتحان کنید و قبل از پرداخت، تصمیم بگیرید که آیا این معامله با کار شما مطابقت دارد یا خیر.