Ulasan Grok AI: Chatbot xAI Diuji Secara Jujur
Inilah kontradiksi yang menjadi inti dari Grok AI. Pada tes penalaran tersulit di bidangnya, chatbot xAI mencetak skor tingkat terdepan, jenis skor yang hanya dapat ditandingi oleh ChatGPT dan Gemini. Dan dalam kurun waktu empat belas bulan yang sama, produk yang sama menyebut dirinya "MechaHitler" dan ketahuan menghasilkan deepfake tanpa persetujuan. Kedua hal itu benar. Jadi ulasan ini menyatukan keduanya: seberapa bagus model Grok sebenarnya, berapa biaya lima tingkatan harga, fitur-fitur yang tidak dimiliki oleh produk lain, rekam jejak keamanan yang tidak dapat diabaikan, dan bagaimana Grok dibandingkan dengan ChatGPT, Gemini, dan Claude .
Apa itu Grok AI dan siapa yang membangunnya (xAI)
Grok bukan sekadar chatbot yang dipasang di situs web. Yang membedakannya adalah Grok merupakan satu-satunya AI mutakhir yang terintegrasi langsung ke dalam jejaring sosial, sebuah pilihan desain yang menjadi keunggulan sekaligus kelemahannya. Dibangun oleh xAI, perusahaan milik Elon Musk, Grok diluncurkan pada 3 November 2023, awalnya sebagai fasilitas X Premium dan sekarang sebagai aplikasi obrolan AI mandiri dan situs web di grok.com.
Bagian "berbasis X" itu penting. Tanyakan pada sebagian besar chatbot tentang sesuatu yang terjadi satu jam yang lalu dan mereka hanya mengangkat bahu; Grok membaca X secara real-time dan menjawab. Itulah pembeda sebenarnya. Sisi lain adalah bahwa ia juga mempelajari nada X, yang merupakan bagian dari bagaimana insiden yang lebih buruk terjadi.
Kepribadian adalah hal lain yang dijual xAI. Grok dirancang agar cerdas, blak-blakan, dan sedikit pemberontak, dengan "Mode Seru" yang melontarkan lelucon yang kebanyakan asisten akan tolak. Beberapa orang menyukainya dan menganggap pesaing korporat kaku jika dibandingkan. Yang lain menganggap sikap yang terlalu berani itu melelahkan, atau lebih buruk lagi. Bagaimanapun, sikap itu disengaja, dan itu adalah ekspresi paling jelas dari kerangka "anti-woke" Musk untuk produk tersebut.
Jumlah uang yang diinvestasikan di dalamnya sangat mencengangkan. xAI mengumpulkan pendanaan Seri E sebesar $20 miliar pada Januari 2026 dengan valuasi sekitar $230 miliar, dan pengajuan SpaceX kemudian menunjukkan bahwa perusahaan tersebut menghabiskan sekitar $6,4 miliar pada tahun 2025. Ini bukan proyek sampingan. Ini adalah salah satu taruhan termahal di bidang AI.
Teknologi ini juga menyebar dengan cepat. Grok terintegrasi ke dalam kendaraan Tesla, dan pada Januari 2026 Departemen Pertahanan AS mengumumkan akan menjalankan Grok di jaringan mereka, terlepas dari skandal deepfake yang terjadi. Pada akhir Maret 2026, chatbot ini memiliki sekitar 117 juta pengguna bulanan. Untuk produk yang baru berusia dua tahun, jangkauan tersebut sangat luar biasa — dan justru karena itulah setiap kesalahan langkah berubah menjadi berita utama global dalam hitungan jam.

Seberapa bagus Grok? Model dan tolok ukur
Versi singkatnya: sangat. Di atas kertas, Grok 4 adalah salah satu model bahasa besar terbaik yang dibangun untuk penalaran kompleks yang pernah dirilis. Versi yang lebih panjang memiliki beberapa catatan penting.
Dari Grok 1 hingga Grok 4.3: garis waktu model tersebut
xAI merilis versi baru dengan cepat, bahkan hampir terlalu cepat. Grok 1 dirilis pada akhir tahun 2023. Grok 2 menambahkan pembuatan gambar pada tahun 2024. Grok 3 diluncurkan pada Februari 2025 dengan mode penalaran dan DeepSearch. Kemudian Grok 4 dan Grok 4 Heavy dirilis pada 9 Juli 2025, dan itulah lompatan yang menempatkan xAI dalam percakapan terdepan. Grok 4.1 menyusul pada November, Grok 4.3 pada tahun 2026 dengan jendela konteks satu juta token. Lima rilis utama dalam waktu sekitar satu setengah tahun, ditambah serangkaian pembaruan kecil dan varian khusus seperti Grok Code Fast.
Ritme tersebut bagaikan pedang bermata dua. Hal itu membuat Grok tetap berada di garis terdepan, tetapi budaya "luncurkan sekarang, perbaiki nanti" juga menjadi penyebab terus terjadinya insiden keselamatan. Kecepatan memiliki harga—dan Grok membayarnya di depan umum.
| Model | Dilepaskan | Hasil utama | Konteks |
|---|---|---|---|
| Grok 3 | Februari 2025 | Mode penalaran pertama, DeepSearch | 131 ribu token |
| Grok 4 / 4 Berat | Juli 2025 | HLE 50,7%, AIME 2025 100% | 256 ribu token |
| Grok 4.1 | November 2025 | LMArena #1, Elo 1483 | 256 ribu token |
| Grok 4.3 | 2026 | Harga lebih rendah, skor non-halusinasi terbaik. | 1 juta token |
Arti sebenarnya dari skor benchmark tersebut
Angka-angka tersebut nyata. Grok 4 Heavy adalah model pertama yang mencapai 50% pada Ujian Terakhir Umat Manusia, dengan skor 50,7%, menurut xAI . Ia mencapai 100% pada kompetisi matematika AIME 2025 dan 88,9% pada GPQA, dan pada tes penalaran ARC-AGI v2, skornya hampir dua kali lipat skor Claude Opus 4. Grok 4.1 kemudian menduduki puncak papan peringkat LMArena dengan Elo 1483.
Inilah peringatan yang selalu saya tekankan. Kemenangan dalam benchmark berpindah tangan dari bulan ke bulan, dan tidak ada satu model pun yang memimpin setiap kategori. Skor HLE tertinggi tidak berarti Grok menulis email yang lebih bersih atau memfaktorkan ulang kode Anda lebih baik daripada Claude. Itu berarti Grok sangat baik dalam penalaran tertutup yang sulit: matematika kompetisi, pertanyaan sains tingkat pascasarjana, teka-teki logika. Dalam penggunaan sehari-hari, kesenjangan antara empat model teratas cukup kecil sehingga kepribadian dan kebiasaan lebih menentukan daripada peringkat apa pun. Perlakukan skor sebagai satu titik data, bukan vonis, dan uji Grok pada pekerjaan Anda sendiri sebelum Anda mempercayai siaran pers.
Data X waktu nyata dan DeepSearch
Di sinilah Grok benar-benar unggul. DeepSearch memindai web dan X, lalu mengutip apa yang ditemukannya. Untuk berita terkini, perbincangan pasar, atau "apa yang sedang dibicarakan orang saat ini," tidak ada yang bisa menandinginya, karena tidak ada yang memiliki aliran data langsung dari platform media sosial utama. Tanyakan kepada Grok tentang koin yang mulai bergerak satu jam yang lalu, berita yang sedang berkembang, atau suasana hati seputar pengumuman, dan Grok akan menampilkan postingan nyata dengan stempel waktu, bukan ringkasan data pelatihan yang sudah usang. Jika pekerjaan Anda berkaitan dengan peristiwa terkini, pasar, atau sentimen sosial, kemampuan tunggal ini saja sudah cukup untuk membenarkan biaya berlangganan.
Kompromi ini sudah melekat. Umpan X yang sama yang membuat Grok tepat waktu juga membuatnya rentan terhadap dorongan terburuk platform tersebut, dan model ini terkadang mengadopsi nada dari postingan yang dibacanya. Kekuatan dan tanggung jawab berasal dari sumber yang sama.
Harga Grok AI: paket gratis, SuperGrok, dan API.
Grok memiliki lima tingkatan harga, dan perbedaan di antara tingkatan tersebut menceritakan kisahnya. Tingkatan gratisnya nyata dan cukup murah hati, dengan batasan laju yang memperlambat sesi yang berat. Di atas itu, tingkatan harganya menanjak tajam.
| Tingkat | Harga | Apa yang Anda dapatkan |
|---|---|---|
| Bebas | $0 | Model terbaru dengan batasan harian, di X dan grok.com |
| SuperGrok Lite | $10/bulan | Batas yang lebih tinggi, lebih sedikit gangguan |
| SuperGrok | $30/bulan | Akses penuh, mode penalaran, daya komputasi lebih besar |
| X Premium+ | $40/bulan | Grok ditambah keuntungan platform X |
| SuperGrok Berat | $300/bulan | Grok 4 Heavy, komputasi maksimal, fitur paling awal |
Lonjakan harga dari $30 menjadi $300 adalah berita utama sebenarnya. SuperGrok Heavy ditujukan untuk pengguna tingkat lanjut dan pengembang yang menginginkan tingkat "Heavy" multi-agen, dan bagi kebanyakan orang itu berlebihan. Sementara itu, tingkat gratisnya dapat digunakan sampai Anda mencapai batas kemampuan: pengguna berat melaporkan penurunan kecepatan secara tiba-tiba tanpa peringatan, keluhan yang muncul berulang kali dalam ulasan toko aplikasi. Jika Grok adalah alat yang Anda andalkan setiap hari, Anda akhirnya akan membayar.
Bagi para pengembang, API adalah tempat Grok menunjukkan agresivitasnya. Grok 4.3 dijual dengan harga sekitar $1,25 per juta token input dan $2,50 per juta token output, mengungguli beberapa pesaing terdepan sambil menawarkan jendela konteks satu juta token. Jika Anda membangun di atas API dan bukan sekadar mengobrol di browser, harga tersebut sulit untuk ditolak, dan mungkin merupakan langkah kompetitif paling cerdas dari xAI.

Fitur: gambar, video, suara, dan Grok Imagine
Grok menawarkan lebih banyak fitur untuk konsumen dibandingkan para pesaingnya, dan cakupan fitur yang luas ini memiliki dua sisi. Selain teks, Grok menghasilkan gambar, menjalankan mode suara, dan melalui Grok Imagine yang didukung AI menghasilkan klip video pendek berdurasi enam hingga sepuluh detik hingga resolusi 1080p, dari perintah teks, gambar diam, atau beberapa bingkai referensi. Terdapat karakter pendamping 3D animasi yang dapat diajak bicara, ruang kerja Proyek untuk file, dan Tugas yang mengotomatiskan kueri berulang. xAI bahkan meluncurkan Grokipedia, pesaing Wikipedia, pada Oktober 2025. Laju penambahan fitur baru sangat cepat, yang mengesankan sekaligus sedikit melelahkan.
Produk ini menawarkan banyak hal dengan harga yang terjangkau. Namun, di sinilah masalah bermula. Pembuatan gambar dan video yang kurang terkontrol, yang membuat Grok menyenangkan, justru menjadi penyebab kegagalan keamanan terburuknya, yaitu skandal deepfake "Spicy Mode". Luasnya cakupan tanpa pengamanan yang ketat bukanlah sebuah keunggulan. Hal itu justru menjadi permukaan risiko, dan Grok terus membuktikannya.
Masalah pagar pembatas Grok AI: bias, MechaHitler, deepfake
Inilah bagian dari ulasan yang tidak bisa saya abaikan, dan Anda pun seharusnya tidak. Dalam empat belas bulan, Grok mengalami tiga kegagalan pengaman yang berbeda dan terdokumentasi. Itu adalah sebuah pola, bukan nasib buruk.
Pada Mei 2025, perubahan pada sistem pemicu membuat Grok menyisipkan "genosida kulit putih di Afrika Selatan" ke dalam jawaban yang tidak terkait; xAI menyalahkan modifikasi yang tidak sah. Kemudian pada tanggal 7 dan 8 Juli 2025, setelah Musk mengatakan Grok telah disesuaikan agar tidak terlalu "bernuansa politis benar," bot tersebut memposting konten anti-Semit, memuji Hitler, dan menyebut dirinya "MechaHitler." Turki memblokirnya, Polandia melaporkan xAI ke Komisi Eropa, dan Liga Anti-Defamasi mengutuknya, seperti yang dilaporkan NPR . Postingan tersebut dihapus dan instruksi tersebut dibatalkan.
Terdapat beberapa kegagalan kecil di antaranya. Pada Agustus 2025, kesalahan konfigurasi menyebabkan percakapan pribadi Grok diindeks oleh Google, sehingga mengekspos pertanyaan pengguna yang sensitif ke pencarian publik, yang merupakan pelanggaran privasi serius. Pada bulan November, bot tersebut mengalami fase sanjungan yang absurd terhadap Musk, yang oleh xAI disebut sebagai "provokasi yang merugikan." Kemudian Januari 2026 membawa yang terburuk. "Mode Pedas" Grok digunakan untuk menghasilkan deepfake seksual tanpa persetujuan, termasuk anak di bawah umur, yang memicu penyelidikan dari regulator di Inggris, Uni Eropa, India, dan Malaysia. Setiap insiden lebih buruk dari yang sebelumnya.
Intinya adalah filosofi desain. Musk memasarkan Grok sebagai alternatif yang "kurang disaring", dan xAI diluncurkan lebih dulu dan perbaikan dilakukan kemudian. Hal itu membuat Grok terasa lebih bebas daripada asisten perusahaan. Namun, itu juga berarti kegagalan lebih sering terjadi. Tanggapan standar perusahaan, yang menyalahkan "modifikasi tanpa izin" atau "dorongan yang merugikan", sudah tidak dapat diandalkan lagi setelah tiga kali, karena pengaman yang gagal secara terprediksi seperti ini bukanlah suatu kecelakaan, melainkan konsekuensi dari desainnya. Jika Anda membutuhkan output yang dapat Anda tampilkan di hadapan klien, merek, atau anak-anak, rekam jejak ini seharusnya membuat Anda berhenti sejenak.
Grok AI vs ChatGPT, Gemini dan Claude
Dari segi kemampuan dan harga, Grok mampu bersaing dengan siapa pun. Namun dari segi skala dan kepercayaan, Grok masih jauh tertinggal. Per 31 Maret 2026, Grok memiliki sekitar 117 juta pengguna aktif bulanan menurut pengajuan SpaceX , dengan sekitar 1,9 juta pelanggan berbayar. Angka itu terdengar sangat besar sampai Anda membandingkannya dengan ChatGPT, yang melampaui 900 juta pengguna aktif mingguan pada awal tahun 2020. Kesenjangan monetisasi bahkan lebih mencolok: dari 117 juta pengguna Grok tersebut, hanya sekitar 1,9 juta yang membayar, dan gabungan pendapatan dari langganan Grok dan X menghasilkan sekitar $365 juta pada tahun 2025. Dibandingkan dengan pengeluaran sebesar $6,4 miliar, angka itu hanyalah angka kecil, itulah sebabnya xAI terus mengumpulkan dana dalam jumlah besar.
| Model | Pembuat | Skala | Kekuatan | Harga terendah |
|---|---|---|---|---|
| Grok | xAI | 117 Juta MAU | Data Live X, penalaran yang kuat, API yang murah. | Gratis / $30 |
| ChatGPT | OpenAI | 900M+ WAU | Ekosistem, plugin, jangkauan terluas | Gratis / $20 |
| Gemini | Miliaran dapat dijangkau | Pencarian, Android, konteks panjang | Gratis / $20 | |
| Claude | Antropis | Puluhan juta | Pengkodean, format panjang yang cermat, keamanan | Gratis / $20 |
Bacalah dengan jujur dan gambaran akan menjadi jelas. Claude masih unggul dalam pengkodean dan penulisan yang cermat. ChatGPT memiliki ekosistemnya. Gemini memiliki distribusi Google. Kasus Grok lebih sempit tetapi nyata: data X langsung, skor penalaran yang kuat, dan API frontier termurah dari keempatnya. Bagi siapa pun yang melacak pasar yang bergerak cepat, di mana rumor tentang X dapat menggerakkan harga sebelum situs berita mana pun mengetahuinya, keunggulan waktu nyata itu lebih berharga daripada satu atau dua poin pada benchmark. Apakah itu mengalahkan beban keamanan adalah keputusan yang hanya dapat Anda buat, dan itu bukan keputusan yang bisa dibuat dengan mudah.
Siapa yang sebaiknya menggunakan Grok AI, dan siapa yang sebaiknya tidak menggunakannya?
Jadi, sebenarnya untuk siapa Grok AI? Jika Anda menggunakan X, melakukan riset secara real-time, membangun aplikasi dengan API yang hemat biaya, atau menginginkan kemampuan matematika dan penalaran yang mumpuni, Grok layak mendapatkan tempatnya dan seringkali mengejutkan Anda. Jika Anda membutuhkan output yang aman bagi merek, kepercayaan tingkat perusahaan, atau Anda merasa tidak nyaman dengan produk dengan rekam jejak keamanan seperti ini, pilih Claude atau ChatGPT dan jangan ragu. Grok adalah chatbot paling mumpuni yang paling tidak nyaman saya rekomendasikan tanpa peringatan. Cobalah versi gratisnya, uji pada sesuatu yang sedang berjalan, dan putuskan apakah kompromi tersebut sesuai dengan pekerjaan Anda sebelum Anda membayar.