Metode Pengumpulan Data: Primer, Sekunder, dan 2026 Alat

Metode Pengumpulan Data: Primer, Sekunder, dan 2026 Alat

Metode pengumpulan data saat ini berada dalam situasi yang aneh. Sisi teoritis bidang ini — data primer versus sekunder, kuantitatif versus kualitatif — tampak hampir sama seperti dua puluh tahun yang lalu. Sisi implementasinya telah dibangun ulang tiga kali dalam lima tahun terakhir. Intelligent Tracking Prevention (ITP) Apple merusak sebagian besar analisis web. Privacy Sandbox Google diam-diam dihentikan pada April 2025 setelah API Topik hanya mencapai 13% dari pemuatan halaman Chrome, dengan cookie pihak ketiga tetap aktif secara default. Scraper AI melahap web publik lebih cepat daripada yang dapat dikendalikan oleh penerbit. Pilihan bagi siapa pun yang menulis tentang ini pada tahun 2026 adalah mengajarkan perangkat yang ada atau mengajarkan perangkat yang berhasil pada tahun 2019. Tulisan ini memilih yang pertama.

Apa sebenarnya metode pengumpulan data itu?

Metode pengumpulan data adalah prosedur untuk mengumpulkan informasi yang ditujukan untuk pertanyaan penelitian tertentu. Dua sumbu mengatur seluruh bidang ini. Yang pertama adalah data primer versus data sekunder. Data primer dikumpulkan langsung untuk pertanyaan Anda sendiri. Data sekunder adalah data yang sudah ada dan Anda gunakan kembali. Sumbu kedua adalah kuantitatif versus kualitatif. Data kuantitatif dapat dihitung dan bersifat statistik: angka, hitungan, peringkat, cap waktu. Data kualitatif bersifat interpretatif: kata-kata, tema, observasi, transkrip. Desain penelitian yang sebenarnya biasanya mencampur keduanya dengan sengaja. Survei dengan peringkat 1-5 ditambah teks bebas "mengapa" adalah instrumen metode campuran yang paling umum digunakan.

Metode pengumpulan data primer yang digunakan pada tahun 2026

Tujuh tipe inti pengumpulan data mencakup hampir semua hal di sisi primer. Setiap metode memiliki kekuatan, profil biaya, dan alat standar tahun 2026. Metode pengambilan sampel (acak, bertingkat, berdasarkan kenyamanan, berkelompok) berada di bawahnya sebagai pilihan desain yang menentukan apakah data yang dikumpulkan dapat digeneralisasikan.

Metode Terbaik untuk Alat umum jangkar 2026
Survei / kuesioner Skala, peringkat, segmentasi Qualtrics, SurveyMonkey, Typeform Dominasi online; mengutamakan perangkat seluler.
Wawancara Kedalaman, motivasi, kasus-kasus khusus Zoom, Microsoft Teams + Otter.ai Alat asinkron semakin populer.
Kelompok fokus Dinamika kelompok, pengujian konsep Recollective, Discuss.io Sekitar $5.000-$9.000 per sesi (Twilio)
Pengamatan Perilaku nyata dalam konteks Catatan lapangan, video, rekaman layar Etnografi masih ada, meskipun kurang populer.
Eksperimen Inferensi kausal Platform pengujian A/B (Optimizely, GrowthBook) Disiplin dalam menolak lebih penting.
Dokumen/catatan Teks organisasi yang sudah ada SharePoint, transkrip dukungan Analisis umum dengan bantuan LLM
Pengumpulan data seluler Studi lapangan, pekerjaan dengan konektivitas rendah SurveyCTO, KoboToolbox Pendekatan offline-first tetap penting.

Survei dan kuesioner masih memegang peranan paling penting. Survei dapat diukur. Survei dapat disegmentasi. Survei adalah satu-satunya cara praktis untuk mengajukan pertanyaan yang sama kepada 10.000 orang. Kuncinya terletak pada desain pertanyaan, bukan platformnya. Kuesioner yang dirumuskan dengan buruk akan menghasilkan gangguan yang tidak dapat diatasi oleh responden mana pun.

Wawancara berada pada sumbu kedalaman. Wawancara terstruktur menggunakan skrip tetap. Wawancara semi-terstruktur menggunakan skrip tetapi memungkinkan tindak lanjut. Wawancara tidak terstruktur tampak seperti percakapan terarah. Dua puluh jam wawancara berkualitas tinggi dapat membentuk strategi produk sama baiknya dengan survei terhadap 1.000 orang. Bukti yang sangat berbeda, keputusan yang sama.

Focus group tetap berguna untuk topik-topik yang didorong oleh kelompok, seperti pengemasan, reaksi merek, dan subjek tabu. Penggunaannya menurun ketika wawancara tatap muka jarak jauh menjadi sangat murah. Seorang moderator yang terampil dalam menjalankan focus group dapat mengungkap kontradiksi yang terlewatkan oleh wawancara tatap muka. Twilio memperkirakan biaya tipikalnya antara $5.000 hingga $9.000 per sesi, itulah sebabnya anggaran riset pasar mengalokasikannya untuk keputusan-keputusan penting.

Observasi adalah apa yang Anda lakukan ketika perilaku yang dilaporkan sendiri ternyata bohong. Dan itu terjadi hampir sepanjang waktu. Observasi partisipan, tradisi etnografi, mahal dan lambat tetapi merupakan satu-satunya cara untuk menangkap apa yang sebenarnya dilakukan orang dalam konteksnya. Observasi non-partisipan lebih murah dan lebih terbatas.

Eksperimen masih menjadi standar emas untuk klaim kausal. Tes A/B pada produk web. Uji coba terkontrol dalam lingkungan klinis. Eksperimen semu di mana penugasan acak tidak mungkin dilakukan. Disiplin yang menggagalkan sebagian besar eksperimen dalam bisnis: ukuran sampel kecil dan mengintip metrik sebelum pengujian berakhir.

Dokumen dan catatan meliputi log internal, transkrip layanan pelanggan, tiket dukungan, dan catatan penjualan. Alur kerja LLM modern membuat analisis teks mentah semacam ini jauh lebih murah daripada lima tahun yang lalu. Tim pengalaman pelanggan kini kembali memperlakukan arsip tiket sebagai sumber pengumpulan utama, setelah bertahun-tahun mengabaikannya.

Pengumpulan data seluler sangat penting dalam penelitian lapangan, pekerjaan LSM, dan survei pasar berkembang di mana konektivitas masih terbatas. SurveyCTO dan KoboToolbox adalah platform yang sudah mapan. Desain yang mengutamakan offline adalah fitur yang tidak dapat ditawar.

Metode Pengumpulan Data

Metode dan sumber pengumpulan data sekunder

Data sekunder adalah separuh bagian lain dari bidang ini. Penggunaan kembali, bukan pengumpulan pertama. Sumber data sekunder mencakup berbagai macam dataset pemerintah terbuka, lembaga statistik, panel sindikasi dari Kantar dan Nielsen, data lake internal, arsip titik penjualan, data sensus, dan web terbuka. Area yang sedang berkembang pesat adalah web scraping. Bright Data dan Apify menjalankan bisnis bernilai miliaran dolar berdasarkan penggunaan yang sah: intelijen harga, pemantauan merek, penelitian akademis. Dan, semakin banyak, korpus pelatihan AI.

Batas hukum juga banyak berubah di sini. Pada Februari 2024, FTC mendenda vendor antivirus Avast sebesar $16,5 juta karena mengumpulkan data penelusuran melalui perangkat keamanannya dan menjualnya kembali melalui anak perusahaan bernama Jumpshot. Regulator yang sama memerintahkan X-Mode dan Outlogic pada Januari 2024 untuk berhenti menjual data lokasi sensitif, sebuah tindakan pertama yang sejenis. Authors Guild dan New York Times sama-sama mengajukan gugatan terhadap OpenAI pada tahun 2023 terkait penggunaan data pelatihan. Kedua kasus tersebut masih aktif hingga tahun 2026. Pengumpulan data sekunder dulunya terasa gratis. Sekarang tidak lagi gratis.

Pengumpulan data kuantitatif vs kualitatif

Pendekatan klasik. Metode kuantitatif menghasilkan angka yang dapat dianalisis secara statistik: survei skala besar, uji A/B, data telemetri, dan catatan transaksi. Metode statistik kemudian menganalisis data menjadi tren, korelasi, dan interval kepercayaan. Metode penelitian kualitatif menghasilkan teks dan makna yang harus diinterpretasikan: wawancara, tanggapan survei terbuka, dan catatan lapangan etnografi. Data yang dikumpulkan dari masing-masing sisi saling melengkapi. Penelitian yang paling bermanfaat menggabungkan keduanya. Skor Net Promoter (NPS) memberikan angka yang mudah dilacak. Teks bebas "mengapa Anda memberikan skor tersebut" yang terlampir memberikan alasan mengapa angka tersebut berubah. Jika Anda menggunakan salah satu saja, Anda akan kehilangan separuh cerita.

Dua aturan praktis. Jika Anda dapat menuliskan kategori jawaban terlebih dahulu dan hanya membutuhkan skala, metode kuantitatif lebih unggul. Jika Anda belum dapat mendeskripsikan apa yang Anda cari — dan ini lebih umum daripada yang diakui orang — metode kualitatif didahulukan. Kemudian, pekerjaan kuantitatif mengukur apa pun yang telah diungkapkan oleh pekerjaan kualitatif.

Bagaimana bisnis mengumpulkan data pada tahun 2026

Business stack adalah tempat pengumpulan data yang sama sekali tidak seperti yang ada di buku teks. Lima lapisan mencakup sebagian besar hal yang dijalankan oleh perusahaan modern.

Lapisan Fungsi Penjual tipikal Jangkar 2025-2026
CRM Catatan pelanggan pihak pertama Salesforce, HubSpot, MS Dynamics 365 Salesforce menguasai sekitar 21% pasar CRM global.
Analisis web/aplikasi Telemetri perilaku GA4, Plausible, Adobe Analytics GA4 universal setelah UA dihentikan (Juli 2023)
Pelacakan sisi server Pengidentifikasi pihak pertama setelah ITP GTM sisi server, RudderStack, Segment Infrastruktur standar setelah Apple ITP
CDP Profil pelanggan terpadu Segmen Twilio, Tealium, mParticle Pasar ~$2 miliar (2024) → ~$7 miliar pada tahun 2028
IoT / telemetri Peristiwa perangkat AWS IoT, Azure IoT Hub ~18,8 miliar perangkat terhubung (akhir 2024)

CRM adalah tempat data pelanggan pihak pertama berada. Salesforce menguasai sekitar seperlima pasar CRM global. HubSpot memimpin segmen UKM. Microsoft Dynamics 365 kuat di kalangan perusahaan yang sudah menggunakan Microsoft 365. CRM juga merupakan tempat data yang diatur cenderung masuk pertama kali, itulah sebabnya penegakan GDPR terus muncul di sana.

Analisis web dan aplikasi beralih secara signifikan ke Google Analytics 4 setelah Universal Analytics dihentikan pada Juli 2023. Tim yang mengutamakan privasi menggunakan Plausible atau Fathom. Data yang lebih sedikit, kemampuan pelaporan yang lebih terbatas. Adobe Analytics masih mendominasi pasar perusahaan.

Pelacakan sisi server adalah pergeseran yang paling kurang dibahas dalam tiga tahun terakhir. ITP Apple dan perlindungan sidik jari tingkat browser sangat merusak cookie sisi klien. Jadi, vendor memindahkan lapisan pelacakan ke balik domain mereka sendiri. Safari dan Firefox juga tidak dapat menghapus ID di sana. Google Tag Manager dan RudderStack sisi server adalah infrastruktur standar yang digunakan.

Platform data pelanggan (CDP) menyatukan catatan dari CRM, web, aplikasi, dan email ke dalam satu profil per pelanggan. Statista memperkirakan pasar CDP mencapai sekitar $2 miliar pada tahun 2024, dan menuju $7 miliar pada tahun 2028. Twilio Segment, Tealium, dan mParticle merupakan pemain utama dalam kategori ini.

IoT dan telemetri adalah lapisan yang paling sering dilewati dan seharusnya tidak. IoT Analytics menghitung sekitar 18,8 miliar perangkat IoT yang terhubung secara global pada akhir tahun 2024. Angka tersebut diproyeksikan mencapai 40 miliar pada tahun 2030. Setiap perangkat tersebut mengumpulkan data tentang sesuatu: penggunaan energi, lokasi, suhu, gerakan, hunian. Undang-Undang Data Uni Eropa, yang berlaku efektif mulai 12 September 2025, memberikan hak portabilitas kepada pengguna atas data yang dihasilkan perangkat tersebut.

Dua kategori yang lebih baru berada di samping kategori yang sudah ada. Data pihak nol , di mana pengguna secara sukarela memberikan preferensi mereka secara langsung melalui pusat preferensi, kuis, dan kolom profil, meningkat pesat setelah Privacy Sandbox gagal. Merek-merek menyadari bahwa masa depan pasca-cookie sebenarnya belum tiba dan bahwa menanyakan kepada orang-orang mungkin lebih sederhana daripada menebak. Korpus pelatihan AI adalah bentuk pengumpulan data skala besar yang paling diperdebatkan saat ini. Pengadilan Tinggi Inggris memutuskan pada 4 November 2025 dalam kasus Getty Images v Stability AI bahwa bobot model AI bukanlah "salinan" berdasarkan Undang-Undang Hak Cipta, Desain, dan Paten. Getty telah mencabut klaim pelanggaran utamanya di tengah persidangan. Pengumpulan data pelatihan AI memenangkan putaran itu, dengan selisih tipis.

Privasi, etika, dan batasan hukum untuk pengumpulan data.

Pada tahun 2026, tiga peraturan hukum penting bagi sebagian besar perusahaan yang menjalankan penagihan. GDPR di Uni Eropa. CCPA dan CPRA di California. Dan FTC di tingkat federal AS, yang sangat mengandalkan peran perlindungan konsumen karena masih belum ada undang-undang privasi federal yang berlaku. Pelacak penegakan hukum CMS Law mengatakan denda GDPR kumulatif telah melewati €5,88 miliar pada akhir tahun 2024. Denda Meta Ireland sebesar €1,2 miliar dari Mei 2023, atas transfer data ilegal dari Uni Eropa ke AS, berada di puncak tumpukan tersebut. Tepat di bawahnya: denda Instagram sebesar €405 juta atas data anak-anak dari tahun 2022.

Penegakan hukum di California menghasilkan denda yang lebih kecil dalam bentuk uang, tetapi lebih cepat dalam hal kecepatan. Regulator di sana memilih kasus-kasus kecil dan menyelesaikannya lebih cepat. Sephora membayar $1,2 juta pada Agustus 2022 karena menjual informasi pribadi tanpa persetujuan. DoorDash menyusul pada Februari 2024 dengan penyelesaian $375.000 atas pelanggaran serupa. Kedua kasus tersebut menunjukkan bahwa "jangan jual informasi pribadi saya" memiliki bobot dalam praktiknya, dan lembaga tersebut lebih fokus pada pelanggaran sehari-hari daripada pelanggaran yang menarik perhatian media.

Di tingkat federal, FTC tetap sibuk sepanjang tahun 2024. Avast membayar $16,5 juta pada bulan Februari karena mengumpulkan data penelusuran melalui produk antivirusnya dan menjualnya kembali melalui anak perusahaan. Pada bulan Januari, X-Mode dan Outlogic sama-sama mendapatkan perintah pertama yang melarang penjualan data lokasi sensitif. Perintah terhadap Drizly dari Oktober 2022 melangkah lebih jauh: perintah tersebut menyebutkan nama kepala eksekutif secara pribadi, menandakan bahwa respons terhadap pelanggaran data kini berada di pundak orang-orang di puncak, bukan hanya perusahaan.

Pengumpulan data pelatihan AI adalah bagian dari semua ini yang masih terus ditulis. The New York Times menggugat OpenAI pada 27 Desember 2023. Authors Guild telah mengajukan gugatan tiga bulan sebelumnya, pada September 2023, dan kedua kasus tersebut masih aktif pada tahun 2026. Kasus Getty v Stability AI kemudian menghasilkan putusan Pengadilan Tinggi Inggris pada 4 November 2025 yang merugikan pemegang hak cipta. Pengadilan memutuskan bahwa bobot model AI bukanlah "salinan" berdasarkan Undang-Undang Hak Cipta, Desain, dan Paten. Getty telah mencabut klaim pelanggaran utamanya di tengah persidangan. Gugatan kelompok LinkedIn yang diajukan pada 21 Januari 2025 secara sukarela dibatalkan sembilan hari kemudian. Klaimnya: pelatihan AI pada pesan InMail pribadi. Buktinya: LinkedIn menunjukkan bahwa data tersebut tidak digunakan untuk melatih model apa pun. Polanya sejauh ini adalah pengumpulan data pelatihan AI sulit untuk diperkarakan, tidak peduli seberapa buruk citranya.

Satu angka yang terus muncul dalam dokumen industri perlu dikoreksi di sini. Kesalahan ini penting ketika pembaca mengutipnya kembali. Penyelesaian COPPA TikTok tahun 2019, terhadap entitas Musical.ly, adalah $5,7 juta. Bukan $5,9 miliar seperti yang masih dicetak dalam beberapa dokumen. Gugatan DOJ dan FTC yang lebih baru yang diajukan pada 2 Agustus 2024 secara terpisah menuntut hingga $51.744 per hari per pelanggaran, dan masih dalam proses hingga tahun 2026.

Saya tidak yakin semua ini akan menjadi lebih sederhana dalam setahun ke depan. Intinya yang pragmatis untuk tahun 2026: setiap alur pengumpulan data baru memerlukan tinjauan privasi sebelum data masuk, bukan setelahnya. Penegakan hukum terhadap praktik curang semakin meningkat di bawah Undang-Undang Layanan Digital Uni Eropa. Banner persetujuan sekarang diaudit berdasarkan panduan EDPB. Dan uji penyusup bermotivasi dari pembaruan Maret 2025 ICO Inggris berlaku untuk apa pun yang diberi label "anonim".

Metode Pengumpulan Data

Memilih metode pengumpulan data yang tepat

Pemilihan metode pengumpulan data adalah langkah paling penting dalam keseluruhan proses penelitian. Pohon keputusannya singkat. Mulailah dengan pertanyaan penelitian, bukan alatnya.

Jika pertanyaannya adalah "berapa banyak," gunakan metode kuantitatif: survei, telemetri, log transaksi. Jika pertanyaannya adalah "mengapa," gunakan metode kualitatif: wawancara atau tanggapan terbuka. Jika pertanyaannya adalah "apa yang terjadi di sini yang belum saya pahami," gunakan metode observasi. Jika Anda membutuhkan kedalaman dan skala, rancang instrumen metode campuran sejak awal. Alokasikan waktu analisis dua kali lipat dari yang Anda perkirakan.

Tiga batasan perlu dipertimbangkan dalam memilih. Pertama, etika dan batasan hukum: di yurisdiksi mana audiens Anda berada, dan aturan persetujuan serta penyimpanan data apa yang berlaku? Kedua, anggaran: kelompok fokus dengan biaya $5.000-$9.000 per sesi bukanlah langkah yang tepat untuk pertanyaan eksploratif yang dapat dijawab dalam dua hari wawancara. Ketiga, jangka waktu: survei dengan jumlah sampel besar (large-N) membutuhkan waktu dua hingga empat minggu untuk penyelesaian yang lancar, sedangkan etnografi membutuhkan waktu berbulan-bulan, dan telemetri bersifat real-time tetapi mengasumsikan instrumentasi sudah ada.

Jadi: taksonomi metode akademis tidak berubah dalam dua puluh tahun. Struktur bisnis yang menjalankan metode tersebut telah ditulis ulang tiga kali dalam lima tahun. Batasan hukum bergeser dua kali dalam delapan belas bulan terakhir. Pilih metode yang sesuai dengan pertanyaan. Kemudian, anggaplah rencana pengumpulan data memerlukan tinjauan privasi sebelum, bukan setelah, data pertama masuk.

Ada pertanyaan?

Metode kuantitatif menghasilkan keluaran yang dapat dihitung: peringkat survei, delta uji A/B, peristiwa telemetri, log transaksi. Metode kualitatif menghasilkan keluaran interpretatif: transkrip wawancara, teks bebas terbuka, catatan lapangan etnografi. Studi metode campuran menjalankan keduanya sekaligus, idealnya pada instrumen yang sama, sehingga jumlah dan alasan di balik jumlah tersebut muncul bersamaan.

Jawaban jujur, meskipun bukan jawaban yang disukai siapa pun, adalah bahwa itu tergantung pada pertanyaannya. Survei tetap paling kuat dalam skala besar. Wawancara memberikan kedalaman. Observasi efektif ketika laporan diri mengandung kebohongan, yang terjadi lebih sering daripada yang diakui sebagian besar tim. Eksperimen menangani pertanyaan kausal. Dan data sekunder adalah pilihan yang murah dan cepat ketika yang sebenarnya Anda butuhkan adalah konteks.

Anda mengumpulkan data primer secara langsung untuk pertanyaan spesifik. Data sekunder sudah ada, dikumpulkan oleh orang lain, awalnya untuk tujuan lain. Survei yang dilakukan tim Anda pada bulan Maret adalah data primer untuk tim tersebut. Lima tahun kemudian, ketika orang lain menemukan kembali berkas tersebut untuk studi yang tidak terkait, data tersebut tersimpan dalam pekerjaan mereka sebagai data sekunder.

Tujuh metode yang sudah umum: survei dan kuesioner, wawancara, kelompok fokus, observasi, eksperimen, tinjauan dokumen, dan analisis data sekunder. Panduan yang berorientasi industri sering kali mengganti data sekunder dengan pelacakan transaksi, atau pemantauan media sosial, tergantung pada apakah audiensnya akademis atau komersial. Ide-ide dasarnya tetap sama; hanya labelnya yang berubah.

Anda akan melihat empat metode: survei, wawancara, observasi, dan analisis dokumen. Banyak buku teks ilmu sosial kemudian menambahkan eksperimen dan melengkapi daftar menjadi lima. Penulis bisnis cenderung meninggalkan analisis dokumen dan lebih memilih pelacakan transaksi. Kedua kubu tersebut bermuara pada bidang yang sama, hanya dengan kosakata yang berbeda.

Di hampir setiap buku teks, kelima nama tersebut muncul dengan cara yang sama: survei, wawancara, observasi, kelompok fokus, dan tinjauan dokumen. Jika ditambah tujuh, biasanya akan muncul eksperimen dan pelacakan transaksi, yang cukup wajar mengingat audiensnya adalah tim produk. Penulis menentukan jumlahnya; perangkat yang digunakan di baliknya hampir tidak berubah.

Ready to Get Started?

Create an account and start accepting payments – no contracts or KYC required. Or, contact us to design a custom package for your business.

Make first step

Always know what you pay

Integrated per-transaction pricing with no hidden fees

Start your integration

Set up Plisio swiftly in just 10 minutes.