Veri Toplama Yöntemleri: Birincil, İkincil ve 2026 Araçlar
Veri toplama yöntemleri şu anda garip bir durumda. Alanın ders kitabı tarafı – birincil ve ikincil, nicel ve nitel – yirmi yıl öncekiyle aşağı yukarı aynı görünüyor. Uygulama tarafı ise son beş yılda üç kez yeniden inşa edildi. Apple'ın Akıllı İzleme Önleme özelliği, web analitiğinin önemli bir bölümünü bozdu. Google'ın Gizlilik Koruması, Konular API'si Chrome sayfa yüklemelerinin yalnızca %13'üne ulaştığında Nisan 2025'te sessizce kullanımdan kaldırıldı ve üçüncü taraf çerezleri varsayılan olarak açık kaldı. Yapay zeka veri toplayıcıları, yayıncıların onları kontrol altına almasından daha hızlı bir şekilde kamuya açık web'i taradı. 2026'da bu konuda yazan herkesin seçeneği, ya mevcut araç setini öğretmek ya da 2019'da işe yarayanı öğretmektir. Bu yazı ilkini seçiyor.
Veri toplama yöntemleri aslında nelerdir?
Veri toplama yöntemi, belirli bir araştırma sorusuna yönelik bilgi toplama prosedürüdür. Bu alanın tamamını iki eksen düzenler. Birincisi birincil ve ikincil verilerdir. Birincil veriler, kendi sorunuz için doğrudan toplanan verilerdir. İkincil veriler ise zaten var olan ve yeniden kullandığınız verilerdir. İkinci eksen ise nicel ve nitel verilerdir. Nicel veriler sayılabilir ve istatistikseldir: sayılar, sayımlar, derecelendirmeler, zaman damgaları. Nitel veriler ise yorumlayıcıdır: kelimeler, temalar, gözlemler, transkriptler. Gerçek araştırma tasarımları genellikle bu ikisini kasıtlı olarak karıştırır. 1-5 arası bir derecelendirme ve serbest metin "neden" sorusu içeren bir anket, en yaygın karma yöntemli araçtır.
2026 yılında kullanılan birincil veri toplama yöntemleri
Yedi temel veri toplama türü, birincil taraftaki hemen hemen her şeyi kapsar. Her yöntemin bir gücü, bir maliyet profili ve 2026 için varsayılan bir aracı vardır. Örnekleme yöntemleri (rastgele, tabakalı, kolaylık, kümelenmiş), toplanan verilerin genelleştirilebilir olup olmadığını belirleyen tasarım seçeneği olarak bunların altında yer alır.
| Yöntem | En iyisi | Tipik araç | 2026 çapası |
|---|---|---|---|
| Anketler / soru formları | Ölçek, derecelendirmeler, segmentasyon | Qualtrics, SurveyMonkey, Typeform | Çevrimiçi ortam hakim; mobil öncelikli. |
| Röportajlar | Derinlik, motivasyon, uç durumlar | Zoom, Microsoft Teams + Otter.ai | Asenkron araçlar yükselişte |
| Odak grupları | Grup dinamikleri, kavram testi | Recollective, Discuss.io | Seans başına yaklaşık 5.000-9.000 dolar (Twilio) |
| Gözlem | Bağlam içinde gerçek davranış | Saha notları, video, ekran kaydı | Etnografi varlığını sürdürüyor, popülerliği azalıyor. |
| Deneyler | Nedensel çıkarım | A/B test platformları (Optimizely, GrowthBook) | Direniş disiplini daha önemlidir. |
| Belgeler / kayıtlar | Mevcut kurumsal metin | Sharepoint, transkriptleri destekleyin | LLM destekli analiz yaygın |
| Mobil veri toplama | Alan çalışmaları, düşük bağlantılı çalışmalar | SurveyCTO, KoboToolbox | Çevrimdışı öncelikli yaklaşım hala çok önemlidir. |
Anketler ve soru formları hâlâ en büyük işi yapıyor. Ölçeklenebilirler. Segmentasyon sağlarlar. 10.000 kişiye aynı soruyu sormanın tek pratik yolu bunlar. İşin püf noktası platform değil, soru tasarımıdır. Kötü formüle edilmiş bir anket, hiçbir katılımcının kurtaramayacağı bir gürültü üretir.
Görüşmeler derinlik ekseninde yer alır. Yapılandırılmış görüşmeler sabit bir senaryo kullanır. Yarı yapılandırılmış görüşmeler bir senaryo kullanır ancak takip sorularına izin verir. Yapılandırılmamış görüşmeler ise yönlendirilmiş bir sohbete benzer. Yirmi saatlik yüksek kaliteli görüşmeler, 1000 kişilik bir anket kadar ürün stratejisini şekillendirebilir. Çok farklı kanıtlar, aynı karar.
Odak grupları, ambalajlama, marka tepkileri ve tabu konular gibi grup odaklı konular için hâlâ faydalıdır. Uzaktan görüşmelerin bire bir görüşmeleri çok ucuz hale getirmesiyle kullanımları azaldı. Odak grubunu yöneten yetenekli bir moderatör, bire bir görüşmenin gözden kaçırdığı çelişkileri ortaya çıkarabilir. Twilio, tipik maliyetin oturum başına 5.000 ila 9.000 dolar arasında olduğunu belirtiyor; bu nedenle pazar araştırması bütçeleri bunları yüksek riskli kararlar için ayırıyor.
Gözlem, kişinin kendi beyanına dayalı davranışlarının yalan olduğu durumlarda yapılan şeydir. Bu da çoğu zaman böyledir. Katılımcı gözlem, etnografik gelenek, pahalı ve yavaştır ancak insanların bağlam içinde gerçekte ne yaptıklarını yakalamanın tek yoludur. Katılımcı olmayan gözlem daha ucuzdur ancak daha sınırlıdır.
Deneyler, nedensellik iddiaları için hala altın standarttır. Bir web ürününde A/B testleri. Klinik ortamda kontrollü denemeler. Rastgele atamanın imkansız olduğu yarı deneysel çalışmalar. İş dünyasında çoğu deneyi bozan disiplin: küçük örneklem boyutu ve test bitmeden önce ölçüme bakmak.
Belgeler ve kayıtlar arasında dahili kayıtlar, müşteri hizmetleri kayıtları, destek talepleri ve satış notları yer almaktadır. Modern LLM iş akışları, bu tür ham metinlerin analizini beş yıl öncesine göre çok daha ucuz hale getiriyor. Müşteri deneyimi ekipleri, yıllarca göz ardı ettikten sonra, artık destek talebi arşivlerini birincil veri toplama kaynağı olarak yeniden ele alıyor.
Bağlantının yetersiz olduğu saha araştırmalarında, STK çalışmalarında ve gelişmekte olan pazar araştırmalarında mobil veri toplama büyük önem taşır. SurveyCTO ve KoboToolbox, bu alanda kendini kanıtlamış platformlardır. Çevrimdışı öncelikli tasarım, vazgeçilmez bir özelliktir.
İkincil veri toplama yöntemleri ve kaynakları
İkincil veriler, alanın diğer yarısını oluşturuyor. İlk toplama değil, yeniden kullanım. İkincil verilerin kaynakları arasında açık devlet veri kümeleri, istatistik kurumları, Kantar ve Nielsen'den derlenmiş paneller, dahili veri havuzları, satış noktası arşivleri, nüfus sayımı verileri ve açık web yer alıyor. Patlama yaşanan alan ise web kazıma (web scraping) alanında. Bright Data ve Apify, fiyat istihbaratı, marka izleme, akademik araştırma gibi meşru kullanımlar üzerinde milyarlarca dolarlık işletmeler yürütüyor. Ve giderek artan bir şekilde, yapay zeka eğitim veri kümeleri de bu alanda kullanılıyor.
Hukuki zemin de en çok burada değişti. Şubat 2024'te FTC, antivirüs yazılımı üreticisi Avast'ı, güvenlik araçları aracılığıyla tarama verilerini topladığı ve Jumpshot adlı bir yan kuruluşu aracılığıyla yeniden sattığı için 16,5 milyon dolar para cezasına çarptırdı. Aynı düzenleyici kurum, Ocak 2024'te X-Mode ve Outlogic'e hassas konum verilerini satmayı durdurmalarını emretti; bu, türünün ilk örneğiydi. Yazarlar Birliği ve New York Times, 2023'te eğitim verisi kullanımı nedeniyle OpenAI'ye karşı dava açtı. Her iki dava da 2026'da hala devam ediyor. İkincil veri toplama eskiden ücretsizdi. Artık ücretsiz değil.
Nicel ve nitel veri toplama
Klasik yaklaşım. Nicel yöntemler, üzerinde istatistiksel analizler yapabileceğiniz sayılar üretir: geniş ölçekli anketler, A/B testleri, telemetri olayları, işlem kayıtları. İstatistiksel yöntemler daha sonra verileri eğilimlere, korelasyonlara ve güven aralıklarına göre analiz eder. Nitel araştırma yöntemleri ise yorumlamanız gereken metin ve anlam üretir: görüşmeler, açık uçlu anket yanıtları, etnografik saha notları. Her iki taraftan toplanan veriler birbirini tamamlar. En faydalı araştırmalar ikisini bir araya getirir. Net Promoter Score (NPS), takip edilmesi kolay bir sayı verir. Buna eklenen "neden bu puanı verdiniz?" serbest metin sorusu, sayının neden değiştiğini gösterir. Bunlardan herhangi birini tek başına kullanırsanız, hikayenin yarısını kaçırırsınız.
İki pratik kural. Cevap kategorilerini önceden yazabiliyorsanız ve sadece ölçeğe ihtiyacınız varsa, nicel yöntem önceliklidir. Henüz ne aradığınızı tanımlayamıyorsanız -ki bu insanların kabul ettiğinden daha yaygındır- nitel yöntem önceliklidir. Ardından nicel çalışma, nitel çalışmanın ortaya çıkardığı şeyleri ölçer.
İşletmeler 2026'da nasıl veri toplayacak?
İş süreçlerinde veri toplama, ders kitaplarında anlatılanlardan çok farklı bir şekilde gerçekleşir. Beş katman, modern bir şirketin işleyişinin büyük bir bölümünü kapsar.
| Katman | İşlev | Tipik satıcı | 2025-2026 çapası |
|---|---|---|---|
| CRM | Birinci taraf müşteri kayıtları | Salesforce, HubSpot, MS Dynamics 365 | Salesforce, küresel CRM pazarının yaklaşık %21'ini oluşturuyor. |
| Web/uygulama analizi | Davranışsal telemetri | GA4, Plausible, Adobe Analytics | GA4, UA'nın faaliyetlerinin durdurulmasının ardından (Temmuz 2023) evrensel hale gelecek. |
| Sunucu tarafı izleme | ITP sonrası birinci taraf tanımlayıcıları | Sunucu Tarafı GTM, RudderStack, Segment | Apple ITP sonrası varsayılan altyapı |
| CDP | Birleşik müşteri profili | Twilio Segment, Tealium, mParticle | Pazar ~2 Milyar Dolar (2024) → 2028'e kadar ~7 Milyar Dolar |
| Nesnelerin İnterneti / Telemetri | Cihaz olayları | AWS IoT, Azure IoT Hub | ~18,8 milyar bağlı cihaz (2024 sonu) |
CRM, birinci elden müşteri verilerinin bulunduğu yerdir. Salesforce, küresel CRM pazarının yaklaşık beşte birine sahip. HubSpot, KOBİ segmentinde lider konumda. Microsoft Dynamics 365, halihazırda Microsoft 365 satın alan büyük işletmelerde güçlü bir konumda. Düzenlemeye tabi verilerin de ilk olarak CRM'de yer alması, GDPR uygulamalarının burada sık sık gündeme gelmesinin nedenidir.
Universal Analytics'in Temmuz 2023'te kapatılmasının ardından web ve uygulama analitiği kesin olarak Google Analytics 4'e kaydı. Gizliliğe önem veren ekipler Plausible veya Fathom kullanıyor. Daha az veri, daha az raporlama gücü anlamına geliyor. Adobe Analytics hala kurumsal alanda lider konumda.
Sunucu tarafı izleme, son üç yılın en az tartışılan değişimi oldu. Apple'ın ITP'si ve tarayıcı düzeyindeki parmak izi koruması, istemci tarafı çerezlerini ciddi şekilde bozdu. Bu nedenle satıcılar izleme katmanını kendi alan adlarının arkasına taşıdı. Safari ve Firefox da artık kimlikleri oradan kaldıramıyor. Sunucu tarafı Google Tag Manager ve RudderStack varsayılan altyapıyı oluşturuyor.
Müşteri veri platformları , CRM, web, uygulama ve e-posta verilerini her müşteri için tek bir profilde birleştirir. Statista'ya göre, CDP pazarı 2024'te yaklaşık 2 milyar dolar, 2028'de ise 7 milyar dolara ulaşacak. Twilio Segment, Tealium ve mParticle bu kategorinin önde gelen şirketleridir.
Nesnelerin İnterneti (IoT) ve telemetri , çoğu makalenin atladığı ve atlamaması gereken bir katmandır. IoT Analytics, 2024 yılının sonunda dünya genelinde yaklaşık 18,8 milyar bağlı IoT cihazı saydı. Bu sayının 2030 yılına kadar 40 milyara ulaşması bekleniyor. Bunların her biri bir şeyler hakkında veri topluyor: enerji kullanımı, konum, sıcaklık, hareket, doluluk oranı. 12 Eylül 2025'te yürürlüğe giren AB Veri Yasası, kullanıcılara bu cihazların ürettiği veriler üzerinde taşınabilirlik hakları veriyor.
Yığının yanında iki yeni kategori daha yer alıyor. Kullanıcıların tercihlerini doğrudan tercih merkezleri, testler ve profil alanları aracılığıyla gönüllü olarak belirttiği sıfır taraf verileri , Privacy Sandbox'ın başarısız olmasının ardından yükselişe geçti. Markalar, çerez sonrası geleceğin aslında henüz gelmediğini ve insanlara sormanın tahmin etmekten daha kolay olabileceğini fark etti. Yapay zeka eğitim veri kümeleri şu anda büyük ölçekli veri toplamanın en tartışmalı biçimi. İngiltere Yüksek Mahkemesi, 4 Kasım 2025'te Getty Images v Stability AI davasında, yapay zeka model ağırlıklarının Telif Hakkı, Tasarım ve Patent Yasası kapsamında "kopya" olmadığına karar verdi. Getty, davanın ortasında ana ihlal iddialarından zaten vazgeçmişti. Yapay zeka eğitim veri kümeleri bu turu az farkla kazandı.
Gizlilik, etik ve veri toplama için yasal zemin
2026 yılına gelindiğinde, veri toplama işlemlerini yürüten çoğu şirket için üç yasal zemin önem kazanacak. AB'de GDPR, Kaliforniya'da CCPA ve CPRA ve ABD federal düzeyinde, henüz yürürlükte olan bir federal gizlilik yasası olmadığı için tüketiciyi koruma rolüne büyük önem veren FTC. CMS Law'ın yaptırım takip verilerine göre, 2024 yılı sonuna kadar toplam GDPR cezaları 5,88 milyar avroyu aştı. Mayıs 2023'te AB'den ABD'ye yasa dışı veri transferleri nedeniyle kesilen Meta Ireland'ın 1,2 milyar avroluk cezası bu listenin en başında yer alıyor. Hemen altında ise 2022'de çocuk verileriyle ilgili olarak Instagram'ın kestiği 405 milyon avroluk ceza bulunuyor.
Kaliforniya'daki yaptırımlar parasal olarak daha az olsa da, uygulama hızı daha yüksek. Oradaki düzenleyici kurum daha küçük vakaları seçiyor ve daha hızlı çözüyor. Sephora, Ağustos 2022'de kişisel bilgileri onay alınmadan sattığı için 1,2 milyon dolar ödedi. DoorDash ise Şubat 2024'te aynı türden bir ihlal nedeniyle 375.000 dolarlık bir uzlaşmaya vardı. Her iki vaka da "kişisel bilgilerimi satmayın" uyarısının pratikte etkili olduğunu ve kurumun manşetlere taşınan olaylardan ziyade günlük ihlallere odaklandığını gösteriyor.
Federal düzeyde ise, FTC 2024 yılı boyunca yoğun bir şekilde çalışmaya devam etti. Avast, Şubat ayında antivirüs ürünü aracılığıyla tarama verilerini topladığı ve bir yan kuruluşu üzerinden yeniden sattığı için 16,5 milyon dolar ödedi. Ocak ayında ise X-Mode ve Outlogic, hassas konum verilerinin satışını yasaklayan, türünün ilk örneği olan kararlar aldı. Ekim 2022'deki Drizly kararı ise daha da ileri gitti: Genel müdürü şahsen hedef alarak, veri ihlaline yanıt verme sorumluluğunun artık sadece şirkete değil, en üst düzeydeki kişilere de ait olduğunu gösterdi.
Yapay zeka eğitim verilerinin toplanması, henüz yazılmakta olan tüm bu sürecin bir köşesini oluşturuyor. New York Times, 27 Aralık 2023'te OpenAI'ye dava açtı. Yazarlar Birliği ise üç ay önce, Eylül 2023'te dava açmıştı ve her iki dava da 2026'da hala devam ediyordu. Ardından Getty v Stability AI davası, 4 Kasım 2025'te hak sahibinin aleyhine sonuçlanan bir İngiltere Yüksek Mahkemesi kararı verdi. Mahkeme, yapay zeka model ağırlıklarının Telif Hakkı, Tasarım ve Patent Yasası kapsamında "kopya" olmadığını tespit etti. Getty, ana ihlal iddialarını davanın ortasında geri çekmişti. 21 Ocak 2025'te açılan bir LinkedIn toplu davası, dokuz gün sonra gönüllü olarak geri çekildi. İddia: Özel InMail mesajlarında yapay zeka eğitimi. Kanıt: LinkedIn, verilerin herhangi bir modeli eğitmek için kullanılmadığını gösterdi. Şimdiye kadarki eğilim, yapay zeka eğitim verilerinin toplanmasının, görünüm ne kadar kötü olursa olsun, dava konusu edilmesinin zor olduğudur.
Sektör sunumlarında sürekli karşımıza çıkan bir rakamı düzeltmek gerekiyor. Okuyucular bu rakamı tekrar gündeme getirdiğinde hata önem kazanıyor. TikTok'un Musical.ly şirketine karşı 2019 yılında yaptığı COPPA anlaşması 5,7 milyon dolardı. Bazı sunumlarda hala belirtilen 5,9 milyar dolar değil. 2 Ağustos 2024'te ayrı olarak açılan daha yeni Adalet Bakanlığı ve Federal Ticaret Komisyonu şikayeti, ihlal başına günlük 51.744 dolara kadar tazminat talep ediyor ve bu dava 2026 yılında hala devam ediyor.
Önümüzdeki yıl bunların hiçbirinin daha basit hale geleceğinden emin değilim. 2026 için pratik özet şu: Herhangi bir yeni veri toplama hattı, veriler sisteme girmeden önce, sonrasında değil, gizlilik incelemesinden geçmelidir. AB Dijital Hizmetler Yasası kapsamında karanlık desen uygulamaları giderek artıyor. Onay banner'ları artık EDPB kılavuzuna göre denetleniyor. Ve İngiltere Bilgi Komiserliği'nin Mart 2025 güncellemesindeki "motivasyonlu izinsiz giriş" testi, "anonimleştirilmiş" olarak etiketlenen her şey için geçerli olacak.
Doğru veri toplama yöntemini seçmek
Veri toplama yönteminin seçimi, tüm araştırma sürecindeki en önemli adımdır. Karar ağacı kısadır. Araştırma sorusuyla başlayın, araçla değil.
Eğer soru "kaç tane" ise, nicel yöntemlere yönelin: anket, telemetri, işlem kayıtları. Eğer soru "neden" ise, nitel yöntemlere yönelin: görüşmeler veya açık uçlu yanıtlar. Eğer soru "burada henüz anlamadığım ne oluyor" ise, gözlemsel yöntemlere yönelin. Hem derinlik hem de ölçek gerekiyorsa, önceden karma yöntemli bir araç tasarlayın. İhtiyaç duyacağınızı düşündüğünüz analiz süresinin iki katını ayırın.
Seçimi kontrol eden üç kısıtlama vardır. Etik ve yasal taban: Hedef kitleniz hangi yargı yetki alanlarında bulunuyor ve hangi onay ve veri saklama kuralları geçerli? Bütçe: Oturum başına 5.000-9.000 dolarlık odak grupları, iki günlük görüşmelerle yanıtlanabilecek keşifsel bir soru için doğru bir seçim değildir. Zaman ufku: Büyük örneklemli anketler sorunsuz bir şekilde iki ila dört hafta sürerken, etnografi aylar sürer, telemetri gerçek zamanlıdır ancak enstrümantasyonun zaten mevcut olduğunu varsayar.
Yani: akademik yöntem sınıflandırması yirmi yıldır değişmedi. Bu yöntemleri çalıştıran iş yığını beş yılda üç kez yeniden yazıldı. Hukuki zemin son on sekiz ayda iki kez değişti. Soru için yöntemi seçin. Ardından, veri toplama planının ilk kayıt gelmeden önce, değil sonra, gizlilik incelemesine ihtiyaç duyduğunu varsayın.

