GEO Ölçümünde Dört Katmanlı Metrik Yığını: Tek Skor Neden Yanıltıcı?

GEO'yu SEO mantığıyla ölçmek yanıltıcı sonuçlar üretiyor. Görünürlük, alıntı kalitesi, referans otoritesi ve dönüşümü ayrı izleyen dört katmanlı bir metrik yığını, "GEO skoru 72" gibi tek rakamlı raporlardan çok daha gerçekçi bir resim sunuyor.

GEO ölçümü tek bir bileşik skora sıkıştırılamaz; görünürlük, alıntı kalitesi, referans otoritesi ve dönüşüm olmak üzere dört bağımsız katmanda izlenmesi gerekiyor. Tek skor yanıltıcı çünkü bir katmandaki iyileşmenin diğerindeki bozulmayı maskelemesine yol açıyor — alıntı sayınız artarken pozisyonunuz ve bağlantı metniniz kötüleşiyor olabilir ve toplam "yükseliyor" görünüyor. Bu yazıda dört katmanlı yığını, her katmanın pratik ölçümünü ve "GEO skoru: 72" gibi tek-rakam yaklaşımının neden eyleme dönüşmeyen bir gürültü ürettiğini anlatıyoruz.

SEO uzmanı mısın? Tüm bu konuları tek bir rehberde, orijinal SOV verisiyle topladık: SEO Uzmanları için GEO →

Geleneksel SEO Metrikleri GEO İçin Neden Yetersiz?

Sıralama pozisyonu, cevabın listelenmediği bir dünyada anlamını yitiriyor. Kullanıcı artık on mavi linki taramıyor; sentezlenmiş bir paragrafı okuyor. Bu paragrafın altında üç-beş alıntı kartı görüyor.

Bunun sonucu üç yönlü:

Gösterimler görünmez hale geliyor. Sayfanız bir cevabın kaynağı olarak kullanılmış olabilir; ancak kullanıcı sayfanızı ne gördü ne de fark etti.
CTR çöküyor. Üst-huni soruları motorun kendisi cevaplıyor. "X nedir?" türü sorularda tıklama oranı %20'lerden %2'ye iniyor.
Yeni bir kelime dağarcığına ihtiyaç var. Sıralama yerine "alıntı varlığı", tıklama yerine "cevap içi pay" gibi kavramlar gerekiyor.

Princeton'dan çıkan ilk akademik çalışmalardan biri bu farkı netleştiriyor: jeneratif motorlar için "öznel izlenim" ve "pozisyon-ayarlı kelime sayısı" gibi yeni metrikler öneriliyor; bunlar klasik sıralama-temelli SEO metriklerinden farklı yapılarda (GEO: Generative Engine Optimization, Aggarwal et al., 2024).

Dört Katmanlı GEO Metrik Yığını

Önerimiz, GEO performansını tek bir skora sıkıştırmak yerine dört bağımsız katmanda izlemek.

Tier 1 — Görünürlük

Sayfanız hiç alıntılanıyor mu? Bu en temel soru. Ölçüm: belirli bir sorgu seti karşısında alıntı sayısı ve cevap varlık oranı. 100 sorguluk bir banka kuruyorsanız, kaçında adınız geçiyor?

Tier 2 — Alıntı Kalitesi

Alıntılandınız diyelim. Hangi pozisyonda? İlk üçte mi, on ikinci sırada mı? Bağlantı metni neyin üzerinden geçiyor — markanız mı, jenerik bir cümle mi? Pasaj uzunluğu kaç kelime? Perplexity'nin numaralandırılmış alıntıları ve Perplexity'nin kendi açıklamasına göre alıntı sırası modelin bağıntı sıralamasını yansıtıyor — yani 1 numaralı alıntı, 5 numaralıdan çok daha güçlü bir sinyal.

Tier 3 — Referans Otoritesi

Motor sizden bahsederken nasıl bahsediyor? "Lider GEO platformu" mu, "küçük bir Türk girişimi" mi, "kapanmış bir şirket" mi? Burada iki ayrı ölçüm yapılıyor: tanım doğruluğu (söylenenler gerçek mi?) ve tanım tonu (olumlu / nötr / olumsuz).

Tier 4 — Dönüşüm

AI motorlarından gelen referral trafiği, markalı sorgu artışı, asistanlı dönüşümler. SimilarWeb verileri 2024 boyunca ChatGPT'nin yayıncılara yolladığı trafiğin ölçülebilir biçimde büyüdüğünü gösteriyor — yani GA4 üzerinde artık takip edilebilir bir kaynak.

Her katmanın kendi temel çizgisi ve birimi var. Bunları toplayıp ortalama almak — "GEO skoru: 72" — bilgi yerine gürültü üretiyor.

Her Katmanı Pratikte Nasıl Ölçeriz?

Görünürlük için sorgu bankası örneği (proje yönetimi SaaS nişi için 8 sorgu):

"küçük ekipler için en iyi proje yönetimi yazılımı"
"Trello alternatifi nedir"
"Türkçe destekli proje yönetim aracı"
"uzaktan çalışan ekipler için görev takip sistemi"
"Asana mı Jira mı"
"ücretsiz proje yönetim yazılımları"
"scrum board uygulaması öner"
"KOBİ için iş takip yazılımı"

Bu sorguları ChatGPT, Perplexity, Gemini ve Claude üzerinde haftalık çalıştırın; her motor için ayrı tablo tutun.

Alıntı kalitesi için Perplexity ve Google AI Overviews HTML'inden alıntı kartlarını parse edin. Google'ın kendi dokümantasyonuna göre AI Overviews'un sıralama sinyalleri standart organik sıralamadan farklı bir karışıma dayanıyor — yani bir sayfa AI Overviews'ta alıntılanırken organikte ilk sayfada bile olmayabilir. Bu da pozisyon ölçümünün katman 1 ve 2'de neden ayrıştığını açıklıyor.

Referans otoritesi için sade bir test yeterli: "X markası nedir?" sorusunu motora sorun. Cevabı üç eksende puanlayın:

Doğruluk: kaç olgu doğru, kaç olgu yanlış?
Ton: olumlu / nötr / olumsuz?
Tamlık: temel mesajınız geçiyor mu?

Bir markanın aylık "tanım doğruluk skoru" %80'den %62'ye düşüyorsa, bu bir uyarı.

Dönüşüm için GA4'te referrer segmentasyonu: chat.openai.com, perplexity.ai, gemini.google.com, claude.ai. Her birini ayrı kanal olarak işaretleyip dönüşüm yollarını ölçün. Google AI Overviews ise cevapların yanında inline alıntı linkleri sunuyor ve bu linkler google.com referrer'ı ile geliyor — normal organik trafikten ayırt etmek için UTM veya sayfa-bazlı analiz gerekiyor.

Sorgu banka boyutu için pratik tavsiye: kategori başına 50-200 sorgu. Daha az olursa varyans çok yüksek, daha fazlası ise getiriden çok maliyet üretiyor.

Temel Çizgi ve Karşılaştırma

"GEO skorumuz 72" cümlesi, 30 günlük temel çizgi ve 3-5 rakip karşılaştırması olmadan anlamsız. Üç kural:

30 günlük hareketli temel çizgi kurulmadan iyileşme iddia edilmesin.
Sektör ortalaması yerine isimli rakip karşılaştırması yapılsın. "Sektör ortalamasının üstündeyiz" pazarlama sloganı; "Asana ve ClickUp'a göre alıntı payımız %18 daha düşük" eyleme geçirilebilir bilgi.
Varyans takibi kritik. AI motorlarının günden güne dalgalanması yüksek; tek ölçüm güvenilir değil. En az dört haftalık ortalamaya bakın.

Yaygın Yorumlama Hataları

Tek motor verisini evrenselleştirmek. Perplexity'de güçlüsünüz, Gemini'da yoksunuz — bu iki ayrı strateji demek, tek bir GEO skoru değil.

Düşük kaliteli alıntıyı yüksek kaliteliyle eşit saymak. 12. sırada, jenerik bağlantı metniyle, kısa pasajla yapılan alıntı ile ilk sırada, marka bağlantı metniyle, uzun pasajla yapılan alıntı — toplam sayıda 1+1=2'dir; sinyal değeri olarak değil.

Tanım kayması (descriptor drift) göz ardı etmek. Alıntılanıyorsunuz ama yanlış tanımlanıyorsunuz — bu kazanç değil, risk. Önce tanımı düzeltin, sonra alıntı sayısını büyütün.

Monotonik iyileşme beklemek. Motorlar yeniden indeksliyor, sıralamalar resetleniyor. "Geçen ay 18 alıntımız vardı, bu ay 14, demek ki başarısızlık" — yanlış. Üç haftalık hareketli ortalamaya bakın.

Vaka örneği: bir SaaS müşterimizin bileşik GEO skoru 64'ten 71'e çıktı. Sebep: Tier 1 (görünürlük) %22 arttı. Aynı dönemde Tier 2 (alıntı kalitesi) %14 düştü — daha düşük pozisyonlardan, jenerik bağlantı metniyle alıntılanıyorlardı. Tek skor "iyileşme" diyordu; katman ayrımı "yapısal bozulma başlıyor" diyordu.

GEO Ölçüm Panosu Kurmak

İyi bir pano şu bileşenleri ayrı tutuyor:

Haftalık otomatik sorgu çalıştırması (kategori başına en az 50 sorgu, her hedef motor için).
Katman-bazlı görünüm: dört ayrı panel, asla tek bileşik skor. Örnek özet satırı: Görünürlük: 18 alıntı · Ortalama pozisyon: 4.2 · Cevap varlık oranı: %62 · Tanım tonu: nötr.
Trend grafikleri güven aralığıyla — nokta tahminleri yerine gölge bantlar.
Uyarı eşikleri: alıntı sayısında bir hafta içinde %30 üzeri düşüş, tanım tonunda nötrden olumsuza geçiş, yeni motor entegrasyonu.

Bu altyapıyı manuel kurmak hem maliyetli hem hata payı yüksek. GEON ölçüm platformu bu dört katmanı haftalık döngüde otomatik izliyor; ölçüm sıklığı ve sorgu hacmine göre fiyat planları farklılaşıyor.

GEO ölçümü erken dönemde. Standartlar henüz oturmadı. Ancak bir şey net: SEO mantığını AI arama dünyasına taşımak, yanlış soruyu daha hassas yanıtlamak demek. Doğru soru "kaç alıntı?" değil, "hangi katmanda nasıl alıntı?" olmalı.