Hızlı Cevap
Büyük sitelerde önce denetlenmesi gereken URL’ler; iş değeri yüksek, indeks sorunu taşıyan ve crawl bütçesini tüketen segmentlerdir. En doğru yöntem, URL’leri şablon bazında gruplayıp organik trafik, dönüşüm, sitemap durumu, indeks sinyali, internal link derinliği ve log verisini tek öncelik skoru içinde çaprazlamaktır.
Önemli Noktalar
- Ham URL listesi yerine segment bazlı önceliklendirme daha doğru karar üretir.
- İş etkisi, indekslenebilirlik ve crawl talebi birlikte skorlanmalıdır.
- Crawl Stats, log ve sitemap verisi aynı tabloda okunmalıdır.
- Faceted URL kümeleri çoğu zaman en büyük crawl israfını üretir.
- Düzeltme sonrası ölçüm, en az 30-60 günlük döngüyle yapılmalıdır.
Bulk URL denetimi: büyük sitelerde neden ham liste yetmez?
Binlerce URL’li yapılarda asıl sorun, elinizde az veri olması değil, fazla ve bağlamsız veri olmasıdır. Bir crawl export dosyası size 8 bin kırık link, 14 bin canonical uyarısı ve 22 bin zayıf başlık gösterebilir; ama hangisinin bu çeyrekte gelir, görünürlük veya indeks verimi üzerinde etkisi olduğunu söylemez. 2026’da büyük site denetimi yaparken soru artık “ne bozuk?” değil, “ilk hangi segment düzeltilirse en hızlı etki alınır?” olmalı.
Google’ın 19 Aralık 2025’te güncellediği crawl budget rehberine göre crawl budget, crawl capacity limit ile crawl demand birleşiminden oluşur. Yani Google hem sunucunuzun kaldırabildiği kadarını hem de gerçekten taramaya değer gördüğü URL’leri dikkate alır. Bu yüzden düşük değerli, yinelenen veya parametreli URL’ler sadece gürültü üretmez; önemli sayfaların keşfini de yavaşlatabilir. Kavramı ekip içinde netleştirmek için sözlükte crawl budget terimi iyi bir referans olur.
Pratikte ham listeyi üç kovaya ayırmak işleri hızlandırır: gelir getiren sayfalar, crawl waste üreten sayfalar ve kurtarılabilir keşif fırsatları. Gelir getiren sayfalarda indeks veya redirect problemi varsa ilk sıraya çıkar. Crawl waste grubunda filtre, parametre, boş sonuç ve yinelenen arşivler yer alır. Kurtarılabilir keşif tarafında ise sitemap’te bulunan ama zayıf iç link nedeniyle geç keşfedilen ya da "Discovered – currently not indexed" durumunda bekleyen kümeler öne çıkar.
- Gelir getiren sayfalar: Ürün, kategori, yüksek trafik alan içerik, lead üreten landing page.
- Crawl waste: Parametreli URL’ler, redirect zincirleri, soft 404 kümeleri, yinelenen filtre sayfaları.
- Kurtarılabilir fırsatlar: Sitemap’te bulunan ama az link alan, yeni eklenen veya keşif sorunu yaşayan URL’ler.
Öncelik matrisi: trafik, indeks durumu ve dönüşüm verisini nasıl skorlarız?
Çalışan bir bulk URL denetimi matrisi genelde tek cümleye iner: iş etkisi x indekslenebilirlik x crawl talebi. İş etkisi tarafında organik oturum, dönüşüm, gelir katkısı ve şablon tipi bulunur. İndekslenebilirlik tarafında noindex, canonical çakışması, redirect, status code, sitemap varlığı ve "not indexed" nedeni okunur. Crawl talebi tarafında ise internal link depth, son güncelleme sıklığı, loglarda görülen Googlebot talebi ve dış bağlantı sinyalleri anlamlıdır.
URL düzeyinde tek tek puan vermek yerine önce cluster düzeyinde puanlamak daha verimlidir. Örneğin ürün detay sayfaları, kategori sayfaları, editoryal içerikler, filtre URL’leri ve site içi arama sonuçları ayrı segment olmalıdır. Her cluster için 1-5 ölçeğinde puan verip toplam skor üretebilirsiniz. Böylece bir ürün şablonunda 2 bin URL aynı teknik sorunu taşıyorsa, tek tek dosya incelemek yerine tek bir düzeltmeyle binlerce URL’yi etkilersiniz.
Buradaki kritik hata, tüm sektörlerde aynı eşiği kullanmaktır. E-ticarette düşük stoklu filtre sayfaları hızlıca crawl waste’e dönüşebilir. Yayıncı yapılarda arşiv ve etiket sayfaları bazen keşif desteği sağlar, bazen de bütçe yer. Marketplace tarafında ise şehir + kategori + filtre kombinasyonları en agresif çoğalan alan olur. Bu yüzden kategori başına dönüşüm oranı, içerik tazeliği ve template değeri aynı matriste farklı ağırlıklarla çalışmalıdır.
Örnek skor mantığı
- 5 puan iş etkisi: Son 90 günde trafik ve dönüşüm üreten URL veya cluster.
- 5 puan indeks sorunu: İndekslenmesi gereken ama dışarıda kalan, yanlış canonical alan veya redirect zincirine giren sayfa.
- 5 puan crawl talebi: Loglarda sık taranan ya da yeni içerik akışında kritik rol oynayan şablon.
- Kırmızı öncelik: Toplam skor 11 ve üzeri olan kümeler.
Veri birleşimi: GSC Crawl Stats, sitemap cluster, log ve URL Inspection API
Veri kaynağı çoktur ama her kaynak aynı soruyu cevaplamaz. Search Console performans raporu hangi URL grubunun trafik ve sorgu değeri taşıdığını gösterir. Crawl Stats raporu hangi dosya türlerinin, hangi amaçla ve hangi hızda tarandığını anlamanızı sağlar; Search Console Yardım dokümanı bu raporun istek hacmi, host status, response ve crawl purpose kırılımlarını özellikle ileri seviye kullanım için sunduğunu açıkça belirtir. Sunucu logları ise gerçekten taranan URL’yi, bot frekansını ve boşa giden istekleri doğrular.
Sitemap verisi burada sadece gönderim listesi değildir; cluster tasarlama aracı olarak çalışır. Google’ın 10 Aralık 2025 tarihli sitemap rehberi, tek sitemap için 50.000 URL veya 50 MB sınırını ve büyük setlerde sitemap index kullanımını net biçimde vurgular. Bu sınır, ürün, kategori, içerik, filtre ve arşiv segmentlerini ayrı sitemap’lere bölmek için pratik bir çerçeve verir. Sonra her sitemap kümesini performans, indeks ve crawl verisiyle çaprazlayarak problemli dizinleri dakikalar içinde görürsünüz.
URL Inspection API tarafında önemli nüans şu: Google’ın 23 Temmuz 2024 tarihli index.inspect referansına göre API size canlı URL testinden çok, Google indeksindeki sürüme ait durumu verir. Bu yüzden API’yi tüm envantere körlemesine uygulamak yerine örneklem tabanlı doğrulama için kullanmak gerekir. İyi bir kural şudur: yüksek öncelikli her segmentten 20-50 URL seçin, ardından bu örnekleri log ve crawl çıktısıyla karşılaştırın. Böylece "tek tek URL kontrolü" darboğazına girmeden teşhisi güvenle doğrularsınız.
Hızlı iş akışı
- Önce tüm URL’leri dizin, şablon ve sitemap bazında gruplayın.
- Her cluster’a organik giriş, dönüşüm ve gelir alanlarını ekleyin.
- Crawl Stats ve log verisiyle hangi segmentin aşırı tarandığını bulun.
- Kritik kümelerde URL Inspection API ile örneklem doğrulaması yapın.
Şablon bazlı riskler: faceted URL’ler, not indexed kümeleri ve redirect sorunları
"Discovered – currently not indexed" ile "Crawled – currently not indexed" aynı şey değildir. İlk durumda Google URL’yi biliyor ama sıra, kalite sinyali veya keşif önceliği açısından onu öne almıyor olabilir. İkinci durumda ise sayfa taranmış ama içerik değeri, kanonik sinyal, kopya benzerliği veya şablon kalitesi yetersiz bulunmuş olabilir. Bu ayrım yapılmadan verilen toplu aksiyonlar çoğu zaman yanlış olur; birine internal link ve sitemap desteği gerekirken diğerine içerik, canonical veya template temizliği gerekir.
Faceted navigation tarafı genelde en pahalı bölgedir. Google’ın 18 Aralık 2025’te güncellediği faceted navigation rehberi, parametreli kombinasyonların neredeyse sonsuz URL alanı üretebildiğini ve bunun hem overcrawling hem de yeni faydalı URL’lerin daha geç keşfi sonucunu doğurduğunu açıkça anlatır. Aynı rehber, boş sonuç veren veya anlamsız filtre kombinasyonlarında 404 dönmenin ve gereksiz taramayı sınırlamanın doğru yaklaşım olduğunu söyler. Canonical, hreflang alternatifleri ve duplicate varyasyonlar bu alanda birlikte okunmalıdır; tek başına biri nadiren yeterlidir.
Redirect zincirleri, soft 404 kümeleri, gerçek 404’ler ve orphan page’ler için de sıra önemlidir. Önce yoğun trafik alan ya da sitemap içinde kalan redirect chain kümelerini temizleyin. Sonra loglarda Googlebot alan ama 404 dönen sayfaları ayırın. En sonda orphan page listesini, gerçekten yaşaması gereken ama iç link alamayan sayfalar için düzeltin. Çünkü her orphan page problem değildir; bazıları bilinçli olarak emekliye ayrılmış olabilir.
- Birinci öncelik: Gelir üreten URL’lerde redirect chain, yanlış canonical ve indeks dışı kalma.
- İkinci öncelik: Aşırı çoğalan filtre ve parametre URL kümeleri.
- Üçüncü öncelik: Trafik taşımayan ama crawl harcayan soft 404 ve boş arşivler.
- Dördüncü öncelik: Yaşaması gereken yetim sayfalar ve derin internal link sorunları.
100 bin+ URL’lik saha çalışması: üç kova, aksiyon sırası ve 60 günlük etki
Sahada işe yarayan çerçeve, bütün envanteri tek satırlık "hata listesi" olmaktan çıkarmaktır. 100 bin+ URL’li örnek bir denetimde tabloyu çoğunlukla üç kova halinde okuruz: yaklaşık 10-15 bin URL doğrudan gelir veya lead etkisi taşır, 60-80 bin URL crawl waste üretir, kalan küme ise keşfedilirse değer yaratabilecek ama zayıf sinyal alan sayfalardan oluşur. Bu dağılım sektörlere göre değişir; fakat karar mantığı değişmez: önce iş değeri, sonra bütçe kaybı, ardından fırsat.
İlk 14 günde en hızlı aksiyon sırası genelde şöyledir: gelir getiren sayfalarda redirect ve canonical düzeltmesi, sitemap içinde bulunup indeks dışı kalan kritik URL’lerde internal link güçlendirmesi, sonrasında filtre ve arama sayfalarında crawl kısıtlama temizliği. Bu aşamada log analizi özellikle değerlidir; çünkü tarama yoğunluğunun gerçekten hangi klasörlerde sıkıştığını gösterir. Crawl aracının "sorun var" dediği pek çok küme, log tarafında neredeyse hiç taranmıyor olabilir; bunlar çoğu zaman ilk sprint’e girmez.
Dikey farkı burada belirginleşir. E-ticarette filtre URL’leri ve stok dışı ürün varyasyonları öne çıkar. Yayıncı sitelerde eski arşiv, etiket ve sayfalama kombinasyonları daha büyük maliyet yaratır. Marketplace yapılarda ise şehir, hizmet ve arama kombinasyonları kontrolsüz çoğalır. Bu yüzden redirect chain oranı, orphan page oranı ve HTML yanıt süresi için kullandığınız eşikler şablon bazında değişmelidir; tek genel oran tüm siteyi açıklamaz.
30-60 günlük izleme döneminde bakmanız gereken metrikler nettir: Crawl Stats içinde HTML isteklerinin amaç dağılımı, ortalama yanıt süresi, problemli response kümeleri, kritik sitemap’lerde indekslenme payı ve öncelikli klasörlerin organik girişi. İyi bir temizlik sonrası genelde iki şey birlikte görünür: düşük değerli kümelerde crawl gürültüsü azalır, kritik segmentlerde keşif ve yenileme taramaları daha anlamlı hale gelir. En doğru okuma, bu metrikleri tek tek URL değil segment bazında izlemektir.
SEOYEN ile operasyonu ölçekleme: site sağlığı, sıralama takibi ve ekip raporlaması
Bulk URL denetiminde asıl darboğaz bulgu üretmek değil, bulguyu operasyon akışına çevirmektir. Bu yüzden segment bazlı sorunları bir denetim ekranında izlemek önemlidir. Örneğin teknik bulguları şablon, klasör ve öncelik kovası mantığıyla takip etmek için site sağlığı denetimi akışı daha düzenli bir temel sağlar. Böylece crawl export, GSC notları ve geliştirici ticket’ları ayrı dosyalarda dağılmaz.
Düzeltme sonrası etki ölçümü de aynı derecede kritik. Öncelik verdiğiniz ürün, kategori veya içerik segmentlerinde görünürlük değişimini ayrı bir raporla takip etmek gerekir. Bu noktada sıralama takibi raporu ile teknik düzeltmenin SERP tarafında ne kadar karşılık bulduğunu görmek daha nettir. Tek platform mantığı burada avantaj sağlar; özellikle Türkçe arayüz, TL bazlı fiyatlandırma ve yerel destek, büyük denetimleri sadece uzman için değil içerik, ürün ve yazılım ekipleri için de daha yönetilebilir hale getirir.
Operasyonun dağınık paneller yerine tek yerde akması, özellikle yerel ekiplerde rapor kalitesini yükseltir. Güncel plan yapısını görmek isteyen ekipler için paket ve fiyat detayları ayrı sayfada tutulduğu için içerik de güncelliğini korur. Kritik nokta şu: araç sayısı arttıkça değil, aynı öncelik mantığını ölçüm ve raporlamaya taşıdıkça büyük site SEO yönetimi sadeleşir.
| Veri kaynağı | Ne gösterir | En iyi kullanım | Sınırlama |
|---|---|---|---|
| Search Console performans verisi | Trafik, sorgu ve görünürlük değeri | İş etkisi yüksek URL veya cluster bulma | Tek başına indeks teşhisi vermez |
| Crawl Stats raporu | Tarama hacmi, amaç, yanıt ve host durumu | Aşırı taranan dosya türü ve klasörleri ayırma | URL bazında tam neden analizi sunmaz |
| Sunucu logları | Gerçek Googlebot isteği ve frekansı | Tarama davranışını doğrulama | Kurulum ve temizleme emeği ister |
| Sitemap cluster'ları | Hangi URL grubunun keşif için öne sürüldüğü | Şablon bazlı segmentasyon ve izleme | İndekslenmeyi garanti etmez |
| URL Inspection API örneklemi | Google indeksindeki URL durumu | Kritik segmentlerde örneklem doğrulama | Tüm envantere ölçeklemek verimsizdir |
| Crawl aracı bulguları | Canonical, status code, depth, chain ve orphan desenleri | Template seviyesinde teknik kalıp tespiti | Googlebot davranışını doğrudan göstermez |
Adım Adım Büyük sitelerde bulk URL önceliklendirme çerçevesi
Aşağıdaki akış, binlerce URL içeren yapılarda en az sürtünmeyle uygulanabilen pratik çerçevedir. Mantık basittir: önce envanteri gruplayın, sonra veri katmanlarını ekleyin, en sonda örneklemle teşhisi doğrulayın.
- URL envanterini segmentlere ayır. Ürün, kategori, içerik tipi, filtre, arşiv ve arama sonuçları gibi şablon bazlı cluster’lar kurun. Aynı klasörde görünen ama farklı amaç taşıyan sayfaları ayırmak burada kritik olur. İlk tabloda URL, dizin, şablon tipi, sitemap adı ve indexlenmesi isteniyor mu sütunları mutlaka yer alsın.
- Temel performans ve iş verisini ekle. Son 90 günlük organik giriş, dönüşüm, gelir veya lead katkısını her cluster’a bağlayın. Veri sadece URL düzeyinde değil, klasör ve template bazında da toplanmalı. Böylece teknik olarak sorunlu ama iş etkisi sıfıra yakın kümelerle, küçük ama kritik kümeleri aynı gözle değerlendirmezsiniz.
- İndeks ve tarama sinyallerini topla. GSC performans raporları, Crawl Stats, sitemap durumu ve crawl aracı çıktılarıyla her segmentin görünümünü oluşturun. Özellikle "Discovered", "Crawled", response code ve internal link depth alanlarını aynı tabloda görün. Bu birleşim, indeks sorununun keşif eksikliği mi kalite sorunu mu olduğunu ayırmayı kolaylaştırır.
- Örneklem tabanlı URL doğrulaması yap. Her kritik segmentten temsil gücü yüksek URL’ler seçin ve URL Inspection API ile logları karşılaştırın. Tüm envanteri tek tek kontrol etmeye çalışmayın; bu yaklaşım ölçeklenmez. Yüksek öncelikli kümelerde 20-50 URL’lik örneklem çoğu zaman teşhisi doğrulamak için yeterlidir.
- Öncelik skorunu hesapla. İş etkisi, indeks sorunu şiddeti ve crawl talebi için puan verin; ardından cluster toplam skorunu üretin. Aynı şablondaki binlerce URL için tek karar almak, ekip hızını ciddi biçimde artırır. Kırmızı, sarı ve yeşil eşikleri önceden tanımlarsanız sprint planı çok daha net çıkar.
- Aksiyonları şablon bazında uygula ve ölç. Redirect, canonical, internal link ve faceted cleanup işlerini cluster bazında devreye alın. Sonra 30-60 gün boyunca Crawl Stats, indeks kapsaması ve organik giriş değişimini izleyin. Etkiyi tek tek sayfada değil, ilgili segmentin tamamında okumak daha doğru sonuç verir.
Bu yöntem, büyük sitelerde denetimi sonsuz kontrol listesi olmaktan çıkarıp karar odaklı hale getirir. En büyük kazanım da burada gelir: ekip, artık en çok hataya değil, en yüksek etkiye çalışan bir sırayla ilerler.
Kaynaklar
Sıkça Sorulan Sorular
Önce gelir veya lead etkisi taşıyan, aynı anda indeks sorunu yaşayan ve crawl bütçesini doğrudan etkileyen URL segmentleri denetlenmelidir. Burada mantık tek tek en çok hatalı URL’yi aramak değil, iş etkisi en yüksek kümeyi bulmaktır. Ürün, kategori, yüksek trafik alan içerik ve önemli landing page’ler ilk sıraya çıkar. Ardından parametreli filtre URL’leri, redirect zincirleri ve yanlış canonical alan kümeler gelir. Ham hata sayısı yol gösterici olabilir, ancak tek başına öncelik belirlemek için yeterli değildir.
Önceliklendirme yapılmadığında Googlebot düşük değerli parametreli, yinelenen veya boş kombinasyon üreten URL’lerde zaman harcayabilir. Bu durum özellikle büyük ve sık güncellenen sitelerde kritik sayfaların keşif veya yenileme taramasını geciktirebilir. Crawl budget etkisi çoğunlukla faceted navigation, gereksiz arşiv sayfaları, redirect zincirleri ve soft 404 kümelerinde görülür. Bu yüzden bulk denetimde hedef sadece sorun bulmak değil, hangi segmentin gereksiz tarama maliyeti ürettiğini tespit edip öncelikli olarak temizlemektir.
Search Console arayüzünde tek tek URL Inspection kullanımı sınırlıdır. bu yüzden çok büyük sitelerde arayüz tek başına yeterli olmaz. Daha ölçeklenebilir yöntem, performans raporları, Crawl Stats verisi ve URL Inspection API’yi birlikte kullanmaktır. Burada API’yi tüm envantere uygulamak yerine örneklem tabanlı doğrulama için kullanmak daha doğrudur. Önce segmentleri kurar, sonra yüksek öncelikli her kümeden temsil gücü yüksek URL’leri seçersiniz. Böylece hem zamandan kazanır hem de karar kalitesini düşürmeden bulk analiz yaparsınız.
Önce iş değeri yüksek, sitemap içinde yer alan ve iç link alan URL’leri ayırmak gerekir. Çünkü bu kümenin bir kısmı sadece keşif sırası bekliyor olabilir, bir kısmı ise kalite veya kanonik sorun nedeniyle geri planda kalıyor olabilir. Öncelik verirken organik talep, template önemi, sitemap varlığı ve internal link derinliği birlikte okunmalıdır. Kategori, ürün veya güncel içerik gibi değerli segmentlerde bu durum daha acil kabul edilir. Sonrasında log ve örneklem doğrulamasıyla sorunun keşif eksikliği mi içerik/şablon kalitesi mi olduğu netleştirilir.
Doğru sıra, karar sorusuna göre değişir. ancak çoğu büyük sitede önce segment kurmak, sonra crawl aracı ve logu birlikte kullanmak en iyi sonucu verir. Crawl aracı size canonical, redirect, orphan page ve internal link depth gibi teknik desenleri hızlıca gösterir. Log analizi ise Googlebot’un gerçekte nereyi taradığını, neyi ihmal ettiğini ve hangi klasörlerde vakit kaybettiğini doğrular. Yani crawl aracı teşhisi hızlandırır, log analizi önceliği doğrular. Tek başına biri kullanıldığında ya davranış eksik kalır ya da teknik bağlam eksik olur.
En pratik yöntem crawl çıktıları, loglar ve sitemap karşılaştırmasını birleştirmektir. Crawl aracı redirect chain, loop, 404 ve soft 404 kümelerini teknik olarak çıkarır. Log tarafı, Googlebot’un bu hatalı URL’lere gerçekten gidip gitmediğini ve ne kadar bütçe harcadığını gösterir. Sitemap karşılaştırması ise hangi 404 veya redirect’li URL’nin hâlâ önemli listelerde yer aldığını anlamanıza yardım eder. Öncelik verirken önce trafik veya gelir taşıyan zincirleri, sonra sitemap içinde kalan kırık yönlendirmeleri, en sonda düşük değerli artık URL’leri ele almak daha verimlidir.
Sitemap’leri ürün, kategori, içerik tipi, arşiv, filtre veya güncellik mantığıyla ayırdığınızda her kümenin indeks ve tarama davranışı görünür hale gelir. Bu yöntem özellikle 50 bin URL üstü yapılarda çok değerlidir çünkü tek bir büyük liste, hangi segmentin sorunlu olduğunu gizler. Ayrı sitemap cluster’ları sayesinde hangi grubun yüksek performans ama düşük indeks payı taşıdığını, hangisinin yoğun taranıp değer üretmediğini daha hızlı fark edersiniz. Sonra bu kümeleri performans, Crawl Stats ve log verisiyle çaprazlayarak net bir öncelik sırası kurabilirsiniz.