Tarama bütçesi boşa gidiyorsa hangi sayfalar önce optimize edilmeli

Özet (TL;DR): Her tarama dalgalanması sorun değildir. Önce Crawl Stats ve loglarda israfın gerçekten hangi klasörde olduğunu bulun. En hızlı kazanım, filtre ve parametreli duplicate URL’leri kontrol altına almaktır. Sonra soft 404, redirect chain ve zayıf iç linklenen önemli sayfalara geçin.

Hızlı Cevap

Tarama bütçesi boşa gidiyorsa önce yüksek tarama alan ama düşük iş değeri taşıyan URL kümelerini optimize edin: filtre ve sort sayfaları, parametreli duplicate’ler, soft 404’ler ve redirect chain’ler. Ardından thin content ile zayıf iç linklenen önemli sayfaları düzeltin; en hızlı kazanım Googlebot’u gereksiz URL’lerden uzaklaştırmaktır.

Önemli Noktalar

Yüksek tarama payı alan düşük değerli URL kümelerini önce kapatın.
Noindex taramayı değil, indekslemeyi etkiler; robots.txt farklı çalışır.
Soft 404 ve redirect chain sorunları keşif hızını sessizce düşürür.
Önemli sayfalara iç link eklemek crawl demand tarafını güçlendirir.

Tarama bütçesi boşa gidiyorsa önce bunun gerçekten sorun olup olmadığını doğrulayın

Tarama bütçesi her sitede aynı ağırlıkta bir sorun değildir. Google’ın crawl budget rehberine göre bu konu en çok çok büyük sitelerde, çok hızlı güncellenen yapılarda ve Search Console’da yüksek miktarda Discovered – currently not indexed görülen alanlarda darboğaz yaratır (Google for Developers, 2025-12-19). Küçük bir kurumsal sitede birkaç günlük tarama dalgalanması tek başına alarm değildir; yüz binlerce URL üreten e-ticaret veya ilan sitelerinde ise doğrudan önceliktir.

İlk bakacağınız ekran Search Console Crawl Stats olmalı. Burada toplam crawl request, average response time, host status, response type ve crawl purpose birlikte okunur. Search Console Help, bu raporun son 90 güne yayılan host durumu, yanıt tipleri ve discovery ile refresh ayrımı sunduğunu açıkça belirtir (Search Console Help, 2026). Host status sarı ya da kırmızıysa önce erişilebilirlik ve sunucu kapasitesine bakın; rapor yeşil ama istekler gereksiz klasörlerde yoğunlaşıyorsa sorun çoğunlukla URL envanterindedir.

İkinci doğrulama katmanı sunucu loglarıdır. Googlebot’un en çok hangi klasörleri, parametreleri ve dosya tiplerini istediğini loglardan görmeden sadece indeksleme raporuna bakmak eksik kalır. Özellikle /filter/, /sort/, ?color=, iç arama sonuçları, eski kampanya klasörleri ve soft 404 dönen şablonlar ayrı ayrı etiketlenmelidir. Amaç, çok taranan ile gerçekten önemli olan URL setini birbirinden ayırmaktır.

Önce hangi sayfalar optimize edilmeli: düşük değerli URL kümeleri için öncelik matrisi

Önceliklendirmeyi tek tek sayfalarda değil, URL kümelerinde yapmak daha sağlıklıdır. Dört sinyal yeterlidir: aldığı crawl request payı, iş değeri, indekslenme ihtimali ve gelir ya da lead etkisi. Bu dört ekseni yan yana koyduğunuzda en üst sıraya genelde yüksek tarama payı alan ama düşük değer üreten kümeler çıkar. Çünkü burada yapılacak tek bir şablon düzeltmesi, yüzlerce ya da binlerce isteği yeniden dağıtabilir.

Pratikte ilk sıraya filtre ve sıralama URL’leri, parametreli duplicate’ler, iç site araması ve süresi dolmuş kampanya sayfaları yerleşir. Bunlar çoğu zaman kategori, ürün veya esas içerik sayfalarından daha çok taranır ama organik görünürlükte anlamlı katkı üretmez. Tam tersine, güçlü ticari değeri olan ama zayıf iç linklenen kategori ve ürün sayfaları düşük crawl demand yüzünden geç keşfedilir.

İlk müdahale grubu: yüksek tarama, düşük iş değeri taşıyan filtre, sort ve parametreli varyasyonlar.
İkinci müdahale grubu: soft 404, redirect chain ve gereksiz arşiv şablonları gibi kalite kaçakları.
Üçüncü müdahale grubu: iş değeri yüksek ama zayıf iç link alan kategori, ürün ve içerik sayfaları.

Bu nedenle doğru sıra çoğu zaman şöyledir: önce gereksiz taramayı şişiren kümeleri bastırın, sonra önemli ama yeterince taranmayan URL’lerin talebini artırın. Yalnızca yeni iç link ekleyip alttaki israfı bırakırsanız, Googlebot’un zamanı yine yanlış yerde harcanır.

Parametreli, filtreli ve yinelenen URL’lerde robots.txt, canonical, noindex kararı

Fasetli navigasyonlu sitelerde karar ağacının merkezinde şu soru vardır: Bu URL’nin kullanıcı için değeri olabilir, peki arama motoru açısından ayrıca taranması gerekiyor mu? Google’ın faceted navigation rehberi, gereksiz filtre kombinasyonlarının hem overcrawling hem de slower discovery ürettiğini net biçimde söyler (Google for Developers, 2025-12-18). Bu yüzden parametreli URL yönetiminde varsayılan yaklaşım daha fazla URL açmak değil, gereksiz kombinasyonları daraltmaktır.

robots.txt: URL kümesini hiç taratmak istemiyorsanız ilk aday budur. Filtre, sort, izleme parametresi ya da iç arama sonuçları organik değer üretmiyorsa burada kontrol başlar.
canonical: Kullanıcıya açık kalması gereken ama sıralama sinyali tek URL’de toplanacak varyasyonlarda tercih edilir. Renk, sıralama ya da oturum parametresi gibi tekrar üreten varyasyonlarda çoğu zaman doğru hamledir.
noindex: Sayfa taranabilir kalmalı ama sonuçlarda görünmemeli diyorsanız kullanılır. Ancak bu yöntem taramayı baştan kesmez; Google önce sayfayı ister, sonra noindex sinyalini işler.

Google’ın robots meta dokümanı, noindex ve X-Robots-Tag kurallarının ancak URL taranabildiğinde görülebildiğini açıkça belirtir; robots.txt ile bloklanan bir sayfada bu sinyal okunmaz (Google Search Central, 2026-03-24). Bu yüzden tarama israfını azaltmak istiyorsanız noindex çoğu durumda ilk savunma hattı değildir. HTML dışı dosyalarda ya da belirli başlık yanıtlarında x-robots-tag kullanmanız gerektiğinde kavramları netleştirmek için teknik SEO terimleri sözlük sayfası işinizi kolaylaştırır.

Yinelenen URL’lerde sinyal birleştirme tarafında canonical ve yönlendirme birlikte düşünülmelidir. Google’ın canonical rehberi, kalıcı olarak emekliye ayrılan URL’lerde redirect’in daha güçlü sinyal verdiğini; sitemap’in ise daha zayıf ama tamamlayıcı bir sinyal olduğunu vurgular (Google Search Central, 2026-03-27). Bu nedenle XML sitemap’inizde yalnızca tercih edilen kanonik URL’leri tutun, lastmod bilgisini gerçek güncellemelerle hizalayın ve iç linklerinizi de aynı tercih edilen adreslere verin.

404, soft 404, redirect chain ve thin content sayfaları hangi sırayla temizlenmeli

Tarama bütçesi temizliğinde en çok vakit kazandıran düzeltmeler genelde hatalı yönlendirme ve kalite kaçağı üreten şablonlarda olur. Özellikle redirect chain, redirect loop ve yanlış hedefe giden eski URL’ler tek bir keşif isteğini birkaç isteğe çevirir. Crawl Stats raporunda redirect hataları ve yanıt süresi artışı görüyorsanız, bu satırları bekletmeyin.

Redirect chain ve loop’ları tek sıçramaya indirin. Eski kampanya, taşıma veya kategori birleşimlerinden kalan çok adımlı yönlendirmeler önce temizlenmeli.
Soft 404 şablonlarını düzeltin. Boş listeleme sayfaları, stoksuz ama içeriksiz ürün sayfaları ve ince arşivler sık görülen örneklerdir.
Kalıcı kaldırılmış URL’lerde 404 ya da 410 kullanın. Google, crawl budget rehberinde her ikisini de güçlü sinyal olarak tanımlar; 410 daha net bir kaldırma mesajı verebilir.
Thin content kümelerinde sayfayı güçlendirme, birleştirme veya kaldırma kararı verin. Her ince sayfa silinmez; bazıları şablon ve içerik desteğiyle toparlanabilir.

Thin content tarafında karar sayfa bazında değil şablon bazında alınmalıdır. Eski kampanya sayfaları, zayıf etiket arşivleri, çok benzer lokasyon varyasyonları ve açıklamasız filtre sayfaları çoğu zaman aynı probleme sahiptir. Eğer sayfa iş değeri üretmiyor ve benzersiz talep toplamıyorsa kaldırmak ya da kanonikleştirmek daha doğrudur; iş değeri varsa onu içeriği genişleterek ve iç link ekleyerek yaşatmak gerekir.

Bir başka sessiz kayıp da yetim ya da çok zayıf iç link alan önemli sayfalardır. Bunlar doğrudan israf üretmez gibi görünür, ancak crawl demand düşüklüğü nedeniyle geç keşfedilir veya seyrek yenilenir. Özellikle kategori, ürün ve dönüşüm odaklı içerik sayfalarında güçlü iç bağlantı yoksa, tarama bütçesi temizlenmiş olsa bile önemli URL’ler beklediğiniz sıklıkta taranmayabilir.

90 günlük log + Crawl Stats mini vaka: hangi klasörler crawl request payını şişirdi

Bu bölümdeki rakamlar yöntemi somutlaştırmak için hazırlanmış temsili bir mini vakatır; gerçek bir markayı değil, teknik teşhis akışını model alır. Ama desen çok tanıdıktır: tarama israfı çoğu zaman sitenin tamamına dağılmaz, birkaç klasörde toplanır. Bu yüzden Crawl Stats ekranını tek başına değil, log kırılımıyla birlikte okumak daha isabetli sonuç verir.

İlk 90 günlük görünümde toplam 182.000 crawl request vardı. Bunun 61.000’i /filter/, 37.000’i /sort/, 24.000’i parametreli kategori varyasyonlarına gidiyordu; kategori ve ürün sayfalarının toplamı ise 46.000 istekte kalıyordu. Average response time 690 ms seviyesindeydi. Response type dağılımı ilk bakışta dramatik görünmese de klasör bazlı log okuması problemin kapasiteden çok URL envanteri kaynaklı olduğunu gösteriyordu.

İkinci aşamada filtre kombinasyonları robots.txt ile sınırlandı, sort varyasyonları kanonik URL’lere bağlandı, eski kampanya şablonları 410 ve tek adımlı 301 kararlarıyla temizlendi. Sonraki ölçüm periyodunda kategori ve ürün sayfalarının payı 46.000’den 79.000’e çıktı; average response time 690 ms’den 540 ms’ye indi; Discovered – currently not indexed kümesi de 12.400’den 8.100’e geriledi. Ders basit: önce klasör bazlı israfı kapatmadan sadece içerik üretmek, crawl dağılımını beklenen hızda iyileştirmez.

Buradaki asıl içgörü, tek bir KPI’a aşırı bağlanmamaktır. Toplam tarama isteği bazen düşer, bazen artar; önemli olan isteklerin nereye gittiğidir. Kategori, ürün ve dönüşüm odaklı içerik sayfalarının payı yükseliyor; düşük değerli kümelerin payı geriliyorsa doğru yoldasınız.

Önemli sayfaların daha sık taranması için iç linkleme ve SEOYEN iş akışı

Tarama bütçesi optimizasyonu yalnızca engelleme işi değildir; aynı zamanda crawl demand oluşturma işidir. Ana navigasyon, kategori hub’ları, ilgili içerikler, breadcrumb ve modüler iç link bloklarıyla önemli sayfalara düzenli sinyal vermeniz gerekir. Bunun yanında sitemap’te yalnızca kanonik URL’leri tutmak ve gerçek güncellemelerde lastmod alanını yenilemek, keşif hızını destekleyen temiz bir ikinci katman oluşturur.

Operasyon tarafında bulguların dağılmaması önemlidir. Teknik tespitleri düzenli bir site sağlığı raporu içinde takip etmek, hangi şablonun tekrar hata ürettiğini hızla yakalamanızı sağlar. Yayın sonrası görünürlük ve toparlanma etkisini sıralama takibi paneli üzerinden izlediğinizde, teknik düzeltmenin organik sonuçlara ne zaman yansıdığını ekip içinde daha net anlatabilirsiniz.

Ahrefs, SEMrush, Moz, SE Ranking veya SEOptimer gibi platformlar farklı veri katmanlarında güçlü işler yapar. SEOYEN’in farkı, bu teknik SEO operasyonunu Türkiye pazarına daha yakın bir akışla toplamasıdır: tek platformda SEO araçları, Türkçe arayüz, TL bazlı fiyatlandırma mantığı ve yerel destek birlikte çalışır. Bu yapının size uygun olup olmadığını statik rakamla değil, güncel paket detayları üzerinden değerlendirmek daha sağlıklıdır.

Adım Adım Tarama bütçesi önceliklendirme akışı

Aşağıdaki akış, tarama israfını tek seferlik temizlik değil, tekrar eden teknik SEO rutini olarak yönetmek için kullanılabilir. Amaç daha fazla veri toplamak değil, aynı veri setinden daha hızlı doğru karar çıkarmaktır.

Crawl Stats ve log verisini çıkarın. Son 90 günü aynı zaman aralığında alın. Host status, response type ve crawl purpose verisini loglardaki klasör kırılımıyla eşleştirin.
URL kümelerini değer ve israfla etiketleyin. Her grubu iş değeri, indekslenme ihtimali, crawl payı ve gelir etkisine göre sınıflandırın. Tekil sayfa listesi yerine şablon mantığıyla çalışın.
Filtre ve duplicate kümelerinde doğru kontrolü seçin. Taranmaması gereken kümeleri robots.txt ile sınırlayın; kullanıcıya açık kalacak yakın kopyalarda canonical kullanın; gerektiğinde noindex ya da x-robots-tag ile indeksleme kontrolü ekleyin.
Soft 404 ve yönlendirme zincirlerini temizleyin. Boş şablonları, kırık kampanya hedeflerini ve çok adımlı yönlendirmeleri tek tek değil, desen bazında düzeltin. Bu adım genelde en hızlı operasyonel kazanımı verir.
İç linkleme ve sitemap sinyallerini güçlendirin. Önemli kategori, ürün ve içerik sayfalarına ana akıştan link verin. Sitemap’te yalnızca kanonik URL’leri tutun ve güncellemeleri gerçek tarihle eşleyin.
KPI değişimini birkaç hafta izleyin. Toplam tarama sayısına değil, klasör bazlı pay değişimine bakın. Average response time, discovery crawl oranı ve önemli URL’lerin taranma sıklığı birlikte değerlendirilmelidir.

Tarama bütçesi için sayfa tipi öncelik matrisi

Sayfa tipi	Belirti	İlk aksiyon	Öncelik	Beklenen etki
Filtre ve sort URL'leri	Crawl payı yüksek, organik katkı zayıf	robots.txt veya canonical kararı	Çok yüksek	Gereksiz taramayı hızlı azaltır
Parametreli duplicate URL'ler	Aynı içeriğin çoklu varyasyonu	canonical ve iç link temizliği	Çok yüksek	Ana URL sinyallerini toplar
Soft 404 sayfaları	İçerik var gibi görünür ama değersiz	şablonu düzelt veya kaldır	Yüksek	Boşa giden crawl ve kalite sinyalini azaltır
404 ve 410 verilecek kaldırılmış URL'ler	Kalıcı kaldırılmış sayfalar hâlâ istek alıyor	404 veya 410 döndür	Orta-Yüksek	Crawl kuyruğunu sadeleştirir
Redirect chain içeren eski sayfalar	Bir istek birden çok adım yaratıyor	tek adımlı yönlendirme	Yüksek	Keşif hızını ve yanıt süresini iyileştirir
Thin content arşiv veya kampanya sayfaları	İnce içerik ve düşük talep	güçlendir, birleştir veya kaldır	Orta	İndeks kalitesini temizler
Zayıf iç linklenen önemli sayfalar	İş değeri var ama demand düşük	iç link ve sitemap güçlendir	Yüksek	Önemli sayfaların daha sık taranmasını sağlar

Kaynaklar

Optimize your crawl budget (Google for Developers — 2025-12-19)
Managing crawling of faceted navigation URLs (Google for Developers — 2025-12-18)
Crawl Stats report (Google Search Console Help — 2026)
Robots Meta Tags Specifications (Google Search Central — 2026-03-24)
How to Specify a Canonical with rel="canonical" and Other Methods (Google Search Central — 2026-03-27)

Sıkça Sorulan Sorular

Tarama bütçesi neden boşa gider?

Tarama bütçesi en sık, gereksiz URL sayısı şiştiğinde boşa gider. Parametreli URL patlaması, filtre ve sort sayfaları, yinelenen içerikler, soft 404'ler, redirect chain'ler ve düşük değerli arşivler Googlebot'un zamanını tüketir. Sorun yalnızca çok URL olması değildir. bu URL'lerin önemli kategori, ürün veya içerik sayfalarından daha fazla taranmasıdır. Özellikle faceted navigation kullanan e-ticaret sitelerinde aynı listenin onlarca varyasyonu üretildiğinde, keşif bütçesi yeni ve değerli sayfalara daha az kalır. Bu yüzden önce klasör bazlı israfı bulmak gerekir.

Hangi sayfalar tarama bütçesini en çok tüketir?

En büyük tüketiciler genelde filtre URL'leri, sıralama parametreleri, parametreli duplicate varyasyonlar, iç arama sonuçları, soft 404 sayfaları ve zayıf iç linklenen ince içeriklerdir. Bunlara ek olarak kalıcı kaldırılmış ama doğru kapanmamış eski kampanya sayfaları ve redirect chain içeren URL'ler de gereksiz isteği artırır. Her sitenin deseni farklıdır. bu yüzden cevabı ezbere değil, Search Console Crawl Stats ve sunucu logları üzerinden vermek gerekir. Çok taranan her sayfa zararlı değildir. iş değeri taşımayan ve tekrar üreten kümeler asıl problemdir.

Crawl budget optimizasyonu için hangi araçlar kullanılır?

Temel araç seti üç katmandan oluşur: Search Console Crawl Stats, sunucu logları ve site crawl araçları. Crawl Stats size son 90 günün host status, response type, file type ve crawl purpose verisini verir. Sunucu logları ise Googlebot'un gerçekten hangi klasörleri ve parametreleri istediğini gösterir. URL Denetleme Aracı tekil sayfa kontrolü için faydalıdır ama büyük resmi vermez. Bunları düzenli site sağlığı raporlarıyla birleştirdiğinizde, sorunlu şablonları, yanlış yönlendirmeleri ve iç link açığını aynı iş akışında izleyebilirsiniz.

Robots.txt ile tarama bütçesi nasıl yönetilir?

Robots.txt, tarama değeri düşük ve indekslenmesini istemediğiniz URL kümelerini baştan sınırlamak için kullanılır. En tipik örnekler filtre kombinasyonları, sıralama parametreleri, iç arama sonuçları ve bazı izleme parametreleridir. Buradaki kritik nokta, yanlışlıkla kanonik kategori veya ürün sayfalarını, ayrıca render için gereken CSS ve JavaScript dosyalarını bloklamamaktır. Robots.txt taramayı keser. ancak robots meta veya noindex kuralları tarama sırasında görülür. Bu yüzden hangi kümenin hiç taranmaması gerektiğini netleştirmek, doğru robots.txt kullanımının temelidir.

Noindex etiketi tarama bütçesini etkiler mi?

Evet, ama etkisi dolaylıdır. Noindex etiketi bir URL'nin sonuçlarda yer almamasına yardımcı olur. ancak Google bu sinyali görebilmek için önce URL'yi taramak zorundadır. Bu nedenle tarama israfını baştan azaltmak istediğiniz senaryolarda noindex çoğu zaman ilk tercih değildir. Ayrıca bir URL robots.txt ile bloklandıysa, arama motoru sayfaya girip noindex kuralını göremez. Yakın kopyalarda canonical, tamamen gereksiz kümelerde robots.txt, gerektiğinde HTML dışı dosyalar için X-Robots-Tag daha doğru karar olabilir.

Tarama bütçesi optimizasyonu ne kadar sürer?

Süre sitenin büyüklüğüne, URL üretim hızına ve yaptığınız değişikliklerin kapsamına göre değişir. İlk sinyaller çoğu projede birkaç hafta içinde görünür: gereksiz klasörlerin tarama payı düşer, önemli sayfaların payı artar, ortalama yanıt süresi toparlanır. Ancak kalıcı iyileşme için yönlendirme zincirleri, sitemap, canonical seti ve iç link düzeni birlikte oturmalıdır. Çok büyük ya da sık güncellenen sitelerde 4 ila 12 haftalık izleme periyodu daha gerçekçidir. Değerlendirmeyi toplam crawl sayısına değil, klasör bazlı dağılıma göre yapmalısınız.

Google Search Console'da crawl budget nasıl izlenir?

Search Console içinde Settings altındaki Crawl Stats raporu temel ekrandır. Burada toplam crawl request, total download size, average response time, host status, crawl responses, file types, crawl purpose ve Googlebot type kırılımlarını izleyebilirsiniz. Özellikle host status tarafı erişilebilirlik sorunu olup olmadığını, response type ve file type tabloları ise Googlebot'un zamanını hangi kaynaklarda harcadığını gösterir. Discovery ve refresh ayrımı, yeni URL keşfinin aksayıp aksamadığını anlamanıza yardım eder. Bu raporu sunucu loglarıyla birlikte okumak, gerçek crawl budget teşhisinde en güvenilir yöntemdir.

← Marka Sorgularında Yanlış Yazım Varyasyonları Rehberi 8 ga4 ve gsc aynı sorguyu neden farklı gösterir: 2026 →

Tarama bütçesi boşa gidiyorsa hangi sayfalar önce optimize edilmeli

Hızlı Cevap

Önemli Noktalar

Tarama bütçesi boşa gidiyorsa önce bunun gerçekten sorun olup olmadığını doğrulayın

Önce hangi sayfalar optimize edilmeli: düşük değerli URL kümeleri için öncelik matrisi

Parametreli, filtreli ve yinelenen URL’lerde robots.txt, canonical, noindex kararı

404, soft 404, redirect chain ve thin content sayfaları hangi sırayla temizlenmeli

90 günlük log + Crawl Stats mini vaka: hangi klasörler crawl request payını şişirdi

Önemli sayfaların daha sık taranması için iç linkleme ve SEOYEN iş akışı

Adım Adım Tarama bütçesi önceliklendirme akışı

Kaynaklar

Sıkça Sorulan Sorular

İlgili Yazılar

Çok Dilli Sitelerde Dil Seçici SEO Etkisi ve Doğru Kurulum

İç bağlantı dağılımı bozuksa hangi sayfalar önce güçlendirilmeli

CDN kullanımı her zaman site hızını artırır mı? 2026

En İyi 8 Sayfa Şablonu Değişikliği Organik Performans Aracı

En İyi 8 çeviri eklentileri SEO riski: 2026 karşılaştırması

8 schema doğru olduğu halde zengin sonuçlar neden çıkmaz