Hızlı Cevap
Parametreli URL tarama yükünü azaltmak için sıra şöyledir: önce sunucu loglarından hangi parametrelerin tarandığını tespit edin; canonical etiketini ilk adım olarak uygulayın, endeksten çıkarmak istediğiniz sayfalara noindex ekleyin, yüksek hacimli gereksiz taramayı robots.txt Disallow ile durdurun. GSC Crawl Stats ile 4-6 haftada doğrulayın.
Önemli Noktalar
- Log analizi yapılmadan uygulanan canonical ve robots.txt müdahalesi eksik ve tahmine dayalı kalır.
- Canonical etiketi Google için bir öneri sinyalidir; zorunlu direktif olarak güvenilmemelidir.
- Robots.txt ile engellenen sayfaya noindex eklemek işe yaramaz; Googlebot direktifi okuyamaz.
- GSC URL Parametreleri aracı Eylül 2022’de kaldırıldı; artık doğrudan Crawl Stats izlenmelidir.
- E-ticarette filtre kombinasyonları üstel URL sayısı üretir; önce trafik ve envanter analizi yapın.
Parametreli URL’ler Tarama Bütçesini Nasıl Tüketir?
Googlebot bir siteyi taradığında sonsuz sayfa işleyemez; her site için belirli bir SEO sözlüğünde tarama bütçesi mevcuttur. Parametreli URL’ler — ?sort=fiyat, ?renk=kirmizi, ?sid=abc123 gibi eklentiler — Googlebot’a her biri ayrı benzersiz bir sayfa olarak görünür. Yüzlerce filtre kombinasyonu aynı içeriği farklı URL’ler üzerinden servis ettiğinde, tarama bütçesinin büyük bölümü bu tekrarlayan sayfalara harcanır ve özgün içerik sayfaları ya geç taranır ya da hiç taranmaz.
Dört temel parametre türü bu israfı farklı ölçeklerde üretir. Sıralama parametreleri (?sort=fiyat) aynı ürün listesini farklı dizilimde gösterir; içerik özdeştir. Filtreleme parametreleri (?renk=kirmizi) ürün kombinasyonlarının çarpımsal artışına yol açar. Session ID parametreleri (?sid=xyz) her kullanıcı oturumu için benzersiz URL üretir ve büyük tarama israfı yaratır. İzleme parametreleri (?utm_source=newsletter) analytics amaçlıdır; içerik değeri sıfırdır.
50 ürünü olan bir e-ticaret sayfasında 20 ayrı filtre seçeneği bulunuyorsa teorik URL sayısı matematiksel olarak üstel biçimde büyür. Seobaz’ın crawl budget rehberinde aktarılan bir örnekte 10.000 ürün kataloğunun 2 milyonun üzerinde parametreli URL ürettiği belgelenmiştir. Google Search Console’un Crawl Stats raporunda tarama sıklığı düşükken hata oranının artması bu israfın göstergesidir. Kritik bağlam değişikliği: Google, Eylül 2022’de GSC URL Parametreleri aracını kullanımdan kaldırdı; artık parametreli URL’leri doğrudan Search Console üzerinden yapılandırmak mümkün değil ve bu sorumluluğun tamamı site sahibine düşüyor.
Log Analizi: Müdahaleden Önce Gerçek Tarama Haritasını Çıkarın
Teknik müdahalenin doğru noktaya uygulanabilmesi için önce hangi parametreli URL’lerin gerçekten tarandığını bilmek gerekir. Bunun tek güvenilir yolu sunucu log dosyalarıdır. Access log’lardan Googlebot User-Agent satırları filtrelenerek parametreli URL’lerin taranma frekans tablosu oluşturulur; bu tablo müdahale önceliğini belirler ve uygulama sonrası karşılaştırma için referans noktası oluşturur. Medyatics’in log analizi rehberinde de vurgulandığı üzere, bu veri olmadan uygulanan müdahaleler yalnızca görünür parametreleri hedefler; Googlebot’un gizli kalıplar üzerindeki taraması sürer.
Pratikte yaşanan kritik bir hata şudur: log analizi yapılmadan canonical ve robots.txt uygulanırsa, Googlebot’un hâlâ taramaya devam ettiği parametre kalıpları gözden kaçar. Gerçek bir e-ticaret vakasında, sıralama ve renk parametrelerine canonical ile robots.txt uygulandıktan dört hafta sonra log analizi tekrarlandığında session ID ve referans parametreli URL’lerin toplam Googlebot taramalarının yüzde otuzdan fazlasını oluşturmaya devam ettiği görüldü. Müdahale öncesinde bu oran çok daha yüksekti; iyileşme gerçekleşmişti ama bazı parametre kalıpları log verisi olmadığı için ilk etapta hiç tespit edilememişti.
Screaming Frog Log Analyser gibi araçlar log dosyasını import ederek hangi URL kalıplarının en sık tarandığını görselleştirir. Çıktıda üç metriğe odaklanın: parametreli URL’lerin toplam taramalardaki payı; en sık taranan on parametre kalıbı; canonical URL’lerin taranma sıklığı ile parametreli URL taranma sıklığının oranı. Bu veri olmadan atılan her teknik adım tahmine dayalı kalır ve müdahale sonucunu ölçmek güçleşir.
Parametre Envanteri ve Sınıflandırma: Hangi URL Önce Müdahale Alır?
Log analizinden elde edilen frekans tablosu, parametreleri müdahale önceliğine göre sıralamanızı sağlar. Genel kural: tarama bütçesini en çok tüketen ve organik değeri en düşük olan parametre türleri önce müdahaleye alınır. Aşağıdaki sıralama çoğu e-ticaret senaryosuna uygulanabilir:
- Session ID parametreleri (?sid=, ?sessionid=): Hiçbir içerik değeri yoktur, sonsuz kombinasyon üretir. En yüksek müdahale önceliği bu kategoridedir.
- İzleme parametreleri (?utm_source=, ?ref=, ?gclid=): Analytics verisi için kullanılır; içerik özdeştir ve tarama bütçesine katkısı sıfırdır.
- Sıralama parametreleri (?sort=, ?siralama=): Aynı sayfanın farklı sıralanmış versiyonudur; çoğunlukla organik değer taşımaz.
- Filtreleme parametreleri (?renk=, ?beden=): Bazı kombinasyonlar gerçek organik arama trafiği alabilir; GSC Performans raporunu kontrol etmeden müdahale edilmemelidir.
GSC’de organik tıklama alan parametreli sayfalar endekste tutulabilir. Karar filtresi şudur: Bu URL bağımsız bir arama niyetine hizmet ediyor mu? Arama hacmi olan ve dönüşüm değeri yüksek filtre kombinasyonları endekste tutulmaya değerdir. Zeo Agency’nin URL parametreleri analizine göre renk ve beden filtrelerinin belirli kombinasyonları arama motorlarında bağımsız sıralama potansiyeli taşıyabilir; bu sayfalar için müdahale kararı GSC verisine dayanmalıdır.
XML sitemap ve iç bağlantılardan parametreli URL’leri temizlemek de öncelikli adımlardan biridir. Sitemap’te veya iç linklerde yer alan parametreli URL’ler Googlebot’a otomatik tarama daveti gönderir; bu kaynağı kesmeden uygulanan canonical veya robots.txt kuralları yalnızca yarım önlem olur. Googlebot sitemap veya iç link üzerinden hedef URL’yi yeniden keşfedebilir.
| Özellik | Canonical | Noindex | Robots.txt Disallow |
|---|---|---|---|
| Taramayı durdurur mu? | Hayır | Hayır | Evet |
| Endeksten çıkarır mı? | Hayır (yetkiyi aktarır) | Evet | Hayır |
| Googlebot sayfayı okumak zorunda mı? | Evet | Evet (zorunlu şart) | Hayır |
| Zaten endekslenmiş sayfaları temizler mi? | Kısmen (sinyal gücüne bağlı) | Evet | Hayır |
| Birlikte kullanımda risk var mı? | Düşük | Orta — robots.txt ile çakışma riski | Yüksek — engellenen sayfada noindex okunamaz |
| En uygun parametre tipi | Sıralama, filtreleme | Sıralama, filtreleme, session ID | Session ID, izleme |
| Uygulama öncelik sırası | 1. adım | 2. adım | 3. adım |
Teknik Uygulama Sırası: Canonical → Noindex → Robots.txt
Üç tekniğin doğru sırayla ve doğru kombinasyonla uygulanması kritiktir. Yanlış sıralama, tarama bütçesini iyileştirmek yerine beklenmedik endeks sorunlarına yol açabilir. Google Developers’ın resmi teknik SEO dokümantasyonuna göre her teknik farklı bir katmanda çalışır ve birbirinin yerine geçmez.
1. Canonical etiketi — düşük riskli ilk adım: Parametreli URL’nin head bölümüne eklenen rel=canonical etiketiyle ana URL işaret edilir. Google, bunu bir öneri sinyali (hint) olarak değerlendirir; zorunlu direktif değildir ve Googlebot zaman zaman görmezden gelebilir. Düşük riskli olması nedeniyle her zaman ilk adım olmalıdır. Sinyal gücünü artırmak için canonical etiketi, iç bağlantılar ve XML sitemap aynı URL’yi işaret etmelidir; üçü çelişirse Google kendi kararını verir.
2. Noindex direktifi — endeks temizliği için ikinci katman: Canonical sinyali yeterli değilse veya sayfanın tamamen endeksten çıkarılması isteniyorsa meta robots noindex kullanılır. Kritik uyarı: robots.txt ile zaten engellenen bir sayfaya noindex eklemenin hiçbir etkisi yoktur. Googlebot, taramasını robots.txt engeli nedeniyle durdurduğunda sayfaya erişemez ve noindex direktifini okuyamaz — sayfa endekste kalmaya devam edebilir. Google Developers’ın noindex dokümantasyonu bu konuda açıktır: noindex’in çalışması için Googlebot’un sayfaya erişebilmesi şarttır.
3. Robots.txt Disallow — yüksek hacimli taramayı durdurma: Session ID ve izleme parametresi gibi hiçbir koşulda taranmaması gereken kalıplar için robots.txt tercih edilir. Disallow: /*?sid= formatıyla belirli parametre kalıpları engellenir. Bu kural taramayı durdurur; ancak zaten endekslenmiş sayfaları endeksten çıkarmaz — endeks temizliği için noindex veya URL kaldırma aracını ayrıca kullanmak gerekir. HTTP header üzerinden uygulama tercih ediliyorsa X-Robots-Tag: noindex aynı işlevi görür. 2026 itibarıyla GPTBot ve ClaudeBot gibi yapay zeka tarayıcıları için de ayrı User-Agent kuralları oluşturmak teknik SEO standartlarına girmiştir; AI bot görünürlük analizi yaparak hangi AI botlarının sitenizi nasıl taradığını izleyebilirsiniz.
E-Ticaret ve Faceted Navigation’da Özel Durumlar
Faceted navigation — yani ürün listeleme sayfalarındaki çok boyutlu filtreleme sistemleri — üstel URL üretiminin ana kaynağıdır. Her filtre kombinasyonu ayrı bir parametreli URL’ye dönüştüğünde canonical/noindex/robots.txt üçlüsü tek başına yeterli olmayabilir. Hangi filtre sayfalarının endekste kalması gerektiğini belirlemek için iki kriter geçerlidir: GSC’de organik tıklama alan kombinasyonlar ve dönüşüm değeri yüksek landing page işlevi gören filtre sayfaları.
JavaScript ile URL üretimini kısıtlamak daha köklü bir çözümdür. History API aracılığıyla oluşturulan hash fragment URL’leri Googlebot tarafından genellikle ayrı bir URL olarak değerlendirilmez; bu mimari parametre patlamasını önler. Ancak bu yöntem sitenin JavaScript rendering davranışına bağlıdır ve kapsamlı test gerektirir. Statik URL yapısına geçiş (/kadin/elbise/kirmizi/ formatı gibi) ise yüz binlerce parametreli URL barındıran ve sürdürülebilir bir canonical/robots.txt yönetiminin mümkün olmadığı büyük e-ticaret sitelerinde diğer tüm tekniklerden önce değerlendirilmesi gereken mimari karardır.
SEOYEN Site Sağlığı aracı, parametreli URL yığınlarını Türkçe arayüzle otomatik olarak tespit eder ve öncelikli müdahale gerektiren parametreleri raporlar. Ahrefs veya SEMrush gibi yabancı platformlar Türkçe arayüz, yerel destek ve TL bazlı fiyatlandırma sunmaz; SEOYEN bu açıdan özellikle Türkiye pazarındaki e-ticaret siteleri için erişilebilir bir teknik denetim alternatifi sunar.
Değişikliği Doğrulama: GSC Crawl Stats ve Log Karşılaştırması
Müdahale uygulandıktan sonra sonuçları ölçmek döngünün kritik halkasıdır. GSC URL Parametreleri aracının Eylül 2022’de kaldırılmasından bu yana tek doğrulama mekanizması GSC Crawl Stats raporu ve log analizi tekrarıdır. Crawl Stats’ta şu metriklere odaklanın: parametreli URL taranma oranının düşüp düşmediği; canonical URL’lerin taranma sıklığının artıp artmadığı; tarama hataları ve sunucu yanıt sürelerinin değişimi.
Müdahaleden 4-6 hafta sonra log analizini tekrarlayın; bu süre Googlebot’un yeni kuralları işlemesi için gereklidir. Eğer log’larda hâlâ yüksek oranda parametreli URL taraması görülüyorsa, iç bağlantı veya sitemap’te atlanmış kaynaklar Googlebot’a tarama daveti göndermeye devam ediyor olabilir; bu kaynakların tespit edilip kapatılması gerekir.
2025 sonu Google dokümantasyonuna göre crawl bütçesini artırmanın iki resmi yolu vardır: sunucu yanıt süresini kısaltmak veya içerik kalitesini yükseltmek. Parametreli URL israfını azaltmak bu iki yola dolaylı katkı sağlar; Googlebot boşa harcanan bütçeyi kaliteli sayfalara yönlendirir ve yeni içeriklerin indekslenme hızı artar. Bu nedenle tarama bütçesi optimizasyonu, salt teknik bir temizlik değil; organik görünürlüğü doğrudan etkileyen stratejik bir önceliktir.
Adım Adım: Parametreli URL Tarama Yükünü Teknik Sırayla Azaltma
- Sunucu loglarından Googlebot satırlarını filtrele: Access log dosyalarından Googlebot User-Agent satırlarını ayıklayın; parametreli URL’lerin hangi sıklıkla tarandığını frekans tablosuyla çıkarın. Bu tablo tüm müdahalenin temelini oluşturur ve uygulama sonrası doğrulama için referans noktasıdır.
- Parametreli URL’leri dört tipe göre sınıflandır: Sıralama, filtreleme, session ID ve izleme parametrelerini ayrı kategorilere ayırın; tarama bütçesine etkilerini ve organik değerlerini karşılaştırmalı olarak değerlendirin.
- Değerli ve değersiz URL ayrımı yap: GSC Performans raporunda organik tıklama alan parametreli URL’leri tespit edin. Trafik almayan URL’leri müdahale listesinin öncelikli sıralarına alın.
- XML sitemap ve iç bağlantılardan parametreli URL’leri temizle: Sitemap’te ve iç linklerde yer alan parametreli URL’leri kaldırın; Googlebot’a gönderilen tarama davetini kesin.
- Canonical etiketini önce uygula: Değersiz parametreli URL’lerin head bölümüne rel=canonical ile ana URL’yi işaret eden etiket ekleyin. Düşük riskli ilk adımdır; iç bağlantılar ve sitemap ile tutarlı olmasına dikkat edin.
- Endeksten çıkarmak istediğin sayfalara noindex ekle: Canonical sinyali yeterli değilse meta robots noindex kullanın. Robots.txt ile zaten engellenen sayfalara noindex eklemeyin; Googlebot direktifi okuyamaz.
- Robots.txt ile yüksek hacimli gereksiz taramayı engelle: Session ID ve izleme parametresi kalıplarını Disallow: /*?sid= formatıyla robots.txt’e ekleyin. Bu adımın endeks temizliği için tek başına yeterli olmadığını göz önünde bulundurun.
- GSC Crawl Stats ve log karşılaştırmasıyla doğrula: Müdahaleden 4-6 hafta sonra GSC Crawl Stats raporunu alın ve log analizini tekrarlayın; parametreli URL tarama oranındaki düşüşü ölçün.
Kaynaklar
Sıkça Sorulan Sorular
Tarama bütçesi, Googlebot'un belirli bir sürede bir sitede tarayabileceği maksimum URL sayısıdır. Google bu bütçeyi sitenizin sunucu kapasitesi ve içerik kalitesine göre belirler. Büyük sitelerde — özellikle e-ticarette — tarama bütçesinin büyük bölümü değersiz parametreli URL'lere harcanırsa gerçek ürün ve kategori sayfaları yeterince taranamaz. Bu durum yeni içeriklerin indekslenme süresini uzatır, güncellenen sayfaların Google'a gecikmeli yansımasına neden olur ve organik görünürlük kaybına yol açar. 2025 sonu Google belgelerine göre tarama bütçesini artırmanın iki resmi yolu sunucu kaynağı eklemek veya içerik kalitesini yükseltmektir.
robots.txt'te Disallow: /*?parametre= formatıyla belirli parametre kalıpları engellenebilir. Örneğin session ID için Disallow: /*?sid=, izleme parametreleri için Disallow: /*?utm_source= kuralları eklenir. Ancak bu yöntemin iki önemli sınırı vardır: yalnızca taramayı durdurur, zaten endekslenmiş sayfaları endeksten çıkarmaz. Endeksten çıkarma için noindex direktifi veya Google Search Console'daki URL kaldırma aracı gerekir. Ayrıca robots.txt ile engellenen bir sayfaya noindex eklemenin hiçbir etkisi olmaz. Googlebot engellenen sayfaya erişemeyeceği için direktifi okuyamaz.
Parametreli URL'nin HTML kaynak kodunun head bölümüne rel='canonical' href='https://example.com/ana-sayfa/' etiketi eklenir. Bu etiket Google'a sayfanın yetkili versiyonunun ana URL olduğunu bildirir. Google, bunu bir öneri sinyali olarak değerlendirir. zorunlu bir direktif değildir ve zaman zaman görmezden gelebilir. Canonical sinyalini güçlendirmek için XML sitemap yalnızca ana URL'leri içermeli, iç bağlantılar parametreli versiyonları değil canonical URL'yi işaret etmelidir. Bu üç sinyalin tutarlılığı Google'ın canonical tercihini doğrulama olasılığını artırır.
İki teknik birbirinden farklı amaçlara hizmet eder. Canonical etiketi sayfayı endekste bırakır ancak sayfa yetkisini başka bir URL'ye aktarır. Googlebot sayfayı taramaya devam eder. Noindex etiketi ise sayfanın arama sonuçlarına hiç alınmamasını sağlar. içeriği tamamen endeks dışı bırakır. Kritik fark: noindex direktifinin çalışması için Googlebot'un sayfaya erişebilmesi şarttır. Robots.txt ile engellenen bir sayfaya noindex eklenirse Googlebot sayfayı okuyamaz ve direktif işlevsiz kalır — sayfa endekste kalmaya devam edebilir. Bu nedenle robots.txt engelini kaldırmadan önce sayfanın endeksten çıkıp çıkmadığını doğrulamak gerekir.
Aynı içeriği farklı URL'ler üzerinden sunan yüzlerce veya binlerce parametreli URL, Googlebot tarama bütçesini orantısız biçimde tüketir. E-ticarette filtre kombinasyonları bu sorunu üstel boyutlara taşır: 50 ürün ve 20 filtre seçeneği teorik olarak milyonlarca URL üretebilir. Googlebot bu URL'lerin her birini ayrı sayfa olarak taradığında gerçek ürün ve kategori sayfalarına ayrılan bütçe azalır. Sonuç: yeni eklenen ürünler geç indekslenir, güncellenen içerikler Google'a yavaş yansır. Session ID parametreleri en büyük israfı yaratır çünkü her kullanıcı oturumu için benzersiz URL üretilir ve kombinasyonların sonu yoktur.
Sunucu log dosyaları, Googlebot'un sitenizde gerçekte hangi URL'leri ne sıklıkla taradığını gösteren en güvenilir veridir. Access log'lardan Googlebot User-Agent satırları filtrelenerek parametreli URL'lerin taranma frekans tablosu çıkarılır. Bu tablo şu soruları yanıtlar: Hangi parametre kalıpları en sık tarânıyor? Bu parametrelerin organik değeri var mı? Canonical veya robots.txt uygulaması sonrasında tarama davranışı değişti mi? Log analizi yapılmadan uygulanan müdahaleler yalnızca görünür parametreleri hedefler. Googlebot'un hâlâ taradığı gizli kalıplar kör noktada kalır. Screaming Frog Log Analyser bu süreci görselleştirmek için yaygın kullanılan araçlardan biridir.
Faceted navigation, kullanıcıların ürünleri renk, beden, fiyat aralığı gibi birden fazla filtre ile daraltmasını sağlayan gezinme sistemidir. Her filtre kombinasyonu ayrı bir parametreli URL'ye dönüşürse crawl bütçesi hızla tükenebilir. Öte yandan bazı filtre kombinasyonları gerçek arama hacmi taşıyabilir ve endekste tutulması faydalı olabilir. Önerilen yaklaşımlar şunlardır: JavaScript ile URL üretimini kısıtlamak veya History API kullanmak. değerli filtre kombinasyonlarına canonical uygulamak. değersiz kombinasyonları robots.txt ile tarama dışı bırakmak. Büyük kataloglarda statik URL yapısına geçiş bu sorunun en köklü ve sürdürülebilir çözümüdür.