Google’dan Gary Illyes, robots.txt kurallarını CDN’lerde merkezileştirmek için alışılmadık ama geçerli bir yöntem paylaştı. Robots.txt dosyaları sadece kök alan adlarında değil, CDN’lerde de merkezileştirilebilir. Web siteleri, ana alan adlarından robots.txt dosyasını CDN’ye yönlendirebilir. Bu alışılmadık yaklaşım, güncellenmiş standartlara uygundur.
Google Analisti Gary Illyes, LinkedIn’de yaptığı bir paylaşımda, robots.txt dosyalarının yerleştirilmesi konusundaki uzun süredir devam eden bir inancı sorguladı. Yıllardır, bir web sitesinin robots.txt dosyasının kök alan adında (örneğin, example.com/robots.txt) bulunması gerektiği düşünülüyordu. Ancak Illyes, bunun mutlak bir gereklilik olmadığını ve Robots Dışlama Protokolü’nün (REP) daha az bilinen bir yönünü açıkladı.
Robots.txt Dosyasının Esnekliği
Robots.txt dosyasının kök alan adında bulunması gerekmez (example.com/robots.txt). Illyes’e göre, farklı alan adlarında barındırılan iki ayrı robots.txt dosyasına sahip olmak mümkündür—biri ana web sitesinde, diğeri ise bir içerik dağıtım ağında (CDN). Web siteleri, robots.txt dosyasını CDN’de merkezileştirirken ana siteleri için tarama kontrolünü sürdürebilirler. Örneğin, bir web sitesi https://cdn.example.com/robots.txt ve https://www.example.com/robots.txt adreslerinde iki robots.txt dosyasına sahip olabilir. Bu yaklaşım, ana alan adından bu merkezileştirilmiş dosyaya yönlendirme yaparak tek, kapsamlı bir robots.txt dosyasını CDN’de tutmanıza olanak tanır. RFC9309’a uyan tarayıcılar, yönlendirmeyi takip eder ve orijinal alan adı için hedef dosyayı robots.txt dosyası olarak kullanır.
Bu Bilgi Size Nasıl Yardımcı Olabilir?
Illyes’in rehberliğini takip etmek şu şekillerde size yardımcı olabilir:
Merkezi Yönetim: Robots.txt kurallarını tek bir yerde toplayarak, web varlığınız genelinde tarama direktiflerini güncelleyebilir ve sürdürebilirsiniz.
Geliştirilmiş Tutarlılık: Robots.txt kuralları için tek bir kaynak, ana siteniz ve CDN’niz arasında çelişen direktifler riskini azaltır.
Esneklik: Bu yaklaşım, özellikle karmaşık mimarilere sahip siteler veya birden fazla alt alan adı ve CDN kullananlar için daha uyarlanabilir yapılandırmalar sağlar.
Robots.txt dosyalarını yönetmek için daha düzenli bir yaklaşım, hem site yönetimini hem de SEO çabalarını iyileştirebilir.
Kaynak: https://www.searchenginejournal.com/you-dont-need-robots-txt-on-root-domain-says-google/521382/