robots.txt 714 B

123456789101112131415161718192021222324252627282930313233343536
  1. # Robots.txt pour feeds.duhaz.fr
  2. # Mise à jour: 2025-01-14
  3. # Regles pour les principaux moteurs de recherche
  4. User-agent: Googlebot
  5. Allow: /
  6. Disallow: /auth
  7. Disallow: /gone
  8. User-agent: Bingbot
  9. Allow: /
  10. Disallow: /auth
  11. Disallow: /gone
  12. # Bots des reseaux sociaux (pour les previews)
  13. User-agent: Twitterbot
  14. Allow: /
  15. User-agent: facebookexternalhit
  16. Allow: /
  17. User-agent: LinkedInBot
  18. Allow: /
  19. # Regles par defaut pour tous les autres bots
  20. User-agent: *
  21. Allow: /
  22. Disallow: /auth
  23. Disallow: /gone
  24. # Note: /flux/ et /account/ redirigent vers /gone (HTTP 410) donc pas besoin de les bloquer
  25. # Crawl delay pour eviter la surcharge serveur
  26. Crawl-delay: 1
  27. # Sitemap principal
  28. Sitemap: https://feeds.duhaz.fr/sitemap.xml