W3C : 130 millions de DTD, et moi, et moi, et moi...

Le W3C, organisme qui définit les normes d'Internet, lance un cri d'alarme : il ne pourra bientôt plus servir toutes les demandes de DTD et de Schémas XML...

Petit rappel : la plupart des documents échangés sur Internet (pages HTML, flux RSS...) sont en réalité de simples textes bruts agrémentés de balises. Mais pour pouvoir déchiffrer ces balises et afficher correctement les documents, différents logiciels (navigateurs web, agrégateurs de flux...) ont besoin de savoir exactement quelle norme respecter. C'est précisément le rôle des "DTD" et des "Schémas XML" dont une référence se trouve normalement en entête des documents.

Par exemple, si vous regardez le code source de cette page (clic droit -> voir source), vous verrez :

  1. <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
  2. <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr" lang="fr">
  3. ...

Nous voyons ici de nombreuses références au site "w3.org", qui héberge les définitions de la majorité des normes utilisées sur Internet.

Ces normes, une fois publiées, ne sont plus jamais modifiées ; il est donc inutile d'aller en lire les spécifications à chaque affichage de document. Pourtant, certains logiciels (par exemple le lecteur de flux RSS de Microsoft) effectuent systématiquement cette requête, engendrant un important trafic réseau inutile et engorgeant les serveurs du W3C.

De nombreux mécanismes permettent pourtant d'éviter cette situation : mise en cache des DTD, utilisation de DTD locales, vérification des dates de validité des ressources distantes... Mais ils sont rarement mis en place par les éditeurs logiciels et les développeurs d'applications sur Internet, probablement par ignorance des conséquences.

Le W3C approche aujourd'hui du point de rupture, servant plus de 130 millions de DTD par jour. Et menace de prendre des mesures coercitives si une prise de conscience collective n'émerge pas rapidement : banissement des plus gros requêteurs, limitation des bandes passantes...

Avis aux développeurs donc : l'avenir d'Internet est entre vos mains.


Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.