Évolution du trafic de données : explosion des volumes et hyperconcentration des acteurs

Le trafic de données entrant en France ne cesse d’augmenter, s’établissant à plus de 43Tbit/sec fin 2022, soit une hausse de 21,5% par rapport à fin 2021. Trafic qui se concentre de plus en plus autour de quelques acteurs : les 5 principaux représentent ainsi 54% du trafic. Partons à la découverte du dernier baromètre de l’ARCEP pour mieux comprendre l’interconnexion des données.

On entend souvent dire que la donnée est l’or noir du 21e siècle. Mais sait-on vraiment ce qu’on range derrière l’étiquette de données ? Et comment l’échange de ces données est organisé ? Nous profitons de la dernière publication du baromètre de l’ARCEP (Autorité de régulation des communications électroniques, des postes et de la distribution de la presse) pour plonger au cœur de l’interconnexion des données.

Qu’est-ce que la donnée ?

Si on se réfère à ce cher Wikipédia pour une première définition générique, une donnée est ce qui est connu et qui sert de point de départ à un raisonnement ayant pour objet la détermination d'une solution à un problème en relation avec cette donnée, soit en d'autres termes une observation ou une mesure. Plus précisément dans le domaine informatique, la donnée est la représentation d’une information dans un programme, pouvant être conservée et classée sous différentes formes : textuelles (chaîne), numériques, images, sons, etc.

Comment fonctionne l’interconnexion des données ?

L’interconnexion des données, c’est le fondement d’internet. C’est la relation qui s’établit entre différents acteurs pour l’échange de données afin de garantir le maillage global du réseau permettant à nous autres utilisateurs de communiquer entre nous au travers d’internet. Et c’est un écosystème qui implique différents acteurs, comme on peut le voir ci-dessous :

 

 

 

 

 

 

Comme dans d’autres secteurs auparavant, on observe une tendance à la convergence des acteurs, avec de nombreux cas d’intégration verticale: les fournisseurs d’applications comme Google et Facebook mettent en place leurs propres infrastructures réseaux comme nous l’évoquions dans un précédent article), les FAI créent du contenu qu’ils diffusent sur leur propre plateforme, etc…

Plusieurs enjeux sont liés à cette interconnexion : en effet, les différents acteurs peuvent avoir des intérêts divergents, et des tensions entre ces acteurs pourraient être à l’origine d’une dégradation de la qualité du service ou même une rupture dans l’interconnexion des données ce qui engendrerait une impossibilité, partielle ou complète, d’accès aux contenus et applications pour les utilisateurs.

De même, ces interconnexions pourraient être à l’origine de décisions discriminantes à l’égard de certaines sources, contenus ou destinations.

Évolution du trafic de données

On différencie deux types de trafic au niveau des fournisseurs d’accès à Internet : le trafic entrant et le trafic sortant. Le trafic entrant correspond aux données qui proviennent du réseau externe vers le FAI (les données que les utilisateurs du FAI souhaitent obtenir). Le trafic sortant correspond aux données provenant du réseau du FAI et qui sont dirigées vers le réseau externe (Les données transmises par les utilisateurs)..

Le trafic entrant vers les quatre principaux FAI français (Bouygues, Free, Orange, SFR) a atteint un nouveau record fin 2022 à 35,6 Tbit/s, soit une augmentation de près de 22% en un an. Le trafic était d’environ 2,5Tbit/s dix ans plus tôt, en 2012. 

 

 

 

 

 

 

 

 

 

 

Le trafic sortant s’établit lui à 3,8Tbit/s. L’asymétrie entre trafic entrant et sortant a très nettement augmenté sur la même période, passant de 4 fois plus de trafic entrant en 2012 à 11 fois plus en 2022. La cause ? L’augmentation du contenu multimédia consulté par les utilisateurs (streaming vidéo et audio, téléchargement de contenu de grande taille, etc..)

Répartition du trafic 

En raison du recours à des CDN (Content Delivery Network, réseaux de diffusion de contenu en Français) par les fournisseurs de contenus, pour répliquer localement les données et offrir ainsi un service plus performant, il est difficile pour l’ARCEP d’avoir des données précises sur l’origine de tous les flux, si ces usages ne font pas l’objet d’une interconnexion directe déclarée entre les 2 acteurs. Cela implique que l’ARCEP réalise des estimations sur la base des données disponibles et que le volume des données rattachées à des CDN provient de fournisseurs de contenu dont l’origine est inconnue.

Sur la base de ces estimations, le rapport identifie 5 acteurs principaux qui concentrent 54% du trafic : 

  1. Netflix - 19,7 %

  2. Google - 10,5 %

  3. Akamai (CDN, notamment pour Disney+) - 8.9%

  4. Meta - 8.2%

  5. Amazon - 7 % 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

On remarque notamment le fossé entre Netflix et les autres fournisseurs de contenus, avec près de 1/5e du trafic français.

Tout ceci doit forcément nous interroger sur l’influence grandissante de ces acteurs dans notre société. 

Et cela nous éclaire également sur l’impact de nos usages au quotidien : on constate clairement que le streaming vidéo et les réseaux sociaux concentrent la majeure partie des données échangées aujourd’hui, qui continuent d’augmenter de manière exponentielle. Et cette augmentation implique d’installer un réseau toujours plus puissant pour supporter ce trafic, avec des impacts matériels et donc environnementaux bien réels.