Je suis dans l'IT depuis assez longtemps pour connaître la valeur des données personnelles. Il s'agit de données très précieuses pour les entreprises, leur permettant de cibler toujours plus efficacement leur public.

J'ai travaillé durant 3 ans pour Médiamétrie qui, en France, réalise des études et sondages pour les entreprises ainsi que la plupart des mesures d'audiences pour les chaines de télévision et les radios.

Ce qui ressortait des études est souvent la même chose, ce qui est intéressant n'est pas la masse, c'est la CSP (Catégorie socio-professionnelle). Savoir que TF1 à fait 12% d'audience la veille est une information, savoir que les "personnes responsables des achats" (de mémoire, nom commercial pour "homme/femme au foyer") de 30 à 40 ans représentaient 26% des parts de marché est bien plus précieux.

Cibler efficacement

Pourquoi cette donnée est plus précieuse? Elle est plus précise et permet de faire un ciblage produit plus efficace pour attirer toujours plus de monde.

J'ai pris l'exemple de la télévision, mais ce modèle s'applique à peu près à n'importe quel bien ou service.

Moi-même, je fais une analyse des logs du serveur pour déterminer comment vous arrivez sur ce site, et quels sont les articles qui sont les plus lus. Cela me permet de produire plus d'articles de qualité qui intéressent mes lecteurs.

Avoir des données précises sur son audience est une information primordiale pour pouvoir améliorer son produit. Et plus on en a d'information, mieux c'est! Par exemple, savoir qu'un lecteur qui est allé sur le site 20minutes après avoir été sur LeMonde (par exemple) est une information importante, tout autant que savoir qu'il s'agit d'un instituteur de 34 ans!

Bloquer le tracking

J'en entends déjà au fond me dire "oui, mais je m'en fous, je bloque le tracking", et vous avez raison! Moi-même j'utilise le navigateur open source Brave, basé sur Chromium, mais avec du blocage publicitaire/tracking natif (et de l'upgrade https).

Quand on voit la quantité de trackers bloqués, on se demande tout de même si certains sites n'abusent pas un peu tout de même...

Et encore, certains ne sont pas dans cette liste.

Donc, vous bloquez le tracking, très bien, mais pourtant, vous êtes toujours suivis.

Outre le fait que c'est le jeu du chat et de la souris entre le tracking et son blocage, il est aussi possible de passer par d'autres solutions, comme le fingerprinting. Cette méthode consiste à extraire certaines données envoyées par votre navigateur pour obtenir des informations permettant d'identifier de manière unique le périphérique que vous utilisez.

Plusieurs études ont démontré ces dernières années qu'il était possible d'identifier de manière simple un navigateur. Vous pouvez vous rendre par exemple sur https://amiunique.org/

Vous verrez ainsi les informations envoyées par votre navigateur et la facilité avec laquelle il est possible de suivre votre usage d'Internet sur ce navigateur.

Comme vous pouvez le voir dans la capture d'écran ci-dessus, mon empreinte est unique parmi plus de 2 millions!

La sécurité des données

Je disais plus tôt que les données sont précieuses pour les entreprises (et les annonceurs), mais ce sont aussi des données parfaites pour un pirate!

Outre le fait qu'il est possible de rapprocher des données pour avoir un nom/prénom/adresse mail derrière un utilisation, connaître l'utilisation d'Internet permet de faciliter le hacking social dont j'ai déjà parlé il y a quelque temps.

En effet, quand je reçois du phishing Free alors que je suis abonné Orange par exemple, j'identifie immédiatement le phishing. Par contre, si je reçois un mail cohérent avec mon historique, il va être plus compliqué de séparer le bon grain de l'ivraie.

Certaines entreprises qui collectent ces données ont déjà été la cible de piratages et sont des cibles de choix vu la valeur des données qu'elles ont.

L'impact sur les performances et le réseau mondial

Dans l'exemple que j'ai cité plus haut (Le site web 20minutes), on voit plus d'une vingtaine de trackers présents sur le site, outre l'intrusion énorme dans la vie privée, cela représente aussi un énorme impact sur les performances du navigateur ou sur le réseau global.

En effet pour pouvoir mettre à disposition ces trackers, on va créer des serveurs, des CDN (pour optimiser les flux réseau), des bases de données etc... et donc générer beaucoup de flux réseau côté serveur, qui ont un coût non négligeable, qu'il soit humain ou sur notre planète, mais cela à aussi un coup sur le processeur, la ram ou le réseau de l'utilisateur final.

A titre d'exemple, voici le chargement de la page d'accueil du site 20minutes avec et sans le tracking, avec un PC largement suffisant pour naviguer sur internet (Intel i7 8700k + 16Go de Ram à 4GHz) et une connexion fibre 1G.

Sans tracker :

Avec tracker :

Comme vous le voyez, on arrive à une augmentation du trafic réseau nécessaire de 45%, pour afficher le même contenu!

A l'heure on l'on demande à Netflix ou YouTube de réduire son trafic réseau, il serait peut-être temps de réduire aussi l'impact du tracking, la balle est dans le camp des entreprises!

Mon point de vue

De mon côté, je suis conscient que le tracking est nécessaire pour améliorer son audience et toucher un public plus large, et je dirais même qu'il est parfois nécessaire pour qu'une entreprise ne se trompe pas en mettant en place de nouveaux produits.

Néanmoins, tout comme pour les publicités, je suis d'avis qu'il est nécessaire de rationaliser ces trackings pour obtenir des données plus simples, moins intrusives et en limitant le nombre de trackers par page, arriver à 20 chargements pour du tracking dans une page web devient juste aberrant!

Il existe aussi des solutions de processing côté serveur, qui permettent aussi d'extraire beaucoup d'informations sans être impactant sur l'utilisateur, et en respectant sa vie privée.

Et vous qu'en pensez vous ?