Souriez, vous êtes enregistrés... et rejouable à volonté
Le 28 août 2007, à 18:20 par Ulhume...

Dans un précédent billet je vous parlais de Google Analytics, un outil que 60% des sites utilisent et qui trace votre parcours sur la toile. Dans la mesure où ces traceurs sont des scripts, on pouvait s'inquiéter des dérives de ce phénomène. Pourquoi en effet s'arrêter à si peu d'information lorsque l'on dispose de beaucoup plus dans la page (login, mot de passe, etc...). Paranoïac ? Pas tant que cela, car vous allez le voir ce scénario est en réalité bien loin d'être une fiction.

Un traceur est un javaScript qui est intégré par le webmestre dans sa page web. De nombreuse sociétés, dont Google, fournissent gratuitement de tels scripts. Mais la gratuité n'étant qu'une gentillette façade, il faut bien comprendre que l'avantage de ces sociétés est de capter le plus grand nombre de sites pour ensuite fournir des profiles d'utilisateurs les plus fin possibles aux divers services marketing prêt à payer cher pour cela. Du côté du webmestre, il y a surtout la naïve satisfaction de voir les statistiques de ses sites sous la forme de beaux graphiques 3D. Et rares sont ceux qui mettent le nez dans ces scripts pour voir ce qu'ils font exactement. Pourtant un script, dans le périmètre certes restreint d'un site web, fait à peu près ce qu'il veut, y compris espionner le moindre de vos comportements.

Un exemple concret pour tel script est fournit par le site robotreplay. Son rôle ? Enregistrer absolument tout ce que vous faites sur le site où il est intégré de sorte à permettre, plus tard, au webmestre de pouvoir rejouer à volonté le film de votre visite. Cela comprends les mouvements que vous avez fait avec votre souris, les temps de pause, les touches que vous avez pressées, les liens sur lesquels vos avez cliqués, absolument tout est enregistré minutieusement consignés dans les serveurs... du site RobotPlay. Les bases de données de Robotplay contiennent ainsi en plus de votre IP, tout ce que vous avez pu faire dans les moindres détails sur tous les sites qui l'auront intégré, des simples commentaires que vous avez ajoutés, aux mots de passe que vous avez tapés.

Parler en l'espèce de véritable honte est un doux euphémisme et les webmestres qui utilisent ce script sont aussi inexcusables qu'irresponsables. Inexcusables car c'est aller bien trop loin dans le traçage, et irresponsables car ils laissent ces données partir on se sait où dans les poches d'on se sait qui.

Pour bloquer ce machin avec adBlock ou sur privoxy, vous devez rajouter le pattern suivant :

*.robotreplay.com/*

Commentaires

Martin , le 28 August, 2007 - 19:10

J'ai essayé ce script dans l'espoir d'étudier le comportement des visiteurs de mes sites dans le but d'en améliorer l'ergonomie. Personnellement, je n'ai que faire de la vie privée de mes Internautes dans le sens de "elle ne m'intéresse pas" ; je n'envisage donc pas d'en faire un usage au cas par cas.

Ce qui m'intéresse en revanche, c'est d'améliorer l'ergonomie de mes sites, à savoir comprendre si les visiteurs ont tendance à davantage cliquer sur les liens situés à gauche ou à droite de la page, de telle ou telle couleur, ou encore comment ils exploitent le contenu des pages qui s'affichent : lisent-ils juste le titre ? l'introduction ? s'intéressent-ils aux images associées ? Voici des informations pertinentes qui permettent d'améliorer la navigation sur le site. Connaître l'adresse IP de chaque visiteur n'est pas pertinent au-delà d'une information géographique.

Pourquoi l'information géographique ? Parce qu'elle détermine le comportement. Notre culture est liée à celle du pays où nous résidons, et un visiteur parlant pourtant la même langue n'a pas forcément le même comportement quand il réside en France, au Maroc, ou au Québec. Pouvoir identifier son origine permet de lui présenter un contenu plus approprié à ces centres d'intérêt présumés, et donc de lui faire gagner du temps.

Scandaleux ? Irresponsable ? Je dirais plutôt : efficace et respectueux.

Ce qui est dommage, c'est que l'absence d'analyse sythétique des données récoltées par RobotReplay ne permet pas une exploitation efficace des informations saisies. Car entre nous, je me moque bien de savoir que l'utilisateur de l'adresse IP 1.2.3.4 fait des ronds avec la souris alors que celui de l'adresse IP 4.3.2.1 se promène en zigzag. Ce qui m'intéresse, en revanche, c'est de savoir si l'un ou l'autre de ces deux comportements est exceptionnel ou représentatif de l'ensemble des utilisateurs, ou du moins d'une partie représentative d'entre eux. Or, cela, RobotReplay ne le permet pas. Malheureusement.

Dab, le 28 August, 2007 - 22:35

Je trouve cela plutôt préoccupant, encore que dans le cadre de l'amélioration ergonomique d'un site cela puisse se concevoir si les visiteurs en sont suffisament informés. Mais j'ai bien peur que ce genre de pratique se généralise.

malic , le 29 August, 2007 - 09:57

Martin,

Le soucis, je pense, est qu'en délégant l'enregistrement et le traitement des informations "comportementales" à un société tierce telle que Robotreplay ou google-analytics, tu n'as aucun contrôle sur l'utilisation des informations qu'ils vont en faire.

Si pour toi les mouvements de souris n'ont pas d'utilité, cela peut en avoir pour d'autres et ceux-ci payent pour...

Le coté irresponsable est de donner des informations sur tes utilisateurs à une société tierce sans se poser la question de ce qu'ils vont en faire (au dela de ce qu'ils ont le droit de faire).

Zimzag , le 3 September, 2007 - 15:02

Personne n’aime être espionné.
Cette peur vient du fait que l’on ignore les informations que l’on communique et a qui.

Imaginez que les internautes pourraient espionner le webmaster grâce a un script dans le navigateur. Connaître combien d’heures il a passé a faire son site, avec quels logiciels, la date et l’heure de frappe pour chaque touche et se repasser tous les mouvements de souris. Mieux encore, l’internaute pourrait obtenir des informations que le webmaster ne soupçonne même pas.
Si le webmaster espionne pour augmenter ses ventes. L’internaute lui, ça serait pour acheter avec la conviction qu’il est sur un site de qualité. La place de l’espionné n’est jamais agréable.

Même si il n’y a pas violation de la vie privé car nous ne sommes pas identifiés. Pensez a ceux qui se connectent sous leur compte google avec des vrais informations personnelles et qui se font récupérer leur ip et deviennent traçable même en vidant les cookies. Sans parler de ceux qui ont une ip statique. Entre spock, earth, le réferencement de site et maintenant analytics, il est clair que google souhaite fichier chaque client et devenir l’intermédiaire indispensable entre le client et le vendeur.

Moi ce qui me gène, ce n’est pas tellement que je devienne le cobaye d’une étude comportementale, mais plutôt la vitesse avec laquelle l’informatique fait progresser ses sociétés de collecte sans scrupules. Si il n’y avait que ça... n'oubliont pas les gouvernements qui vendent notre ADN (les îles Tonga, l’Islande, tous les militaires américains), et maintenant on est suivi a la trace et identifié avec les puces RFID dans le métro.

Les gens ont le droit de savoir quels types d’informations ont leur usurpe et dans quel but.
Sinon on est parti pour un « Bienvenue a Gattaca » et google s’y voit déjà avec la bonne place.

Ulhume, le 3 September, 2007 - 17:57

Il y a un grand mélange des genres dans ce que tu nous apportes là, même si l'idée fondamentale est là même et que ton inquiétude, je la comprends. Mais même si l'esprit des techniques est le même, il est important de faire le distingo pour éviter que l'amalgame ne soit contre-productif.

Mais là où je te rejoins c'est que du "vendre plus sûr" au "vivre plus sûr", une même idée commune transparaît, celle de l'absolue sécurité. On sort un peu du débat technique mais il me semble certain que notre société s'enfonce sous ce règne de réduction systématique des "aléas" qui entraîne en toute logique une toute aussi systématique réduction des libertés.

L'erreur devient la règle en quelque sorte. Si certains volent de la musique, nous mettrons des DRM pour tous. Si certains volent leur titre transport, tous utiliserons Navigo. Si certains tuent et violent, tous seront fichés par leur ADN, même pour de simple délits. Si certains volent et braquent, tous seront filmés 24h sur 24. Tout pourvu que le "sentiment de sécurité" augmente. Il n e faut pas être aveugle, j'en connais certains ce sont fait élire sur ces idées là. La preuve s'il est besoin que nombre d'entre "nous" s'y retrouvent. Car au fond, comment contester l'argument ultime "Si vous n'avez rien à vous reprocher, vous n'avez rien à craindre".

Mais je m'égare Wink En tout cas, si tu veux, tu peux aller jeter un oeil sur notre autre site qui est plus axé sur ce genre de sujet : http://moutons.karma-lab.net

Zimzag , le 5 September, 2007 - 10:13

Y aussi l’extension firefox adblock plus
http://extensions.geckozone.org/AdblockPlus/
La liste des sites a bloquer est remplie par une communauté et mise a jour automatiquement.

Je rappelle aussi que si vous n’avez pas d'ip fixe, pensez a redémarrer de temps en temps votre machinbox, histoire de renouveler votre ip. Sinon quand vous vous identifiez sur un site et qu’il remarque que vous avez la même ip que la dernière fois, il en déduira que c’était vous pendant l'intervalle.

Ulhume, je fini vite par un "petit" hors sujet pour t'expliquer plus précisément la nature de mon inquiétude sur ces avancées techniques dans l’espionnage de la vie privée.
Tout ce système n'a pas pour simple but d'étudier notre comportement, ça ne leur suffit plus. L'unique but est bien réellement de le modifier.
Notre comportement doit être prévisible, standardisé, uniformisé, les choix nous sont volontairement limités. J'espère me tromper sur l'avenir, mais quand on voit le poids de la CNIL ses dernières années on imagine mal qui pourrait empêcher qu'un jour plus personnes ne soit anonyme sur le net. C'est ce que veulent les sociétés de marchandising et je ne doute pas une seule seconde sur leur chance de succès.

Mais le plus grave ce n'est pas d'être fiché, étudié et conditionné par des multinationales. Avec l'émergence des nouvelles technologies et le tout sécuritaire, un contrôle total et immédiat de l'état ne fait plus partie des phantasmes de quelques paranos sur le net en manque de science fiction. Nous autres vivants en démocratie risquons au pire notre emploi. Par contre je plains ceux vivant dans un pays de dictature (Corée du nord, Libye, Chine, j'en passe y en a trop ....). Ceux la vont bien le sentir passer... le progrès technologique.

Opposant au pouvoir ?
- ha oui ! t'as dis ca ... y a 6 mois sur un forum avant le changement de gouvernement.

Anonymat ?
- interdit !

Tu veux fuir ?
- bah non plus, on vient te chercher, même que l'ordinateur nous a calculé le chemin le plus rapide !

Tout ça pour dire que l’espionnage de la vie privé, c’est surmontable, tant qu’on reste en démocratie. La démocratie ça se gagne et se mérite tous les 5 ans, c’est un combat et il n’est jamais gagné d’avance. C’est la que se situe l’essentiel de mon inquiétude.

Je finirais sur les médias avec les quelques lignes de Chomsky que j'ai copier/voler sur wikipédia :
<< Chomsky s’attache à mettre en évidence les processus par lesquels les médias tendent à enfermer les sociétés démocratiques dans un carcan idéologique. Sa critique porte sur le fonctionnement global de l'institution médiatique dans ses rapports avec les pouvoirs économique et politique. Chomsky montre comment les médias noient la masse électorale sous un flot d’informations beaucoup trop dense pour servir de support de réflexion et qui converge, en définitive, vers des analyses à sens unique, fondées sur des présupposés que l’on évite soigneusement de remettre en question >>

Ulhume, le 5 September, 2007 - 11:12

Pour AdBlock, la communauté ne se concentre, à ma connaissance, que sur des publicités. La version que j'ai testée ne comprenait pas le filtrage des web/Googlle/etc.. analytics. D'où les règles ajoutés ici ou la solution \"full metal jacket\" exposée ici.

Concernant l'IP, pour beaucoup d'entre nous, ce n'est pas vraiment possible. C'est de la "vraie" IP fixe (wanadoo pro, Free, etc..). En revanche, il existe des projets comme TOR qui permette de se créer un certain anonymat.

Pas de problèmes pour le hors sujet, j'en suis friand Smiling Je suis bien d'accord sur ce que tu dis même si je continue à préférer faire un distingo entre politique (fichage ADN, télésurveillance, etc..) et marketing (profiling & co.). concernant le dernier point, tu devrais jeter un oeil aux travaux en neuro marketing... Je suis sur que cela va te plaire.

freeflyer, le 5 September, 2007 - 11:30

Et adblock plus ne bloque pas acces ip faits par les applets flash/java

Ulhume, le 5 September, 2007 - 12:05

Oui, ça c'est un gros avantage de Privoxy. Car il y a de plus en plus d'applets flash utilisé pour les pubs et le traçage justement pour contourner AdBlock.

Ulhume, le 8 September, 2007 - 18:48

J'en ai trouvé d'autre, moins évolué mais beaucoup plus utilisés pour ceux que cela intéresse :

.clicktale.* # http://www.clicktale.com/faq.html
.cetrk.com/* # http://crazyegg.com/overview

Mose , le 12 September, 2007 - 11:03

Alors juste histoire de rigoler un coup sur la protection de la vie privée :

* y'a environ 5 ou 6 ans, google était montré du doigt pask'il était le premier site à coller un cookie à durée de vie illimitée sur nos ordis.
Tout le monde criait à l'espionnage individuel et citait "minority report".

* J'ai la flemme de faire la liste colossale des "violations de vie privée" qui ont été mis en place suite à ça, mais je suis sûr qu'un site les recense.

* J'ai encore plus la flemme de lister les violations de vie privée qui ont eu lieu avant, on n'en trouve pas beaucoup de trace, ça commence avant le début de l'ère enregistrée, ère commençant avec la démocratisation d'internet. Tout ce qui a eu lieu avant est très peu présent sur la toile et nombreux sont ceux qui cherchent encore le Ctrl+F sur les encyclopédies analogiques (en papier, oui oui).

* A titre d'info, j'ai souvenir de quelqu'un qui était scandalisé par le protocole TCP-IP parce qu'une adresse unique sur le réseau c'était un moyen d'identifier quelqu'un et donc de tracer son activité en sniffant les paquets (y'avait pas encore les IP dynamiques à l'époque).
Quand on y pense, c'est vrai : être présent sur un réseau c'est accepter la tracabilité.

* Donc aujourd'hui quand le grand vilain google (qui est vilain pask'il est super riche, soyons honnète) nous trace, que craignons nous ?
Bein pas grand chose : google c'est tenu par des américains qui comprenne pas le français. Dans la masse d'information inimaginable qui transite chez eux, voir un espionnage individuel c'est assez risible : comment (et pourquoi) croisez toutes ces infos pour espionner quelqu'un ?
Vous vous sentez espionné ? Allez dans un cyber café et créez-vous un mail gratuit : vous êtes un nouvel utilisateur complètement anonyme (on sait juste où vous etiez physiquement à un temps T)

* Comme beaucoup d'entre vous, j'était très partisan dans la lutte pour la vie privée, mais j'ai changé quand j'ai vu des petites jeunes n'en avoir rien à cirer, créer des dizaines de comptes et de mails à la volée, et finalement se protéger derrière la meilleure barrière qui soit : noyé dans une masse d'informations telle que même une machine à du mal à la traiter.

* Après on pourra dire que j'ai jeté l'éponge et renoncé. Non non non : j'utilise des mails jetables comme tout le monde pour brouiller les pistes. En revanche, j'en ai pas grand chose à cirer qu'on me trace. Bien au contraire : il n'y a pas de meilleur anonymat que d'avoir l'air de se comporter comme tout le monde. Mon IP à la maison n'est pas la même que celle de mon travail, et je ne consulte pas les mêmes sites sur les deux machines. Je défie donc google de faire le rapprochement Wink (pour en faire quoi d'ailleurs ??)

Ulhume, le 12 September, 2007 - 18:28

Sans vouloir t'offenser, tu mélanges tout Smiling Pour moi il y a l'anonymat sous l'angle "marketing", sous l'angle "sécurité" et enfin sous l'angle "société".

Au sens "marketing", Google, comme d'autre, cherche à optimiser ses rentrées d'argent. Pour ce faire, ils tracent 1/ à des fin statistiques, ce qui permet de vendre ces stats à des tiers. 2/ pour profiler les IP. Ils ne lisent sans aucun doute pas le français mais je peux t'assurer que cela ne les bloquera pas pour créer (si ce n'est déjà fait) une base IP/centres d'intérêts pour affiner leur système AdBidulo. Vu le volume d'information qu'ils brassent, une telle base est aussi pinuts en terme de mise en œuvre qu'intéressant à des fin marketing.

Maintenant sous l'angle "sécurité", la prolifération du traçage n'est pas san conséquence. Cela peut faire sourire mais si tu gardes un oeil sur les failles découvertes au jour le jour, tu n'auras pas loupé celle concernant... urchin.

Mais au delà de ce cas particulier, tu as les dizaines d'indépendant aux vues plus ou moins douteuses qui proposent, tout sourire, un service gratuit toujours plus "cool" : je vous logs vos users, je vous les géolocalise, je vous affiche la températures des clicks, j'enregistre leur session, etc... Tout cela est bien gentil mais un site est un espace dans lequel l'utilisateur établi une relation de confiance avec son propriétaire. Il va fournir s'il le désire des informations personnelles, comme son login, des adresses email, des conversations privées (PM), etc... Et tout ceci est potentiellement "capable" par un script qui a été inclus par le webmaster. Une fois de plus, il ne s'agit pas d'une attaque "individualisée" mais d'alimentation de base d'adresse spam, d'attaque d'IP, etc..

Enfin pour terminer sous l'angle "société", tout ceci n'est jamais problématique quant tout vas bien. Mais imagine deux secondes que cela aille moins bien, politiquement parlant par exemple. Combien de temps a t-il fallu à Yahoo pour livrer ses logs au gouvernement chinois ? Qui y a t-il de compliqué à ton avis à transférer la notion "groupe de consommateur" sur "groupe d'individus de telle orientation politique" ?

En résumé, la seule chose que je dis, et je ne suis à l'évidence pas le seul, c'est que les arguments "on ne peut rien faire contre" et "si on a rien à se reprocher on a rien à craindre", ne sont pas des raisons valable pour arrêter d'ouvrir sa gueule et surtout de s'en prémunir un minimum.

Poster un nouveau commentaire

Le contenu de ce champ est gardé secret et ne sera pas montré publiquement.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • To highlight piece of code, just surround them with <code type="language"> Your code &tl;/code>>. Language can be java,c++,bash,etc... Everything Geshi support.
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • Textual smileys will be replaced with graphical ones.
  • Les adresses de pages web et de messagerie électronique sont transformées en liens automatiquement.

Plus d'informations sur les options de formatage

Connexion utilisateur
Les derniers bavardages...