b) L'inflation de pratiques commerciales « anonymement intrusives »
L'attention de vos rapporteurs a par ailleurs été attirée sur les innombrables opportunités qu'offre Internet aux sociétés privées, régies publicitaires et moteurs de recherche en termes de profilage des internautes, à des fins commerciales. Cet aspect du traçage sur Internet doit être distingué de celui précédemment examiné en ce que, dans la grande majorité des cas, ce traçage demeure anonyme : le comportement de l'internaute sur Internet importe davantage que les informations relatives à son identité réelle. Il n'en demeure pas moins que de telles pratiques de profilage, réalisées le plus souvent à l'insu des internautes, peuvent aboutir à la collecte d'informations nombreuses et être ressenties, à juste titre, comme véritablement intrusives.
(1) Le profilage sur Internet
Comme le montre une étude réalisée récemment par la CNIL 64 ( * ) , il y a lieu de distinguer trois types de publicité ciblée sur Internet :
§ La publicité personnalisée « classique » a pour but de cibler la publicité proposée à un internaute en fonction d'informations (âge, sexe, localisation, etc.) qu'il a lui-même renseignées. Ce type de publicité est aujourd'hui également utilisé par les réseaux sociaux en fonction des informations (qui peuvent être particulièrement nombreuses) fournies par leurs utilisateurs dans leurs « profils » (voir infra ).
§ La publicité contextuelle est une publicité qui est choisie en fonction du contenu immédiat consulté ou sollicité par l'internaute (contenu contextuel de la page consultée, relation avec le ou les mots-clés saisi(s) sur un moteur de recherche, etc.), cette information étant parfois complétée par des informations de géolocalisation déduites de l'adresse IP de l'internaute (pays ou région d'origine, langue utilisée) ou, dans le cas d'un moteur de recherche, par la précédente requête formulée par l'internaute.
§ Enfin, la publicité comportementale est probablement la forme de profilage la plus élaborée, en ce qu'elle vise à observer le comportement de l'internaute à travers le temps, en établissant un profil de ce dernier en fonction des différents sites consultés, des mots-clés saisis et des contenus produits, et à lui proposer des publicités adaptées à ce profil. Parmi les différentes techniques permettant de constituer de tels profils, la plus connue et la plus employée est celle des « cookies ».
Que sont les « cookies » ? Les « cookies » sont de petits fichiers d'une centaine d'octets que le navigateur utilisé par l'internaute (Internet Explorer, Opéra, etc.) installe sur le disque dur de ce dernier à la demande du site consulté. Créés en 1994 par des ingénieurs de Netscape, les « cookies » sont également appelés « mouchards électroniques » ou « témoins de connexion ». Leur objet est de permettre au site qui les a envoyés de « reconnaître » l'internaute en stockant un certain nombre d'informations : adresse IP, système d'exploitation et navigateur utilisés, pages consultées, nombre de visites du site, etc. En cela, les cookies permettent de faciliter la navigation , en mémorisant un certain nombre d'informations que l'internaute n'aura pas à ressaisir ultérieurement (par exemple, un cookie permettra à un internaute faisant ses achats en ligne de conserver en mémoire les produits placés dans le panier virtuel et de les présenter sur la facture finale). Toutefois, les cookies permettent également au fournisseur de contenu ou à la régie publicitaire de conserver en mémoire un grand nombre d'informations relatives aux habitudes de navigation de l'internaute , et ce même si ce dernier possède une adresse IP dynamique et variable (cf. supra ), leur offrant ainsi la possibilité de lui proposer des publicités conformes à ses préférences (telles qu'elles auront été déduites des informations collectées). |
(2) Des stratégies indissociables du modèle économique d'Internet
La publicité sur Internet représente un secteur en pleine expansion : selon une étude réalisée par le cabinet Precepta et rendue publique en avril 2009, le secteur de la publicité en ligne a généré 2,5 milliards d'euros de revenus en 2008, ce qui représente une augmentation de + 6,5 % sur un an. L'étude prévoit une croissance annuelle de ses revenus de 7 à 10 % d'ici à 2014, avant un ralentissement probable à partir de 2015, du fait de la baisse attendue des prix causée par la multiplication des espaces disponibles sur Internet et au comportement considéré comme « agressif » des régies publicitaires.
Une telle croissance n'est que la contrepartie du modèle économique sur lequel fonctionne un certain nombre de sociétés de l'Internet , celles qui offrent aux internautes des services dits « gratuits », financés en réalité de façon majoritaire par la publicité ciblée.
Par exemple, le service de messagerie électronique (gratuit) Gmail, fourni par Google, est financé par les publicités affichées en fonction du repérage d'un certain nombre de mots-clés figurant dans le contenu des correspondances échangées. Il en est de même de l'ensemble des moteurs de recherche dits « gratuits ».
Ces sociétés se défendent de participer à l'instauration d'une société de surveillance dans la mesure où, font-ils valoir, la collecte de ces informations demeure anonyme : le but n'est pas d'épier les comportements d'utilisateurs identifiés mais de parvenir à une « personnalisation » des services proposés, au double bénéfice de l'internaute et de l'annonceur publicitaire.
Vos rapporteurs sont conscients du confort que peut représenter pour certains internautes une telle personnalisation des services proposés. Encore faut-il que ces derniers aient été pleinement informés des outils de profilage utilisés à leur encontre et qu'ils aient eu le moyen de s'opposer à ce que les données relatives à leur navigation fassent ainsi l'objet d'une collecte. Or, comme le montre la CNIL dans son étude précitée, « en l'absence de transparence de la part des fournisseurs de contenu ou de services sur les mécanismes de profilage et sur les données collectées, l'internaute peut percevoir ces mécanismes comme très intrusifs » 65 ( * ) .
Le G29 l'a également relevé dans son avis du 20 juin 2007 relatif au concept de données à caractère personnel : « Sur l'Internet aussi, les outils de surveillance du trafic permettent de cerner facilement le comportement d'une machine, et, derrière celle-ci, de son utilisateur. On reconstitue ainsi la personnalité de l'individu pour lui attribuer certaines décisions. Sans même s'enquérir du nom et de l'adresse de la personne, on peut la caractériser en fonction de critères socio-économiques, psychologiques, philosophiques ou autres et lui attribuer certaines décisions, dans la mesure où le point de contact de la personne (l'ordinateur) ne nécessite plus nécessairement la révélation de son identité au sens étroit du terme. En d'autres termes, la possibilité d'identifier une personne n'implique plus nécessairement la faculté de connaître son identité » 66 ( * ) .
Pour illustrer la possibilité d'identifier relativement aisément des utilisateurs à partir de données pourtant théoriquement anonymes, on peut citer « l'affaire AOL » : au cours de l'été 2006, ce prestataire de services a publié un échantillon des requêtes, accompagnées des liens cliqués pour chacune d'entre elles, effectuées par 650.000 utilisateurs sur une période de trois mois. AOL avait certes remplacé les noms des utilisateurs par des numéros.
Néanmoins, des journalistes ont rapidement découvert que ces résultats permettaient souvent de remonter aux différents utilisateurs, en partant des « recherches de vanité » (les utilisateurs recherchent souvent des informations sur eux-mêmes) et des combinaisons de requêtes effectuées par un seul utilisateur 67 ( * ) .
(3) Le cas particulier des moteurs de recherche
Ce dernier exemple illustre par ailleurs les difficultés spécifiques soulevées par les moteurs de recherche en matière de droit au respect de la vie privée. Les moteurs de recherche constituent en effet un cas tout à fait particulier, du fait de leur double fonction de prestataires de services et de fournisseurs de contenus .
Les moteurs de recherche sont des services qui permettent aux internautes de trouver facilement des informations sur Internet. Leur fonctionnement est basé sur le traitement et la mise en ordre d'informations à partir de l'exploration et de l'indexation systématique des sites accessibles sur le net . Services « gratuits » dans l'immense majorité des cas, leur rentabilité dépend avant tout de l'efficacité de la publicité qui accompagne les résultats des recherches effectuées. |
Comme l'explique clairement l'avis du G29 consacré aux aspects de la protection des données liés aux moteurs de recherche 68 ( * ) , « d'une part, en tant que prestataires de services aux utilisateurs, les moteurs de recherche collectent et traitent de grandes quantités de données d'utilisateur , dont celles recueillies par des moyens techniques, tels que les « cookies ». Les données collectées peuvent aller de l'adresse IP des différents utilisateurs, ou d'historiques de recherche complets, ou encore de données fournies par les utilisateurs eux-mêmes lorsqu'ils s'inscrivent en vue d'utiliser des services personnalisés. [...] D'autre part, en tant que fournisseurs de contenus, les moteurs de recherche contribuent à rendre les publications sur Internet facilement accessibles aux quatre coins de la planète. Certains moteurs de recherche republient des données dans ce que l'on appelle une « mémoire cache ». Or, en recherchant et en regroupant des informations courantes de divers types au sujet d'une personne, ils peuvent créer un nouveau profil, avec un risque beaucoup plus grand pour la personne concernée que si toutes les données publiées sur Internet restaient séparées les unes des autres. Les capacités de représentation et d'agrégation des moteurs de recherche peuvent nuire considérablement aux individus, tant dans leur vie personnelle qu'au sein de la société, en particulier si les données à caractère personnel qui figurent dans les résultats de recherche sont inexactes, incomplètes ou excessives ».
Les moteurs de recherche, considérés dans leurs fonctions de prestataires de services, ont récemment fait l'objet de l'attention soutenue du G29.
En effet, il est apparu que ces derniers conservaient un très grand nombre de données relatives à leurs utilisateurs 69 ( * ) pendant des périodes excédant parfois une année (la durée de conservation varie en fonction des sociétés), les moteurs de recherche faisant valoir que la conservation de ces données est nécessaire à la qualité du service rendu, à la prévention des fraudes et à la sécurisation du système, ainsi qu'à des fins comptables et statistiques.
Dans son avis précité, le G29 n'a pas contesté les finalités ainsi mises en avant, mais il a dénoncé la durée, selon lui excessive, au cours de laquelle l'ensemble des données relatives aux utilisateurs étaient conservées. Le débat s'est ainsi recentré sur la question des délais de conservation des données personnelles par les moteurs de recherche (cf. supra ).
L'activité des moteurs de recherche en tant que fournisseurs de contenus soulève davantage de difficultés. En effet, en tant qu'intermédiaires (les moteurs de recherche ne font que fournir à l'utilisateur les liens vers des informations que celui-ci recherche et qui sont publiées sur un certain nombre de sites web ), ils ne peuvent juridiquement être considérés comme les principaux responsables du traitement des données à caractère personnel effectué : dans le cas de la publication d'une information concernant un internaute sur un site Internet, ce dernier doit se retourner vers le gestionnaire de ce site pour faire valoir ses droits d'accès, de rectification et d'opposition 70 ( * ) . Tout au plus l'internaute peut-il solliciter la désindexation des sites contenant des informations lui portant tort 71 ( * ) . Néanmoins, en l'absence de la coopération et de la bonne volonté du gestionnaire d'un site comportant des informations personnelles qu'une personne souhaiterait voir effacées, voire même de la capacité d'identifier ce gestionnaire (cette question se pose avec d'autant plus d'actualité si celui-ci est implanté en dehors du territoire européen et ne s'estime pas lié par la réglementation communautaire), l'internaute peut se trouver dans l'incapacité de faire rectifier ou supprimer des informations lui portant tort et aisément disponibles via les moteurs de recherche. Cette difficulté a été évoquée par nombre des interlocuteurs rencontrés par vos rapporteurs, qui se sont interrogés sur l'opportunité de consacrer un « droit à l'oubli » (voir infra ).
Faire supprimer une page web contenant des informations
personnelles
Lorsqu'un internaute demande la suppression de la diffusion de données le concernant auprès de l'éditeur d'un site web , ce dernier déréférence la page en question mais l'information peut rester un certain temps disponible sur Internet, ce qui suscite parfois réactions et plaintes auprès de la CNIL de l'internaute, estimant que ses demandes n'ont pas été prises en compte. Qu'en est-il ? Les moteurs de recherche conservent temporairement une copie de toutes les pages que leurs moteurs d'indexation visitent. Interrogé sur ce point par la CNIL, Google a précisé que lorsqu'une page est supprimée par l'éditeur du site, cette page est également supprimée des résultats de recherche, y compris sa version cache lors de la prochaine indexation du site par le robot du moteur de recherche. Or, le délai de réindexation d'un site varie en fonction de différents critères tels que la popularité ou la fréquence d'actualisation du site, mais intervient en moyenne toutes les deux à trois semaines (certains sites d'actualité par exemple, pouvant faire l'objet d'une mise à jour quasi quotidienne). Durant cet intervalle de temps, la version cache d'une page peut encore potentiellement être consultée alors que cette page n'est plus diffusée sur son site d'origine. |
* 64 « La publicité ciblée en ligne », communication présentée par M. Bernard Peyrat, rapporteur, en séance plénière le 5 février 2009, disponible sur le site Internet de la CNIL.
* 65 Op. cit., page 22.
* 66 G29, avis 4/2007 sur le concept de données à caractère personnel, adopté le 20 juin 2007, page 15.
* 67 A titre d'illustration, des journalistes du New York Times sont par exemple parvenus à identifier l'utilisateur « 4417749 », une veuve de 62 ans, grâce à la liste de ses requêtes (liées aux taxes locales en vigueur dans sa ville, à ses trois chiens, à sa santé, à son sentiment de solitude, etc.) ; le Guardian est parvenu de son côté à décrire la vie d'un homme, habitant d'une ville de Floride, fan de football portugais, qui apprend que sa femme a une relation extraconjugale et qui se met à boire avant de faire appel aux services d'un medium ; etc.
* 68 G29, avis 1/2008 sur les aspects de la protection des données liés aux moteurs de recherche, adopté le 4 avril 2008.
* 69 Par exemple, Google conserve systématiquement les données suivantes : termes de la requête, adresse consultée, adresse IP de l'internaute, heure et date de la recherche, système d'exploitation, type de navigateur, identifiant de cookie.
* 70 Les exceptions sont l'existence d'une mémoire cache à long terme et les opérations à valeur ajoutée effectuées sur les données à caractère personnel, telles que les moteurs de recherche destinés à établir des profils de personnes physiques. Lorsqu'ils fournissent ce type de services, le G29 considère que les moteurs de recherche doivent être tenus pour entièrement responsables au regard des obligations que leur impose la directive 95/46/CE, et qu'ils doivent en respecter l'ensemble des dispositions.
* 71 Ainsi, dans certains Etats membres de l'Union européenne, les autorités de protection des données ont spécifiquement réglementé l'obligation des fournisseurs de moteurs de recherche de retirer des données de contenu de l'index de recherche, sur la base du droit d'opposition consacré à l'article 14 de la directive 95/46/CE sur la protection des données et de la directive 2000/31/CE sur le commerce électronique.