L’Open data juridique

Nous vivons dans un monde connecté où des quantités phénoménales de données circulent nuit et jour à travers le globe. Alors que le Big Data se définit par son ampleur, l’Open data se caractérise par son usage, son ouverture, son intention de démocratiser l’information pour en faire bénéficier le monde.

Au Laboratoire de cyberjustice de l’Université de Montréal, une équipe de jeunes chercheurs a décidé – dans le cadre d’un projet bilatéral Québec/Belgique – de créer un blogue permettant de comprendre l’impact que peut avoir sur le droit, la transition numérique. Ce premier billet portera donc sur la question de l’Open data juridique. L’Open data consistant à mettre à disposition de tous, sur Internet, des données numériques librement accessibles et réutilisables par tous, l’Open data juridique en est donc la déclinaison et ce, dans le secteur du droit. Nous verrons donc dans un premier temps en quoi consiste ces données ouvertes, dans un second temps leur utilisation par les juristes et pour finir, les problèmes liés à cette démarche d’ouverture des données.

Rappel sur l’Open data

Selon la définition de l’Office québécois de la langue française, les données ouvertes sont des « données brutes non nominatives et libres de droits, produites ou recueillies par un organisme public ou privé, qui sont accessibles aux citoyens par Internet. » Plusieurs pays, parmi lesquels figure le Canada, se sont donnés comme mission de rendre ouvertes davantage de données susceptibles de favoriser l’innovation, l’avancement scientifique et le développement de nouvelles connaissances et technologies.

Source : http://donnees.ville.montreal.qc.ca/

Pour l’Open Knowledge Foundation (association à but non lucratif de droit britannique), les éléments clé pour garantir l’ouverture sur la connaissance sont : la disponibilité et l’accès aux données, idéalement sur internet et dans un format universel, modifiable et interprétable par des ordinateurs; la possibilité d’utiliser et de redistribuer les données sans restriction, de pouvoir les croiser avec d’autres données; l’universalité de l’ouverture des données pour une utilisation non restreinte, c’est-à-dire par n’importe qui et pour n’importe quelle raison, même commerciale. Les données ouvertes proviennent donc de plusieurs sources (sciences, finance, environnement, etc.) et sont susceptibles d’être utilisées dans une multitude de contextes et de servir à développer plusieurs applications.

L’Open data juridique

Certains chercheurs considèrent l’Open data comme une mine d’or pour les juristes. En effet, cette ouverture des données présente des caractèristiques remarquables. Pour reprendre les termes de Laure Marino, professeur à l’Université de Strasbourg, les données ouvertes sont « un gisement magique car ce dernier ne s’épuise jamais. »1 L’Open data se nourrit des données que les utilisateurs d’Internet lui fournissent inconsciemment ou non. Que ce soit, une personne lambda qui décide d’exposer sa vie sur Facebook ou une Cour de justice qui partage une décision sur le web, toutes ces données peuvent être utilisées librement (voir billet à paraître sur le statut des données de Google et Facebook). Car en effet, l’open data est également un « gisement librement exploitable. Il est non seulement librement utilisable, mais encore, et surtout librement réutilisable».2 Les données ouvertes ne sont généralement pas protégées par le droit d’auteur, mais il existe un droit sui generis portant sur les bases de données, comme par exemple l’Open Database Licence créée par l’Open Knowledge Foundation, ou la licence ouverte LO d’Etalab.

En France, la loi du 7 octobre 2016 pour une République numérique a institué dans ses artices 20 et 21 la mise à disposition du public à titre gratuit de l’ensemble des décisions de justice – judiciaires et administratives – en précisant qu’elle devrait se faire « dans le respect de la vie privée des personnes concernées » et « être précédées d’une analyse du risque de ré-identification des personnes ». Regroupant des représentants des juridictions suprêmes, des juridictions du fond, de la Commission nationale de l’informatique et des libertés et du Conseil national des barreaux, cette réflexion a été lancée pour proposer des conditions d’application et les modalités d’ouverture au public des décisions de justice. Le texte final a pour but d’ouvrir de puissantes perspectives d’évolution dans la façon dont la justice est rendue en permettant d’améliorer la qualité des pratiques juridictionnelles par l’analyse des décisions de justice, et de renforcer la connaissance de l’ensemble de la jurisprudence et son caractère prévisible. Cette thématique sera d’ailleurs abordée lors de l’École d’été du Laboratoire de cyberjustice qui aura lieu du 11 au 16 juin 2018 à l’Université de Montréal.

L’Open data et le droit à la vie privée

Si les données ouvertes ne concernent pas initialement la protection des données à caractère personnel, le nouveau contexte numérique nécessite de mieux prendre en compte, au niveau de la mise à disposition des données comme de leur réutilisation, la protection de la vie privée.

Comme nous avons pu le voir précédemment, de nombreux États se sont inscrits dans un mouvement d’ouverture en ligne des informations détenues par leurs administrations publiques. La majorité des informations du secteur public mises à disposition des internautes ne comporte aucune données à caractère personnel. Néanmoins, ces organismes produisent ou détiennent une très grande variété de données susceptibles d’être mises à disposition sur le web. L’Open data soulève donc la question de l’équilibre entre droit d’accès à l’information et protection des données à caractère personnel et donc, protection de la vie privée. Comme le souligne la Commission nationale de l’informatique et des libertés (CNIL) en France, « plus que l’Open data lui-même, c’est davantage le contexte dans lequel il s’inscrit qui doit appeler à la vigilance : informatisation de la société, des administrations comme des acteurs privés ; diffusion spontanée de données personnelles par les internautes ; indexation de données nominatives par de puissants moteurs de recherche ; développement du Big Data… »3 Se pose alors plusieurs questions : à qui l’open data est-il le plus bénéfique : les citoyens, les acteurs judiciaires, les entreprises, l’État? Toutes les décisions de justice sont-elles diffusables ? La dichotomie vie publiqe / vie privée est-elle encore pertinente en matière de politique publique de diffusion des décisions de justice?

Au Canada, la plupart des décisions judiciaires se retrouvent depuis quelques années dans des bases de données juridiques. Certaines de ces bases sont commerciales (elles nécessitent un abonnement), mais d’autres sont en accès libre. Il est donc possible pour un citoyen de consulter un grand nombre de décisions et d’avoir accès à des données personnelles. Lorsqu’il y a conflit entre le droit à la vie privée et le droit du public à la transparence de l’administration de la justice, c’est cette dernière qui l’emporte. Mis à part le huis clos et les ordonnances de non-publication, les tribunaux canadiens penchent davantage vers l’ouverture au public des audiences et du processus judiciaire. Les archives judiciaires sont donc accessibles à tous, incluant le plumitif. Au niveau civil, l’idée est sensiblement la même. Le droit du public à l’information inclut les renseignements personnels qui sont révélés dans un processus judiciaire.

L’Open data fait donc aujourd’hui parti du paysage juridique, le but étant de rendre la justice plus accessible. Les décisions de justice diffusées sur internet, les textes de lois, la doctrine (etc.) sont autant d’informations qui permettent de s’orienter doucement mais sûrement vers la création d’algorithmes susceptibles via ces données de prédire les décisions de justice. On parle alors de justice prédictive. Sur cette question, le Laboratoire de cyberjustice a d’ailleurs développé le chatbot juridique Procezeus, outil de prévention des conflits utilisant l’apprentissage automatique (Machine Learning) et l’apprentissage profond (Deep Learning) pour analyser de grandes quantités de données judiciaires afin de répondre aux questions que peuvent se poser certains justiciables quant à leurs droits ou à l’issu probable de leur litige. 

Pour en savoir plus

Laura Baudin et Martine Gagnon

1 Laure MARINO, L’Open data, une mine d’or pour les juristes, La semaine juridique – Édition générale, N°14, 7 avril 2014

Id.

3 CNIL, « Open data : la protection des données comme vecteur de confiance », cnil.fr, 29 août 2017, en ligne : https://www.cnil.fr/fr/open-data-la-protection-des-donnees-comme-vecteur-de-confiance

Blogue réalisé grâce à la Chaire Lexum.

Ce contenu a été mis à jour le 24 juillet 2018 à 13 h 46 min.