Screen-scraping / crawler web Admissibilité juridique et cadre général

Le screen-scraping et le web-crawling sont-ils autorisés par la loi, c'est-à-dire la saisie automatisée de contenus de sites web tiers et le transfert des données ainsi obtenues dans un système propre pour une utilisation ultérieure et personnelle ?

Exemple

L'entreprise S souhaite mettre en place un portail de comparaison de prix. Pour ce faire, S crée un script qui permet de rechercher automatiquement des produits et leurs prix sur différents sites web tiers et de stocker les résultats dans une base de données de S. S propose ensuite les contenus sur son propre site web, que les clients peuvent consulter. Le cas échéant, les clients sont redirigés par un lien hypertexte vers les offres respectives des tiers.

Quel est le cadre juridique ?

De nombreux aspects juridiques peuvent être pris en considération. Il convient toutefois de tenir compte de manière déterminante :

le droit de la concurrence conformément à la loi sur la concurrence déloyale (UWG)
le droit en tant que producteur de bases de données conformément aux §§ 87a et suivants de la loi sur le droit d'auteur (UrhG)
les conditions générales ou les conditions d'utilisation des sites tiers
un "droit de domicile virtuel" sur les sites web
le contournement des mécanismes techniques de protection
les exigences du droit étranger

Le droit de la concurrence selon l'UWG

Le droit de la concurrence est principalement régi par la loi contre la concurrence déloyale (UWG) et contient de nombreux faits qui interdisent un comportement déloyal sur le marché. Ainsi, selon le § 4 n° 10 de la loi contre la concurrence déloyale, il est interdit d'entraver de manière ciblée les concurrents.

L'existence d'une telle entrave ciblée dans le cadre du screen-scraping / web-crawling s'apprécie également en fonction de la situation du marché et, par exemple, selon que - dans l'exemple - l'entreprise S entrave de manière ciblée et dans l'intention d'évincer un tiers déterminé dans son développement sur le marché ou - et cela devrait être examiné plus précisément dans le cas présent - selon que le tiers dont les contenus sont saisis par screen-scraping / web-crawling ne peut plus mettre en valeur ses prestations sur le marché de manière appropriée par ses propres efforts. Ce dernier point pourrait par exemple être examiné de plus près si - dans l'exemple ci-dessus - les clients ne visitent plus le site tiers, mais uniquement le nouveau site web de l'entreprise S.

Dans un jugement de 2014, la Cour fédérale de justice a toutefois nié une entrave ciblée dans le cas d'un screen-scraping / web-crawling du site d'une compagnie aérienne dans la situation en question.

Droits en tant que producteur de base de données conformément aux articles 87a et suivants de la loi sur le droit d'auteur (UrhG)

Une base de données est protégée de manière autonome par la loi sur le droit d'auteur. Une base de données est considérée comme telle, entre autres, lorsque

il existe une collection de données,
qui sont organisées de manière systématique ou méthodique et
qui sont accessibles individuellement à l'aide de moyens électroniques et si en outre
l'obtention, la vérification ou la présentation des données nécessite un investissement important de par sa nature ou son volume.

Il est important de noter que les données ne doivent pas nécessairement avoir une qualité ou une caractéristique particulière. Ce qui est essentiel, c'est que la compilation ait nécessité un certain investissement (en particulier un investissement financier). L'objet de la protection est donc moins les données elles-mêmes que l'investissement dans la compilation.

Les données récupérées sur les sites web de tiers peuvent faire partie d'une telle base de données. En ce qui concerne la licéité d'un screen-scraping / web-crawling, il convient donc de vérifier dans un premier temps, à l'aide du site web concret, s'il existe réellement une base de données dans ce sens, c'est-à-dire si des investissements importants ont effectivement été réalisés, par exemple.

En outre, le droit du producteur de la base de données n'est pas illimité. Il existe plutôt des limites. Une limite particulièrement pertinente dans l'exemple considéré est que le fabricant de la base de données ne dispose que du droit d'interdire l'utilisation de la base de données dans son ensemble ou d'une partie importante de la base de données en raison de sa nature ou de son volume. Inversement, l'utilisation de parties non essentielles (en termes de nature ou d'étendue) est autorisée. Ainsi, même si l'on dispose d'une base de données dans un premier temps, il convient de déterminer dans un deuxième temps si le screen-scraping / web-crawling entraîne plus qu'une utilisation non substantielle en termes de nature ou d'étendue (plus précisément : reproduction, distribution ou communication au public).

Quelle est la limite entre une utilisation non substantielle et une utilisation substantielle? Juridiquement, il n'existe pas de limites claires à ce sujet. Il convient tout d'abord de noter que l'utilisation doit être insignifiante par sa nature ou son ampleur. Il s'agit là d'un aspect qualitatif et quantitatif. En ce qui concerne l'aspect qualitatif, il sera toujours difficile de trouver une limite claire, car le critère de qualité doit d'abord être défini. En ce qui concerne la limite quantitative, il est également difficile de trouver une limite précise de manière générale. Cela se voit déjà au fait qu'il faut d'abord clarifier l'étendue de la base de données considérée. Comment traiter, par exemple, les bases de données relationnelles qui sont divisées en plusieurs tables ou bases de données individuelles reliées entre elles : Le point de référence est-il alors la table individuelle ou la base de données entière ?

Cependant, la jurisprudence a parfois donné des chiffres, notamment une limite de 10 %. Par exemple, dans un arrêt de 2011, la Cour fédérale de justice a considéré que l'utilisation quantitative d'une base de données jusqu'à 10 % ne constituait en tout cas pas encore une utilisation substantielle. Dans une autre affaire, la Cour d'appel de Cologne a estimé qu'une utilisation de 10 % constituait toutefois une utilisation qualitativement substantielle, en tout cas dans l'affaire jugée par la Cour d'appel de Cologne.

Conditions générales ou conditions d'utilisation des sites tiers

D'autres conditions générales à respecter lors du screen-scraping / web-crawling peuvent résulter des CGV ou d'autres conditions d'utilisation du site web tiers ou - si elles existent - d'autres contrats avec le tiers. Il peut résulter de ces conditions contractuelles des interdictions contractuelles qui peuvent même prévoir que des évaluations ne peuvent pas avoir lieu, même s'il n' existe pas de base de données et que seule une utilisation insignifiante a lieu. Il se peut également que les dispositions contractuelles prévoient des obligations de confidentialité qui doivent être respectées. Il est donc nécessaire de procéder à un examen minutieux de ces dispositions contractuelles. L'examen doit également porter sur la question de savoir si les conditions générales ou les conditions d'utilisation ont été convenues valablement. En effet, la simple reproduction des conditions contractuelles dans les "mentions légales" ou sous le lien hypertexte "CGV", sans autre mesure d'intégration, ne conduit généralement pas à un accord valable. En outre, il convient de vérifier si les dispositions contractuelles sont formulées de manière à être conformes au droit principal.

"Droit de domicile virtuel" sur les sites web

Par le passé, on a également tenté de déduire des droits en tant qu'exploitant de site web d'un "droit de domicile virtuel". Toutefois, il n'existe pas de "droit de propriété virtuel" spécifique sur le plan juridique et - dans la mesure où cela est pertinent en l'espèce - il n'a pas été possible jusqu'à présent d'en déduire des droits distincts en ce qui concerne le screen-scraping / web-crawling.

Contournement des mécanismes techniques de protection

Il est plus important de savoir si, d'un point de vue purement technique, le screen-scraping / web-crawling permet de contourner les mesures techniques de protection. Il s'agit d'un aspect qui doit être évalué dans le domaine du droit de la concurrence, dans le domaine de la loi sur le droit d'auteur ainsi que dans le cas d'une relation contractuelle. Il faut également tenir compte du fait que , sur le plan juridique, une mesure de protection qui pourrait être contournée existe beaucoup plus rapidement que ce que l'on pourrait supposer en se basant sur une approche purement technique. Sur la base de la jurisprudence actuelle, il peut déjà être nécessaire d'examiner si l'utilisation d'un "lien profond" constitue un contournement des mesures techniques de protection.

Droit étranger

Le screen-scraping et le web-crawling peuvent rapidement concerner des sites web d'entreprises ayant leur siège au-delà des frontières nationales. Il peut alors être nécessaire de respecter le droit étranger.

Conclusion

Le screen-scraping et le web-crawling sont possibles selon la jurisprudence. Toutefois, il n'existe pas d'autorisation générale. Il faut plutôt considérer le site web tiers en question, même si cela est difficile à concilier avec la technique , car le script ou le programme se déroule toujours de la même manière. Toutefois, en fonction de la demande précise, il sera toujours possible d'identifier certaines conditions-cadres ou limites qui peuvent être prises en compte lors de la conception du modèle commercial, afin de réduire au moins considérablement le risque juridique. L'aspect procédural peut également jouer un rôle déterminant, de même que la clarification de la manière dont il convient de réagir à d'éventuels avertissements, procédures d'urgence ou actions en justice.

Mise à jour (2021): Entre-temps, l'UrhG a été modifiée et un nouvel article 44b UrhG (ainsi que, entre autres, l'article 87c, paragraphe 1, points 4 et 5, UrhG et l'article 95b, paragraphe 1, point 1, UrhG) a été introduit pour le text and data mining, c'est-à-dire l'analyse automatisée d'une ou plusieurs œuvres numériques ou numérisées afin d'en tirer des informations, notamment sur les modèles, les tendances et les corrélations. Une telle exploration de texte et de données est en principe autorisée si les données de départ sont effacées. La condition de base est toutefois que le titulaire des droits ne se soit pas réservé l'utilisation, une telle réserve d'utilisation n'étant valable en ligne que si elle a été déposée sous une forme lisible par machine. Malgré cette restriction, l'exploration automatisée de textes et de données est désormais possible. Toutefois, il n'est pas encore clair dans quelle mesure des interdictions peuvent résulter d'autres aspects (tels que présentés dans l'article ci-dessus), étant donné que l'article 44b UrhG est une disposition relevant uniquement du droit d'auteur. Dans le cas d'une exploitation purement scientifique, les possibilités sont toutefois plus étendues.

Version : 5. août 2020