A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Qu’est-ce que le Deep Web ?

Le Deep Web est la partie de l’Internet qui n’est pas indexée par les moteurs de recherche traditionnels. Il nécessite souvent un identifiant (comme un nom d’utilisateur et un mot de passe) ou un logiciel spécial pour y accéder. La partie du Web accessible via les moteurs de recherche, parfois appelée Web de Surface, n’est en réalité qu’une petite portion du Web mondial. La pièce beaucoup plus grande et moins visible est appelée Deep Web. Certaines estimations suggèrent que 90-95% du Web mondial est en réalité le Deep Web.

Quelques exemples de ce qui se trouve sur le Deep Web incluent les e-mails, le contenu par abonnement (comme Netflix), les banques en ligne, les bases de données, les réseaux internes d’entreprise, ou même des pages de réseaux sociaux non publiques. Généralement, toute page web ou contenu nécessitant un identifiant ou un outil personnalisé pour y accéder sera considéré comme faisant partie du Deep Web.

Notez que le Deep Web est souvent confondu avec le Dark Web. Le Dark Web est une fraction de la plus grande partie qu’est le Deep Web. Alors que le Dark Web nécessite un navigateur spécial pour y accéder, le Deep Web est accessible avec un navigateur standard (comme Brave ou Chrome) et représente généralement la partie d’Internet à laquelle vous devez simplement vous connecter pour la consulter. La majorité du Deep Web est similaire au Web de Surface, mais moins public.

Dissiper quelques mythes sur le Deep Web

Mythe : Je n’ai jamais surfé sur le Deep Web.

  • Fait : Probablement faux. Si vous vous êtes déjà connecté au site web de votre banque ou au portail patient de votre médecin, ou si vous avez utilisé un abonnement musical pour écouter une playlist favorite, ou même si vous vous êtes simplement connecté à votre compte de réseau social, vous avez participé au Deep Web. Beaucoup de ce que nous faisons en ligne dans notre vie quotidienne implique le Deep Web.

Mythe : Il est illégal de surfer sur le Deep Web.

  • Fait : Faux. Sauf en cas de lois de censure dans certains pays, il n’est généralement pas illégal de visiter (ou de se connecter à) des sites web qui ne sont pas indexés par des moteurs de recherche comme Google ou la recherche Brave. Ce que vous faites sur le site web, cependant, peut être illégal.

Mythe : Le Deep Web est rempli d’activités illégales comme les drogues et les armes.

  • Fait : Principalement faux. La vérité est qu’il y a des activités illégales sur le Web de Surface, le Deep Web, et le Dark Web. Mais les trois ont aussi d’innombrables usages légitimes.

Mythe : Vous avez besoin d’un logiciel spécial pour accéder au Deep Web.

  • Fait : Généralement, non. La majorité du Deep Web est accessible via votre navigateur habituel, soit en connaissant l’URL de la page web, soit en simplement vous connectant. Si vous voulez accéder au Dark Web, alors vous aurez besoin d’un navigateur spécial comme Tor.

Quelles pages web se trouvent sur le Deep Web ?

Pour expliquer ce que sont les pages web du Deep Web, il est utile de comprendre d’abord comment fonctionnent les moteurs de recherche.

Un robot d’indexation (également appelé robot d’indexation de moteur de recherche) est un programme qui visite toutes les adresses IP, suit méthodiquement tous les liens qu’il trouve et établit un index de tous les mots et phrases des pages qu’il atteint. C’est ainsi que de nombreux index de recherche sont construits. Quand vous effectuez une recherche sur google.com pour « Qu’est-ce que le Deep Web ? », la page de résultats affiche des localisations Internet (c’est-à-dire des pages web) qui contiennent ces mots.

Si le robot d’indexation ne peut pas accéder à une page web pour en indexer le contenu, la page ne « surface » pas et reste ainsi non indexée ; c’est le Deep Web. Il y a plusieurs raisons pour lesquelles une page web peut ne pas être indexée, notamment :

  • Le contenu est protégé par une connexion. Le robot d’indexation ne peut pas se connecter et ainsi n’atteint pas le contenu.
  • Un CAPTCHA ou un autre « bloqueur de robots » empêche le robot d’indexation d’accéder au contenu.
  • La page web est dynamique (c’est-à-dire qu’elle change en réponse aux besoins de l’utilisateur). Les robots d’indexation ne peuvent souvent pas interagir avec la page dans toutes ses configurations possibles et peuvent donc manquer certains contenus.
  • La page est sans lien et donc « cachée » des robots d’indexation. Un robot d’indexation peut trouver un site « racine » (par exemple, exemple.com) mais ne trouvera une page spécifique (comme exemple.com/brouillons) que s’il y a un lien soit à partir du site racine, soit d’une autre page. S’il n’y a aucun lien vers une page et que le seul moyen d’y accéder est de connaître l’URL de la page, le robot d’indexation ne la trouvera ni ne l’indexera.
  • Le propriétaire du site a ajouté du code qui demande aux robots d’indexation de ne pas indexer le contenu du site, laissant ainsi des pages « publiques » hors de l’index du moteur de recherche.

Comment accéder au contenu du Deep Web ?

Vous pouvez accéder à la plupart du Deep Web avec le même navigateur que vous utilisez pour le web de surface. Les étapes supplémentaires dépendent du type de contenu du Deep Web que vous cherchez.

Parfois, il vous suffit de disposer de crédentials comme un login ou d’autres privilèges d’accès. Se connecter est la manière d’accéder à la partie du web qui contient vos informations personnelles, ou le réseau interne que vous utilisez au travail.

Sur un site web, vous pouvez utiliser la fonctionnalité de recherche du site pour trouver du contenu que le robot d’indexation n’a pas pu indexer. Un site web peut avoir beaucoup de contenu trouvable par la recherche d’un mot-clé (par exemple, sur le blog de exemple.com). Les robots d’indexation n’entrent pas de mots dans les champs de saisie comme les cases de recherche ; ils peuvent donc ne jamais atteindre ce matériel. C’est particulièrement vrai pour les sites riches en informations, comme les ressources gouvernementales ou les sites de publications en ligne.

Si vous souhaitez consulter du contenu archivé (des pages ou des sites web entiers qui ne sont plus « en ligne »), la Wayback Machine stocke des versions plus anciennes de nombreux sites web. Elle stocke aussi du contenu comme d’anciens rapports d’actualité ou des publications sur les réseaux sociaux, en préservant des informations qui seraient autrement rendues inaccessibles.

Quels sont les problèmes de sécurité sur le Deep Web ?

À l’exception de la fraction du Deep Web appelée « Dark Web », naviguer sur le Deep Web est comme naviguer sur le web de surface, avec les mêmes préoccupations concernant votre confidentialité et sécurité. Vous devriez prendre des précautions similaires telles que :

  • Activez la fonctionnalité de « navigation sécurisée » (Safe Browsing) dans votre navigateur web. Tous les navigateurs principaux supportent cette fonctionnalité, qui peut vous avertir si vous allez visiter un site connu pour héberger des logiciels malveillants.
  • Choisissez un navigateur axé sur la confidentialité, comme Brave, avec de fortes protections de la confidentialité.
  • Chaque fois que vous êtes sur le point de vous connecter à un site web, ou d’entrer une information importante, regardez attentivement l’adresse du site web dans l’URL, et assurez-vous que c’est bien ce à quoi vous vous attendez.
  • Ne saisissez des informations personnelles que sur des sites qui utilisent le HTTPS (recherchez « https:// » dans la barre d’adresse de votre navigateur), et évitez d’entrer des informations personnelles sur des sites non-HTTPS.
  • Gardez toujours les logiciels que vous utilisez à jour pour qu’ils disposent des dernières corrections de sécurité. Cela est particulièrement important pour votre système d’exploitation (OS) et votre navigateur, qui vous avertiront souvent lorsqu’ils ont besoin d’une mise à jour.
  • Sur les appareils mobiles, n’installez des applications que depuis l’App Store officiel. Sur les appareils de bureau ou les ordinateurs portables, n’installez des applications et des extensions que depuis le magasin officiel, ou depuis des entreprises réputées.
  • Si vous êtes connecté à un réseau Wi-Fi public ou non fiable ou à un FAI, ou si l’anonymat est important pour vous, utilisez un VPN.

Enfin, notez que, malgré certaines connotations négatives associées à ce terme, c’est généralement une bonne chose que la majeure partie du contenu que nous consultons en ligne se trouve sur le Deep Web. Étant donné que les robots d’indexation ne peuvent pas « voir » derrière les connexions, ils ne peuvent pas facilement accéder à nos informations personnelles; ainsi, nos informations personnelles ne peuvent pas (ou ne devraient pas) apparaître dans les résultats d’un moteur de recherche comme Google.

Prêt à braver le nouvel Internet avec Brave ?

Brave a été conçu par une équipe de pionniers du Web axés sur les performances et la confidentialité. Aidez-nous à rendre la navigation meilleure.