¿Qué es la Deep Web?
La Deep Web es la porción de Internet que no está indexada por motores de búsqueda tradicionales. A menudo requiere un inicio de sesión (como un nombre de usuario y una contraseña) o un software especial para acceder. La parte de la Web que es accesible utilizando motores de búsqueda—llamada a veces la Web Superficial—es en realidad solo una pequeña pieza del World Wide Web en general. La pieza mucho más grande y menos visible se llama Deep Web. Algunas estimaciones sugieren que el 90-95% del World Wide Web en general es en realidad la Deep Web.
Algunos ejemplos de cosas en la Deep Web incluyen correos electrónicos, contenido por suscripción (como Netflix), banca en línea, bases de datos, redes internas de empresas o incluso páginas de redes sociales no públicas. Generalmente cualquier página web o contenido que requiera un inicio de sesión o una herramienta personalizada para acceder se considerará parte de la Deep Web.
Nota que a menudo se confunde la Deep Web con la Dark Web. La Dark Web es una fracción de la Deep Web más grande. Mientras que la Dark Web requiere un navegador especial para acceder, la Deep Web se puede acceder con un navegador estándar (como Brave o Chrome), y es generalmente la porción de Internet a la que simplemente necesitas iniciar sesión para ver. La mayoría de la Deep Web es similar a la Web Superficial, solo que menos pública.
Desmintiendo algunos mitos sobre la Deep Web
Mito: Nunca he navegado en la Deep Web.
- Hecho: Probablemente falso. Si alguna vez has iniciado sesión en el sitio web de tu banco o en el portal de pacientes de tu médico, o has usado una suscripción musical para escuchar una lista de reproducción favorita, o incluso solo has iniciado sesión en tu cuenta de redes sociales, has participado en la Deep Web. Mucho de lo que hacemos en línea en nuestra vida diaria involucra la Deep Web.
Mito: Es ilegal navegar en la Deep Web.
- Hecho: Falso. Excepto por las leyes de censura en algunos países, generalmente no es ilegal visitar (o iniciar sesión en) sitios web que no están indexados por motores de búsqueda como Google o el Buscador de Brave. Lo que haces en el sitio web, sin embargo, puede ser ilegal.
Mito: La Deep Web está llena de actividades ilegales como drogas y armas.
- Hecho: Mayormente falso. La verdad es que hay actividad ilegal en la Web Superficial, la Deep Web y la Dark Web. Pero los tres tienen innumerables usos legítimos también.
Mito: Necesitas un software especial para acceder a la Deep Web.
- Hecho: Generalmente, no. La mayor parte de la Deep Web se puede acceder a través de tu navegador habitual, ya sea conociendo la URL de la página web, o simplemente iniciando sesión. Si quieres acceder a la Dark Web, entonces necesitarás un navegador especial como Tor.
¿Qué páginas web están en la Deep Web?
Para explicar qué páginas web están en la Deep Web, ayudará a entender un poco sobre cómo funcionan los motores de búsqueda.
Un rastreador web (también llamado rastreador de motores de búsqueda) es un programa que visita todas las direcciónes IP, sigue metódicamente cualquier enlace que encuentre y construye un índice de todas las palabras y frases en las páginas que alcanza. Así es como se construyen muchos índices de búsqueda. Cuando buscas en google.com “¿Qué es la Deep Web?”, la página de resultados de búsqueda devuelve ubicaciones en Internet (es decir, páginas web) que contienen esas palabras.
Si el rastreador no puede acceder a una página web para indexar su contenido, la página no “superficie” y por lo tanto permanece no indexada—esto es la Deep Web. Hay varias razones por las que una página web puede no ser indexada, incluyendo:
- El contenido está detrás de un inicio de sesión. El rastreador no puede iniciar sesión y por lo tanto no alcanza el contenido.
- Un CAPTCHA u otro “bloqueador de robots” bloquea al rastreador web de acceder al contenido.
- La página web es dinámica (es decir, cambia en respuesta a las necesidades de un usuario). Los rastreadores a menudo no pueden interactuar con la página en todas las configuraciones posibles y por lo tanto podrían perderse algún contenido.
- La página no tiene enlaces y por lo tanto está “oculta” de los rastreadores. Una araña web puede encontrar un sitio “raíz” (por ejemplo, example.com) pero solo encontrar una página específica (como example.com/drafts) si hay un enlace a ella desde el sitio raíz o desde otra página. Si no hay un enlace a una página y la única forma de acceder a ella es conocer la URL de la página, la araña web no la encontrará ni la indexará.
- El propietario del sitio web ha agregado código que solicita que los rastreadores web no indexen el contenido del sitio, dejando así páginas “públicas” fuera del índice de un motor de búsqueda.
¿Cómo accedes al contenido en la Deep Web?
Puedes acceder a la mayor parte de la Deep Web usando el mismo navegador que usas para la Surface Web. Los pasos adicionales dependen del tipo de contenido de la Deep Web que estás buscando.
A veces, todo lo que necesitas son credenciales como un inicio de sesión u otros privilegios de acceso. Iniciar sesión es cómo accedes a la parte de la Web que tiene tu información personal, o la red interna que usas en tu trabajo.
Dentro de un sitio web, puedes usar la función de búsqueda del sitio para encontrar contenido que el rastreador web no pudo indexar. Un sitio web puede tener mucho material que se encuentra buscando una palabra clave (por ejemplo, en el blog de example.com). Los rastreadores web no escriben palabras en campos de entrada como las cajas de búsqueda, por lo que es posible que nunca lleguen a este material. Esto es particularmente cierto en sitios con mucha información, como recursos gubernamentales o sitios de publicaciones en línea.
Si deseas ver contenido archivado (páginas o sitios web completos que ya no están “activos” en línea), la Wayback Machine almacena versiones antiguas de muchos sitios web. También almacena contenido como antiguos informes de noticias o publicaciones en redes sociales, y preserva información que de otro modo estaría inaccesible.
¿Cuáles son los problemas de seguridad en la Deep Web?
Excluyendo la fracción de la Deep Web referida como la “Dark Web”, navegar por la Deep Web es como navegar por la Surface Web y viene con las mismas preocupaciones respecto a tu privacidad y seguridad. Debes tomar precauciones similares como:
- Habilita Safe Browsing en tu navegador web. Todos los navegadores principales admiten esta función, que puede advertirte si estás a punto de visitar un sitio que se sabe aloja Malware.
- Elige un navegador enfocado en la privacidad, como Brave, con fuertes protecciones de privacidad.
- Cada vez que estés a punto de iniciar sesión en un sitio web o ingresar cualquier información importante, observa detenidamente la dirección del sitio en la URL y asegúrate de que es lo que esperas.
- Solo ingresa información personal en sitios web que usan HTTPS (busca “https://” en la barra de direcciones de tu navegador), y evita ingresar información personal en sitios que no tengan HTTPS.
- Mantén siempre el software que usas actualizado para que tenga las últimas correcciones de seguridad. Esto es especialmente importante para tu sistema operativo (SO) y navegador, que a menudo te informarán cuando necesiten actualizarse.
- En dispositivos móviles, solo instala aplicaciones desde la tienda de aplicaciones oficial. En dispositivos de computadora de escritorio o laptop, solo instala aplicaciones y extensiones desde la tienda oficial, o de empresas reputables.
- Si estás conectado a una red Wi-Fi pública o no confiable o a un ISP, o si el anonimato es importante, utiliza una VPN.
Finalmente, ten en cuenta que, a pesar de algunas connotaciones negativas con el nombre, generalmente es algo bueno que gran parte del contenido al que accedemos en línea esté en la Deep Web. Dado que los rastreadores no pueden “ver” detrás de los inicios de sesión, no pueden acceder fácilmente a nuestra información personal, y así nuestra información personal no puede (o no debería) aparecer en los resultados de un motor de búsqueda como Google.