A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

¿Qué es una base de datos?

Una base de datos es una colección organizada de datos, almacenados y accesados electrónicamente, usualmente a través de un sistema informático. Una base de datos puede ser pequeña o grande, simple o compleja dependiendo de la situación. Puede contener cualquier tipo de información y es un componente crítico de muchos sistemas informáticos.

¿Cuál es el propósito de una base de datos?

Una base de datos es simplemente un conjunto (para los propósitos de este artículo, un conjunto digital) de datos almacenados de una manera coherente y accesible. Recopilar y almacenar datos para uso futuro es necesario para que muchas aplicaciones y servicios funcionen (aunque la recopilación de datos de usuario en una base de datos puede presentar preocupaciones de privacidad y seguridad).

Pero recopilar datos es solo el primer paso. Para que los datos sean útiles, deben estar consistentemente formateados (es decir, “estructurados”) y almacenados de manera segura. Un buen sistema de base de datos proporciona acceso rápido y preciso a los datos específicos necesitados, y presenta los datos solicitados en un formato utilizable. Mantener la integridad de los datos, permitir y registrar cambios en los datos, y proporcionar capacidades de respaldo y restauración son algunas otras características de una base de datos bien diseñada.

¿Cómo se crea una base de datos?

Hay tres componentes para construir una base de datos:

  • El diseño del contenido de la base de datos
  • La arquitectura del sistema que aloja los datos
  • El sistema de gestión utilizado para mantener los datos

Para mostrar estos diferentes componentes en acción, en este artículo nos referiremos a una base de datos hipotética que registra datos sobre los usuarios de una aplicación de música, y las canciones que escuchan.

Diseño

El diseño de la base de datos considera qué elementos de datos se van a almacenar y cómo los diferentes elementos se relacionan entre sí, e incluye características para asegurar la integridad de los datos (es decir, eliminar la posibilidad de datos perdidos o inutilizables—también conocidos como “basura”). El objetivo de un buen diseño de base de datos es asegurar que los datos sean correctos, bien estructurados y fácilmente accesibles por programadores, administradores de bases de datos e ingenieros.

Para nuestra aplicación de música hipotética, en la fase de diseño los ingenieros identificarían los elementos de datos que el negocio necesita almacenar. Por ejemplo, cuando una persona se registra para usar la aplicación, el negocio podría querer guardar el nombre del usuario, dirección de correo electrónico y nombre de pantalla. Por separado, el negocio necesitaría una base de datos con los títulos de cada canción disponible en la aplicación. Cuando un usuario escucha una canción, los administradores necesitarían determinar qué datos adicionales capturar, como qué canción era, a qué hora del día la escucharon y si “les gustó” la canción.

Arquitectura

La arquitectura de la base de datos se centra en el hardware y el software utilizados para recopilar, alojar y acceder a los datos. Estas decisiones toman en cuenta el tamaño actual y eventual de la base de datos, quién accederá a ella, cómo y para qué se utilizarán los datos.

En el ejemplo de la aplicación de música, decidir sobre la configuración de hardware necesaria para almacenar los datos dependería de cosas como cuántos usuarios se espera que tenga el negocio, cuántas canciones estarán disponibles y con qué frecuencia los usuarios podrían escuchar. El negocio también consideraría si gestionar directamente los servidores de datos, o externalizar.

Sistema de gestión

El sistema de gestión de base de datos (DBMS) es el sistema de software utilizado para acceder y gestionar la base de datos. El DBMS soporta consultas, actualizaciones, respaldos y restauraciones (en caso de una pérdida de datos u otro problema mayor). El DBMS puede proporcionar información sobre la estructura de la base de datos, y registrar quién ha accedido y alterado los datos. Por lo general, se incorporan procedimientos de seguridad fuertes dentro del DBMS.

Para el ejemplo de la aplicación de música, el DBMS daría al administrador la capacidad de agregar nuevas canciones a la biblioteca, añadir o eliminar usuarios, o consultar los datos para obtener información como las canciones más populares. El DBMS podría permitir que muchos administradores tengan acceso a algunos datos (por ejemplo, qué canciones se reproducen), pero solo unos pocos tengan acceso a datos de usuarios o a sobrescribir/eliminar datos existentes.

¿Qué tipos de bases de datos existen?

Existen muchos tipos de bases de datos. A veces una base de datos se describe por su estructura de datos (cómo están organizados o almacenados los elementos de datos). Otras veces, una base de datos puede describirse basándose en su ubicación física, es decir, donde la computadora que almacena los datos realmente “vive.” Algunos descriptores comunes de bases de datos incluyen:

Bases de datos planas

Una estructura simple con todos los datos en un único archivo o tabla. Ejemplos de este tipo son una hoja de cálculo o un archivo de texto con elementos de datos separados por un carácter específico como una coma o un punto y coma.

Bases de datos relacionales

Una colección de tablas vinculadas por claves. Las tablas dividen los datos en agrupaciones que maximizan la eficiencia y minimizan la información repetitiva. Una tabla podría contener una sola fila para los usuarios (encabezada por un número de identificación único, o UID), mientras que una segunda tabla podría tener filas para productos (encabezadas por un ID de producto), y una tercera podría tener filas capturando las interacciones entre las dos primeras tablas. Al estructurarlo de esta manera, cada tabla puede mantenerse en un tamaño manejable.

Bases de datos NoSQL

Abreviatura de Not SQL (donde SQL es una abreviatura de Structured Query Language, un lenguaje estándar utilizado para consultar datos de una base de datos). También se puede llamar una base de datos de documentos, gráfica o de clave-valor. Las bases de datos NoSQL tienen una estructura más dinámica y pueden adaptarse a cambios en su estructura mejor que una base de datos SQL. Esto hace que NoSQL sea una opción popular para aplicaciones en tiempo real y nuevas aplicaciones que podrían necesitar cambiar rápidamente con el tiempo.

Bases de datos columnares

En contraste con el sistema típico de base de datos (que almacena datos en filas, y una sola fila se almacena como un conjunto), un sistema de base de datos columnar almacena datos en columnas (los datos en una sola columna se almacenan como un conjunto). Este tipo de base de datos se utiliza a menudo en aplicaciones de “big data” donde el enfoque es el análisis de datos. Cuando se almacena como un conjunto, una columna que contiene un solo tipo de datos puede ser rápidamente recuperada y analizada.

Diferentes ubicaciones de bases de datos (o “hosting”)

Hay varias opciones para dónde “vive” una base de datos (como en los servidores físicos donde está alojada). Estas opciones incluyen:

Interno

Las computadoras o servidores que almacenan los datos están físicamente ubicados en la oficina o edificio del propietario de la base de datos.

Cloud

Las computadoras o servidores que almacenan los datos están en una ubicación remota como una granja de servidores o centro de datos. Los servidores que almacenan los datos a menudo son mantenidos por terceros, quienes pueden o no también gestionar la base de datos en sí. Una empresa puede optar por usar el cloud y los servicios asociados porque es más fácil o menos riesgoso que gestionarlo por sí mismos internamente.

Distribuido

Los datos se almacenan en múltiples computadoras, posiblemente en múltiples ubicaciones. La ventaja de rendimiento de esta disposición es un tiempo de respuesta mejorado. Otra ventaja de distribuir datos es descentralizar el control de la web y su contenido, reduciendo la dependencia de unas pocas grandes empresas tecnológicas. La descentralización es un concepto clave en el surgimiento de Web3 y blockchains.

Cadena de bloques

La tecnología central de Web3, un blockchain está compuesto por muchas computadoras individuales (incluso computadoras personales o dispositivos) o servidores que mantienen las mismas copias de datos registrados. A este registro compartido se le llama comúnmente “libro de registros”, y de hecho funciona de un modo muy similar al tradicional. Los datos de estos libros de registros compartidos pueden ser de cualquier tipo, pero los registros de transacciones de criptomonedas son a día de hoy los más habituales.

¿Qué es un lenguaje de consulta?

Un lenguaje de consulta es una forma codificada para que un usuario acceda a los datos en una base de datos. Una consulta permite a un usuario recuperar una pieza de datos o conjuntos completos de datos que comparten una o más características. El lenguaje de consulta correcto a utilizar depende de la estructura de la base de datos. Una base de datos relacional podría usar SQL, mientras que una base de datos NoSQL podría usar MongoQL. Estos son solo dos ejemplos de muchas posibles opciones de lenguaje.

¿Cómo se mantiene segura una base de datos?

Hay varias capas de protección en la seguridad de las bases de datos. Primero está la seguridad del acceso. Los datos solo deben ser accesibles para las personas que los necesitan. Además, no todos los usuarios necesitan tener los mismos permisos. Algunos usuarios pueden tener acceso a una cantidad limitada de los datos, mientras que otros pueden tener acceso para ver los datos pero no para alterarlos.

Luego está la seguridad de los datos en sí mismos, en caso de que alguien obtenga acceso no autorizado. Las mejores prácticas incluyen encriptar datos sensibles cuando están almacenados, de modo que aunque los datos sean robados no puedan ser leídos.

Finalmente, es importante poder restaurar los datos en caso de que hayan sido comprometidos. Los procedimientos de respaldo y recuperación evitan que los datos se pierdan o corrompan permanentemente al crear respaldos periódicos (por ejemplo, cada 24 horas) de la base de datos y sus datos.

¿Puedo proteger mis datos personales en las bases de datos?

No hay mucho que puedas hacer como individuo para proteger tus datos una vez están en la base de datos de otra persona. En general, debes confiar en que el propietario de la base de datos practique una buena ciberseguridad. Cuando tienes la opción, puedes ser cuidadoso sobre cuándo y dónde proporcionar tus datos personales:

  • Verifica que el URL comience con “https://” (no “http://”). Esto indica que tus datos están encriptados durante la transferencia. Aunque esto no es una garantía de que tus datos estén almacenados encriptados, https podría mejorar las probabilidades.
  • Minimiza el número de lugares donde se almacenan tus datos. Cuantos menos lugares almacenen tus datos, menos exposición tendrás al robo de datos. Por ejemplo, configura pagos automáticos a través del sistema de pago de facturas de tu banco en lugar de hacerlo en cada sitio web de cuenta. Esto reduce el número de bases de datos en las que se almacena la información de tu cuenta bancaria.

Afortunadamente, ha habido actividades legales recientes dirigidas a proteger los datos personales, incluyendo el Reglamento General de Protección de Datos (RGPD) adoptado en la UE, y el California Consumer Privacy Act (CCPA), que entre otras protecciones permiten a los usuarios ver qué datos se están almacenando y solicitar que se corrijan o eliminen sus datos. A medida que se promulguen más leyes de este tipo, la protección de los datos de los individuos seguirá mejorando.

¿Te atreves a descubrir el nuevo Internet de Brave?

Brave está desarrollado por un equipo de precursores de la web centrados en el rendimiento y la privacidad. Ayúdanos a solventar las deficiencias de la navegación.