Datenschutz-Glossar

Datenbankihre

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Was ist eine Datenbank?

Eine Datenbank ist eine organisierte Sammlung von Daten, die elektronisch gespeichert und abgerufen werden, normalerweise über ein Computersystem. Eine Datenbank kann je nach Situation klein oder groß, einfach oder komplex sein. Eine Datenbank kann jede Art von Information enthalten und ist ein entscheidender Bestandteil vieler Computersysteme.

Was ist der Zweck einer Datenbank?

Eine Datenbank ist einfach eine Menge (für die Zwecke dieses Artikels eine digitale Menge) von Daten, die auf eine kohärente und zugängliche Weise gespeichert sind. Das Sammeln und Speichern von Daten für die zukünftige Nutzung ist für viele Apps und Dienste notwendig (auch wenn die Sammlung von Benutzerdaten in einer Datenbank Privacy und Security Bedenken aufwerfen kann).

Aber das Sammeln von Daten ist nur der erste Schritt. Damit die Daten nützlich sind, müssen sie konsistent formatiert (d.h. „strukturiert“) und sicher gespeichert werden. Ein gutes Datenbanksystem ermöglicht den schnellen und genauen Zugriff auf die benötigten Daten und präsentiert die angeforderten Daten in einem brauchbaren Format. Zu den weiteren Merkmalen einer gut gestalteten Datenbank gehören die Aufrechterhaltung der Datenintegrität, die Ermöglichung und Protokollierung von Datenänderungen sowie Sicherungs- und Wiederherstellungsfunktionen.

Wie erstellt man eine Datenbank?

Es gibt drei Komponenten beim Aufbau einer Datenbank:

  • Das Design der Datenbankinhalte
  • Die Architektur des Systems, das die Daten hostet
  • Das Verwaltungssystem, das zur Pflege der Daten verwendet wird

Um diese verschiedenen Komponenten in Aktion zu zeigen, beziehen wir uns in diesem Artikel auf eine hypothetische Datenbank, die Daten über die Benutzer einer Musik-App und die Lieder, die sie hören, aufzeichnet.

Design

Datenbankdesign berücksichtigt, welche Datenelemente gespeichert werden und wie die verschiedenen Elemente zueinander in Beziehung stehen, und umfasst Funktionen zur Sicherstellung der Datenintegrität (d.h. das Risiko für verlorene oder unbrauchbare Daten zu eliminieren). Das Ziel eines guten Datenbankdesigns ist es, sicherzustellen, dass die Daten korrekt, gut strukturiert und leicht von Programmierern, Datenbankadministratoren und Ingenieuren zugänglich sind.

Für unsere hypothetische Musik-App würden die Ingenieure in der Designphase die Datenelemente identifizieren, die das Unternehmen speichern muss. Zum Beispiel, wenn sich eine Person anmeldet, um die App zu verwenden, möchte das Unternehmen möglicherweise den Namen des Benutzers, die E-Mail-Adresse und den Bildschirmnamen speichern. Separat benötigt das Unternehmen eine Datenbank mit den Titeln aller auf der App verfügbaren Lieder. Wenn ein Benutzer ein Lied hört, müssten die Administratoren feststellen, welche zusätzlichen Daten erfasst werden sollen, wie z.B. welches Lied es war, zu welcher Tageszeit sie hörten und ob sie das Lied “mochten”.

Architektur

Die Datenbankarchitektur konzentriert sich auf die Hardware und Software, die zur Sammlung, Speicherung und zum Abrufen der Daten verwendet werden. Diese Entscheidungen berücksichtigen die aktuelle und zukünftige Größe der Datenbank, wer darauf zugreifen wird, wie und wofür die Daten verwendet werden.

Im Beispiel der Musik-App hängt die Entscheidung über die benötigte Hardware-Konfiguration zur Speicherung der Daten von Faktoren ab, wie z.B. wie viele Benutzer das Unternehmen zu haben erwartet, wie viele Lieder verfügbar sein werden und wie oft die Nutzer vermutlich hören werden. Das Unternehmen würde auch überlegen, ob es die Daten Server direkt selbst verwalten oder auslagern soll.

Verwaltungssystem

Das Datenbankverwaltungssystem (DBMS) ist das Softwaresystem, das zum Zugriff auf und zur Verwaltung der Datenbank verwendet wird. Das DBMS unterstützt Abfragen, Aktualisierungen, Sicherungen und Wiederherstellungen (im Falle eines Datenverlusts oder eines anderen größeren Problems). Das DBMS kann Informationen über die Datenbankstruktur liefern und nachverfolgen, wer auf Daten zugegriffen und diese geändert hat. Starke Sicherheitsverfahren sind normalerweise im DBMS integriert.

Im Beispiel der Musik-App würde das DBMS dem Administrator die Möglichkeit geben, neue Lieder zur Bibliothek hinzuzufügen, Benutzer hinzuzufügen oder zu entfernen oder die Daten nach Informationen wie den beliebtesten Liedern abzufragen. Das DBMS kann vielen Administratoren erlauben, Zugriff auf einige Daten zu haben (z.B. welche Lieder gespielt werden), aber nur wenigen erlauben, Zugriff auf Nutzerdaten zu haben oder vorhandene Daten zu überschreiben/zu löschen.

Welche Arten von Datenbanken gibt es?

Es gibt viele Arten von Datenbanken. Manchmal wird eine Datenbank durch ihre Datenstruktur beschrieben (wie die Datenelemente organisiert oder gespeichert sind). Andere Male wird eine Datenbank basierend auf ihrem physischen Standort beschrieben – wo der Computer, der die Daten speichert, tatsächlich „lebt“. Einige gebräuchliche Datenbankbezeichner umfassen:

Flache Datenbanken

Eine einfache Struktur mit allen Daten in einer einzigen Datei oder Tabelle. Beispiele für diese Art sind eine Tabellenkalkulation oder eine Textdatei mit durch ein bestimmtes Zeichen wie ein Komma oder Semikolon getrennten Datenelementen.

Relationale Datenbanken

Eine Sammlung von Tabellen, die durch Schlüssel verknüpft sind. Die Tabellen unterteilen die Daten in Gruppen, die die Effizienz maximieren und wiederholte Informationen minimieren. Eine Tabelle könnte eine einzelne Zeile für Nutzer enthalten (eingeleitet durch eine einzigartige Identifikationsnummer oder UID), während eine zweite Tabelle Zeilen für Produkte haben könnte (eingeleitet durch eine Produkt-ID), und eine dritte Zeilen, die die Interaktionen zwischen den ersten beiden Tabellen erfassen, enthalten könnte. Durch diese Strukturierung kann jede Tabelle eine handhabbare Größe behalten.

NoSQL-Datenbanken

Kurzform für Not SQL (wobei SQL die Abkürzung für Structured Query Language ist, eine standardisierte Sprache zur Abfrage von Daten aus einer Datenbank). Kann auch als Dokumenten-, Graph- oder Schlüssel-Wert-Datenbank bezeichnet werden. NoSQL-Datenbanken haben eine dynamischere Struktur und können Änderungen an ihrer Struktur besser aufnehmen als eine SQL-Datenbank. Das macht NoSQL zu einer beliebten Wahl für Echtzeit-Apps sowie neue Apps, die sich möglicherweise schnell ändern müssen.

Columnar-Datenbanken

Im Gegensatz zu typischen Datenbanksystemen (die Daten in Zeilen speichern, wobei eine einzelne Zeile als Satz gespeichert wird) speichert ein columnar-Datenbanksystem Daten in Spalten (Daten in einer einzigen Spalte werden als Satz gespeichert). Diese Art von Datenbank wird oft in „Big Data“-Anwendungen verwendet, bei denen der Fokus auf der Analyse von Daten liegt. Wenn als Satz gespeichert, kann eine Spalte, die eine einzige Art von Daten enthält, schnell abgerufen und analysiert werden.

Verschiedene Datenbankstandorte (oder „Hosting“)

Es gibt mehrere Optionen, wo eine Datenbank „lebt“ (wie auf welchen physischen Servern sie gehostet wird). Diese Optionen umfassen:

In-House

Die Computer oder Server, die die Daten speichern, befinden sich physisch im Büro oder Gebäude des Datenbankbesitzers.

Cloud

Die Computer oder Server, die die Daten speichern, befinden sich an einem entfernten Standort wie einem Server-Farm oder Rechenzentrum. Die Server, die die Daten speichern, werden oft von einem Drittanbieter gewartet, der möglicherweise auch die Datenbank selbst verwaltet. Ein Unternehmen könnte sich für die Cloud und die zugehörigen Dienstleistungen entscheiden, weil es einfacher oder weniger riskant ist, als die Verwaltung im eigenen Haus.

Dezentralisiert

Daten werden auf mehreren Computern, möglicherweise an mehreren Standorten gespeichert. Der Leistungsvorteil dieser Anordnung ist eine verbesserte Reaktionszeit. Ein weiterer Vorteil der Verteilung von Daten ist die Dezentralisierung der Kontrolle des Web und seines Inhalts, wodurch die Abhängigkeit von einigen wenigen großen Technologieunternehmen verringert wird. Dezentralisierung ist ein Kernkonzept beim Aufkommen von Web3 und Blockchains.

Blockchain

Die Kerntechnologie von Web3, eine Blockchain besteht aus vielen einzelnen Computern (auch Personal Computern oder Geräten) oder Servern, die dieselben Kopien der aufgezeichneten Daten pflegen. Dieser gemeinsame Datensatz wird allgemein als „Hauptbuch“ bezeichnet und funktioniert ähnlich wie ein herkömmliches Hauptbuch, das in der Buchhaltung verwendet wird. Die Daten in diesen gemeinsam genutzten Hauptbüchern können alles sein, aber am häufigsten handelt es sich um eine Aufzeichnung von Kryptowährungstransaktionen.

Was ist eine Abfragesprache?

Eine Abfragesprache ist eine kodifizierte Methode, damit ein Nutzer auf die Daten in einer Datenbank zugreifen kann. Eine Abfrage ermöglicht es einem Nutzer, ein Datenelement oder ganze Datensätze abzurufen, die eine oder mehrere Gemeinsamkeiten aufweisen. Die richtige Abfragesprache hängt von der Struktur der Datenbank ab. Eine relationale Datenbank könnte SQL verwenden, während eine NoSQL-Datenbank MongoQL verwenden könnte. Dies sind nur zwei Beispiele von vielen möglichen Sprachoptionen.

Wie wird eine Datenbank sicher gehalten?

Es gibt mehrere Schutzschichten in der Datenbanksicherheit. Die erste ist die Sicherheit des Zugangs. Die Daten sollten nur für Personen zugänglich sein, die sie benötigen. Darüber hinaus müssen nicht alle Benutzer die gleichen Berechtigungen haben. Einige Benutzer können Zugriff auf eine begrenzte Menge der Daten haben, während andere Zugriff zur Ansicht, jedoch nicht zur Änderung der Daten haben dürfen.

Dann gibt es die Sicherheit der Daten selbst, falls jemand unbefugten Zugang erhält. Best Practices umfassen die Verschlüsselung sensibler Daten bei der Speicherung, sodass selbst wenn Daten gestohlen werden, sie nicht gelesen werden können.

Schließlich ist es wichtig, in der Lage zu sein, Daten wiederherzustellen, falls sie kompromittiert wurden. Backup- und Wiederherstellungsverfahren verhindern, dass Daten dauerhaft verloren gehen oder beschädigt werden, indem periodische Backups (z. B. alle 24 Stunden) der Datenbank und ihrer Daten erstellt werden.

Kann ich meine persönlichen Daten in Datenbanken schützen?

Als Einzelperson kannst du nicht viel tun, um deine Daten zu schützen, sobald sie sich in der Datenbank eines anderen befinden. Im Allgemeinen musst du dich darauf verlassen, dass der Inhaber der Datenbank gute Cybersicherheit-Praktiken anwendet. Wenn du die Option hast, kannst du darauf achten, wo und wann du deine persönlichen Daten angibst:

  • Überprüfe, ob die URL mit „https://“ (nicht „http://“) beginnt. Dies zeigt an, dass Ihre Daten während der Übertragung verschlüsselt sind. Auch wenn dies keine Garantie dafür ist, dass Ihre Daten verschlüsselt gespeichert werden, kann https die Wahrscheinlichkeit verbessern.
  • Minimiere die Anzahl der Orte, an denen deine Daten gespeichert sind. Je weniger Orte Ihre Daten gespeichert sind, desto geringer ist die Gefahr eines Datendiebstahls. Richte beispielsweise automatische Zahlungen über das Zahlungssystem deiner Bank ein, anstatt auf jeder Kontowebsite. Dies reduziert die Anzahl der Datenbanken, auf denen deine Bankkontoinformationen gespeichert sind.

Glücklicherweise hat es in letzter Zeit gesetzliche Maßnahmen zum Schutz personenbezogener Daten gegeben, einschließlich der in der EU verabschiedeten Allgemeine Datenschutzverordnung (DSGVO) und der California Consumer Privacy Act (CCPA), die es Benutzern ermöglichen, zu sehen, welche Daten gespeichert werden, und zu fordern, dass ihre Daten korrigiert oder gelöscht werden. Mit der Einführung weiterer dieser Gesetze wird der Schutz der Daten von Einzelpersonen weiter verbessert.

Bereit für Brave, dem neuen Internet?

Brave wurde von einem Team aus datenschutz- und leistungsorientierten Vorreitern des Webs entwickelt. Helfen Sie uns dabei, gemeinsam das Internet zu reparieren.