Datenbank

engl.: database

Wachsende Datenmengen und Datenverfügbarkeiten stellen gerade in der Logistik immer höhere Anforderungen an die Datenverwaltung. War es früher üblich, Daten in Papierform zum Beispiel in Karteikartensystemen zu verwalten, gewinnen seit den 1980er Jahren digitale Verwaltungssysteme zunehmend an Bedeutung. So werden heute Personaldaten, Artikelspektren oder auch Lager- sowie Montagedaten fast ausschließlich in Form von Datenbanken verwaltet.

Eine Datenbank beschreibt einen definierten Ausschnitt der realen Welt, an dem ein bestimmter Personenkreis interessiert ist [3], beziehungsweise enthält zentral gesammelte, redundanzfreie oder redundanzarme Daten, die über das Datenbankverwaltungssystem einer Vielzahl unterschiedlicher Anwender zur Verfügung gestellt werden. Ein Datenbankprogramm beziehungsweise Datenbankmanagementsystem (DBMS) dient der Verwaltung einer oder mehrerer Datenbanken sowie der Regelung des Datenzugriffs [1]. Es enthält sämtliche Programme und Werkzeuge, die zur Pflege und Verarbeitung der Daten notwendig sind. Im Einzelnen sind das Tools zur Auswertung, Analyse, Bearbeitung und Präsentation der Daten sowie zur Überwachung von Zugriffsrechten und Benutzeranfragen. Unter einem Datenbanksystem versteht man schließlich die Einheit von Datenbank(en) und DBMS.

Motivation für den Einsatz von Datenbanken

Mit Hilfe von Datenbanken lassen sich Daten fast jeglicher Art digital speichern, verwalten und auswerten. Bei isolierten Einzeldateien kommt es besonders bei großen, in Beziehung stehenden Datenstrukturen oftmals zu Redundanzen in der Datenhaltung und somit zu Inkonsistenzen [2]. Gerade MSExcel-Dateien werden von den damit arbeitenden Benutzern beziehungsweise Benutzergruppen in vielfältiger Weise kopiert und bearbeitet. Diese redundante Form der Datenhaltung führt bei fehlender Aktualisierung aller sich im Umlauf befindenden Kopien automatisch zu Inkonsistenzen, also nicht eindeutig hinterlegter Daten. DBMS verwalten die Daten an zentraler Stelle und regeln deren Zugriff auf die Datenbasis. Redundanzen lassen sich zudem durch die Strukturierung der Datenbank auf Basis der Grundsätze des relationalen Datenmodells vermeiden. Durch die für alle Anwender einheitliche, zentrale Datenhaltung und die Vergabe von Zugriffsrechten können in DBMS voneinander unabhängige Datenteile innerhalb desselben Datenbanksystems parallel bearbeitet werden, abhängige Daten nur, wenn der Zugriff berechtigt und der Datenteil freigegeben ist. Datenbanken beziehungsweise DBMS zeichnen sich folglich durch einen schnellen und ortsunabhängigen Datenzugriff bei geringem Speicherplatzbedarf aus. Auf Grund der relationsbasierten Datenhaltung sind vielseitige, aufgabenorientierte Auswertungen der Datenbasis möglich.

Eng mit der Konsistenz der Datenbasis ist auch deren Integrität verknüpft. Mit Hilfe des DBMS lassen sich Formatierungen für jedes einzelne Datenfeld festlegen und somit deren Inhalte überwachen. Der jeweilige Anwender kann also nur innerhalb der klar definierten Grenzen Eingaben tätigen. Besonders für eine spätere Verwendung der Daten in anderen Entwicklungswerkzeugen ist eine feste Formatierung bestimmter Datenwerte - insbesondere bei Schlüsselattributen - unabdingbar und von höchster Priorität. DBMS sind darüber ein Garant für ein hohes Maß an Datensicherheit. Während sich bei der Datenverwaltung in Form verteilter Einzeldateien Zugriffsrechte nur auf die gesamte Datei oder bestimmte Ausschnitte beziehen, erfolgt der Datenzugriff bei DBMS nach klaren Zugriffsrechten. So wird nicht nur die Einsicht in bestimmte Daten und deren Bearbeitung verhindert, sondern auch einer Informationsüberflutung des Anwenders vorgebeugt. Des Weiteren lassen sich Änderungen an Datensätzen an Hand festgelegter Indizes nachvollziehen, wodurch die Transparenz des Zustandekommens von Datensätzen gewährleistet ist.

Datenbankstruktur und Datenabstraktion

Voraussetzung für effiziente, konsistente, durchgängige und redundanzfreie Datenhaltung durch das DBMS ist die Ausarbeitung einer verbindlichen Datenbankstruktur sowie die Abstraktion der Daten. Grundlage der Datenbankstruktur beziehungsweise des Datenbankschemas bildet der so genannte Datenbankkatalog, der die eigentliche Definition der Datenbankstruktur, die aus Metadaten besteht, beinhaltet. Ein Datenbanksystem enthält folglich nicht nur die eigentlichen informationstragenden Daten, sondern auch die zum Auffinden dieser nötigen Metadaten. Das DBMS weiß somit genau, wo sich welche Daten befinden, und kann sie anschließend dem Benutzer zur Verfügung stellen. Der Vorteil dieses strukturierten Aufbaus liegt in der Tatsache, dass Metadaten nur verändert werden, sofern die Datenbankstruktur selbst geändert wird. Dies ist jedoch bei einer fertig entwickelten Datenbank nur äußerst selten der Fall. Die eigentlichen Daten verändern sich dagegen bei jeder Anpassung sowie beim Löschen beziehungsweise Anlegen von Datensätzen. Man spricht in diesem Zusammenhang auch von Datenabstraktion. Darunter versteht man die Unabhängigkeit zwischen Daten und Anwendungsprogrammen. Änderungen der Daten haben also in der Regel keinen Einfluss auf die Anwendungsprogramme selbst. Die Umsetzung dieses Systems erfolgt durch eine Einteilung in drei Abstraktionsebenen [2]. Die physische Ebene legt die Speicherstrukturen sowie die Zugriffspfade auf die Dateien fest, in denen die Daten abgelegt werden. Diese Ebene befindet sich im Hintergrund und wird vom normalen Anwender der Datenbank nicht wahrgenommen. Die logische Ebene beschreibt die eigentliche Struktur der Datenbank. Sie ist für den Anwender sichtbar, kann jedoch auch ausgeblendet werden. Durch die externe Ebene ist es möglich, den einzelnen Benutzergruppen die von ihnen benötigten Daten exklusiv zur Verfügung zu stellen. So hat beispielsweise ein Lagerist Einsicht in alle relevanten Lagerdaten, auf Personaldaten kann der jedoch nicht zugreifen. Man bezeichnet die externe Ebene deshalb auch als Datensicht oder Sicht. Die Aufteilung in drei Ebenen lässt Änderungen auf einer Ebene zu, ohne dabei die Daten darauf aufbauender Ebenen ebenfalls abändern zu müssen. Man spricht in diesem Zusammenhang von der physischen und logischen Unabhängigkeit der Daten.

Datenbankentwurf

Grundlage der Entwicklung einer funktionierenden Datenbank stellt ein geeigneter und sorgfältig durchgeführter Entwurf dar. Er ist die Basis, um die jeweiligen Ausschnitte der realen Welt in Form von Objekten und deren Beziehungen, also Daten, abbilden zu können. Realisiert wird dies mit Hilfe der so genannten Datendefinitionssprache (DDL) sowie der Datenmanipulationssprache (DML). Erstere beschreibt die Struktur als physische Voraussetzung zur Ablage der Daten, zweitere die Möglichkeiten zur Speicherung, Änderung oder Löschen der Daten. Der Datenbankentwurf gliedert sich prinzipiell in drei Schritte. Zunächst müssen die von der Datenbank zu erfüllenden Aufgaben sowie Randbedingungen im Rahmen einer Anforderungsanalyse beschrieben werden. Klärungsbedarf herrscht besonders bezüglich der Frage, welche Daten mit welchem Datentyp abgebildet werden, welche Auswertungsmöglichkeiten dem Anwender gegeben werden oder welche Benutzergruppen Zugriff auf die Datenbank haben. Speziell Gespräche mit den späteren Anwendern eignen sich, um Schwachstellen der bisherigen Datenverwaltung aufzudecken und daraus Anforderungen zu definieren. Diese Anforderungsdefinition kann anfangs noch recht allgemein gehalten werden und sich später detaillieren. Beispielsweise kann es bei weniger komplexen oder bereits eindeutigen Datenbasen ausreichend sein, lediglich die Art der zu verwaltenden Daten zu klären und erst während der Entwicklung Auswertungsmöglichkeiten oder Zugriffsrechte festzulegen. Gerade bei großen, relationalen Datenbasen ist es jedoch zweckmäßig, die Anforderungen im Voraus zu klären und in Form eines Lastenheftes verbindlich festzuhalten, da Versäumnisse in frühen Entwicklungsphasen später nur mit hohem Aufwand zu realisieren sind. Auf Basis der Anforderungsanalyse wird daraufhin ein konzeptuelles Modell entworfen. Es werden Entscheidungen über die objektgerechte Zerlegung der Daten und deren Detaillierung getroffen. Mit Hilfe des Entity-Relationship-Modells lassen sich die Beziehungen der einzelnen Objekte abbilden. Des Weiteren wird an Hand der zu verwaltenden Daten und Randbedingungen entschieden, welches Datenbankmanagementsystem verwendet werden soll. Abschließend wird der Konzeptentwurf als rechnerbasierte Datenbank implementiert. Die Erstellung des logischen Datenmodells ist prinzipiell über mehrere Ansätze möglich, wobei in den meisten Fällen das relationale Datenmodell Anwendung findet. Bei diesem auch für die Erstellung von MSAccess-Datenbanken angewandten Modellierungsansatz werden die Daten in Form mehrerer Tabellen gespeichert, die miteinander in Beziehung stehen.

Unterteilung der Datenbankmanagementsysteme

Grundlegend können Datenbankmanagementsysteme in Desktop- und Client-Server-Systeme unterteilt werden [4]. Desktopsysteme wie das vielfach verwendete MS Access werden meist für Datenbankanwendungen mit geringerem Datenvolumen verwendet. Durch die zentrale Architektur von Datenbank, DBMS und Datenbankanwendung auf einem Rechner ergeben sich zusätzlich geringere Anforderungen an die Hardware des Systems. Zudem zeichnen sie sich durch eine hohe Verfügbarkeit aus. Allerdings sind Mehrbenutzerbetrieb sowie Datensicherheit nur bis zu einem gewissen Grad in ausreichendem Maße möglich. Client-Server-Systeme dagegen verwenden eine dezentrale, verteilte Datenbankstruktur. So liegen Datenbank und DBMS auf einem eigenen Server, nur die eigentliche Anwendung befindet sich auf dem jeweiligen Client-Rechner. Auf Grund des schnellen und zuverlässigen Zugriffs auf eine große Datenmenge eignen sich diese Systeme besonders für den Mehrbenutzerbetrieb. Die in der Regel hohen Lizenzgebühren machen sie jedoch in vielen Fällen uninteressant. Typische auf dem Markt verfügbare Vertreter sind Oracle, MySQL oder MS SQL-Server.

Quellen

[1] Noack, W.: 2003 - Grundlagen für Datenbankentwickler, RRZN / Universität Hannover, Bodenheim: Herdt-Verlag 2004.

[2] Korth, H.; Silberschatz, A.: Database System Concepts, New York: Mc Graw-Hill 1991.

[3] Elmasri, R.; Navathe, S.: Grundlagen von Datenbanksystemen, München: Pearson Studium 2004.

[4] Bager, J.: In die passende Schublade, Datenbanken: Wie man Informationen am besten organisiert. In: c`t Magazin für Computertechnik, 4, 1999

[5] Wikipedia : Wikipedia die freie Enzyklopädie - Daten [1] (21.08.2006)

Seitenhierarchie