Datenmodellierung
Um Redundanz zu verhindern wurden Daten als eigenes Organisationselement behandelt und in eigene Datenbanksysteme gespeichert. Redundante Daten verursachen nicht nur höhere Speicherungskosten, sondern auch einen höheren Wartungsaufwand und erschweren die Datensicherung.
Wichtig hierfür sind die Entities und die Beziehungstypen. Entitytypen sind (Hauptwörter) zB Kunden, Lieferanten, Artikel usw. und werden als Rechteck im Diagramm dargestellt. Die Beziehungstypen (Relationship) sind logische Verknüpfungen zwischen 2 oder mehreren Entitytypen und werden als Rauten dargestellt. Beispiele hierfür wären (Zeitwörter) verkaufen, liefern oder malen.
Entitytypen und Beziehungstypen weisen Eigenschaften auf, die man als Attribute bezeichnet werden. Schlüsselattribute nehmen eine besondere Stellung ein, da sie nur einmal vorkommen dürfen (zB Artikelnummer) und werden auch als Primärschlüssel bezeichnet. Wird der Primärschlüssel in einem weiteren Entity benötigt, so ist er dort ein Fremdschlüssel (Sekundärschlüssel).
Die Beziehungstypen werden nur bei einer M:N-Beziehung als eigene Tabellen benötigt und können somit bei 1:1-, 1:N- und N:1-Beziehungen weggelassen werden. Bei 1:N- bzw N:1-Konnektivitäten enthält die N-Relation den Primärschlüssel der 1-Relation als Fremdschlüssel. Bei 1:1 ist es egal welche Relation den Sekundärschlüssel erhält.
Zuerst werden alle notwendigen Daten gesammelt. Was notwendig ist, entscheidet der Anwender aufgrund seiner Anforderungen an die Information. Danach muss jeder Eigenschaft ein eindeutiger Name, ein Attribut, zugeordnet werden. Dies muss für jeden Entitytyp durchgeführt werden. Abschließend muss jedes Attribut auf seine Zerlegbarkeit geprüft werden und wenn es das ist, auch zerlegt werden (zB Adresse in PLZ, Ort und Straße).
Im Relationenmodell werden die Daten in Relationen (Tabellen) gesammelt. Die allgemeine Form der Notierung einer Relation ist:
RELATION (Primärschlüssel, Attribut 1, Attribut 2, )
Merkmale :
jede Relation ist zweidimensional (Spalten und Zeilen)
die Spalten entsprechen den Attributen
die Zeilen entsprechen den Objekten
jeder Kreuzungspunkt enthält mindestens und höchstens einen Wert
Die Daten müssen Redundanzfreiheit und Konsistenz aufweisen. Dies bedeutet, dass es keine Mehrfachspeicherungen bzw keine unterschiedlichen Daten geben darf.
Es gibt mehrere Stufen auf dem Weg zu einer normalisierten Relation:
Unnormalisierte
Relation
An einem Kreuzungspunkt von Zeile und Spalte steht mehr als ein Wert.
Erste
Normalform
Es steht nur ein Wert an einem Kruzungspunkt.
Zweite
Normalform
Relation ist in 1. Normalform und jedes Attribut ist funktional vom
Primärschlüssel abhängig.
Dritte
Normalform
Relation ist in 2. Normalform und jedes Attribut nicht transitiv vom
Primärschlüssel abhängig ist. (transitiv: nicht direkt vom Prims. abhängig,
sondern von Attribut zB der Ort ist von PLZ abhängig und nicht von Prims. T eigene Relation)
Boyce
Codd Normalform (BCNF)
Seite 15 im IV. Jahrgang, Beispiel anschauen
Haupt | Fügen Sie Referat | Kontakt | Impressum | Nutzungsbedingungen