AP 2013 – U8: XML Grundlagen

ACHTUNG: Bitte den Hinweis am Ende des Artikels beachten!

Bereits vorgestern konnten wir die Themen der diesjährigen Abschlussprüfung der Mediengestalter in Augenschein nehmen und auch hier wurde ausführlich über die Themen und das Prozedere der Prüfung berichtet. Heute möchte ich euch nun eine Präsentation vorstellen, die ich in 2011 in der Vorbereitungsphase zu meiner Abschlussprüfung vorbereitet habe. Damit macht dieser Beitrag auch den Auftakt zu einigen Posts rund um die Themen der Abschlussprüfung 2013. Das Thema nannte sich damals XML Grundlagen und ich denke, das Du in dieser Präsentation auch einige hilfreiche Hinweise und Tips  für die Vorbereitung zu Deiner Abschlussprüfung finden wirst.

Fachbereich: Konzeption und Gestaltung Aufgabe: U8 – XML

Natürlich darfst Du Dir die Präsentation auch kostenlos herunterladen und für Deine Vorbereitung verwenden. Über ein kleines Dankeschön in Form eines Kommentars würde ich mich natürlich freuen. Auch Kritik und Anmerkungen sind gerne gesehen. Vielen Dank.

 

// EDIT:

ACHTUNG:
Ich wurde von einer Leserin per Mail darauf hingewiesen, das in meiner Präsentation ein Fehler ist, bei dem Ihr aufpassen müsst:

und zwar auf der Seite 6 im XML-Dokument bei dem Tag <Land> ist der dazu geschlossene Tag </schweiz> falsch.

Dem kann ich natürlich nur zustimmen! Ich werde die Präsentation heute Abend entsprechend anpassen und neu hochladen. Danke für den Hinweis!

 

// EDIT 2:

Habe die ausgebesserte Version gerade hochgeladen bei scribd und hoffe, das die korrigierte Version bald dort zu finden sein wird und auch hier dann ausgetauscht wird.

Danke noch einmal für den Hinweis!

Medienproduktion – U8: Datenbank-Begriffe

Datenbank-Begriffe ist wieder eines dieser Themen, bei denen der zfa auch einfach nichts hätte sagen brauchen, da er sehr allgemein gehalten ist. Darunter lässt sich soviel packen, das es schwierig sein kann, eine Grenze zu ziehen. Sehr wahrscheinlich ist es jedoch, das man die absoluten Basics beherrschen sollte und dazu werde ich euch eine Art Glossar zusammenstellen und zu einigen Begriffen, bei denen es mir sinnvoll erscheint ein wenig dazu erklären.

Medienproduktion – U8: Datenbank-Begriffe

Wozu Datenbanken?

Mit Datenbanken versucht man generell ein großes Ziel zu erreichen: Daten strukturiert und sicher zu speichern und zu verwalten. Zu diesem Zweck speichern Datenbanken, die ihnen anvertrauten Daten in unterschiedlich vielen Tabellen. Die Anzahl der Tabellen ist dabei theoretisch unbegrenzt, doch gilt hier, wie im Leben sonst auch, der Grundsatz: „Soviel wie nötig, sowenig wie möglich.“ Wieviele letzten Endes nötig sind, will ich versuchen, im Folgenden zu Erläutern.

 

Tabellen

Jede Datenbank ist in Tabellen unterteilt und um zu funktionieren, muss es in jeder Datenbank mindestens eine Tabelle geben. Tabellen speichern die Daten, die wir speichern wollen ab und stellen Sie uns auf Anfrage wieder zur Verfügung.

Demotabelle mit der Beschriftung der einzelnen Bestandteile.

(Primär-)Schlüssel
Ein Schlüssel wird in Tabellen benutzt um die einzelnen Datensätze eindeutig zu Identifizieren. In der Tabelle oben wird die Kundennummer (Kd-Nr) als Schlüssel definiert.

Schlüssel beschleunigen den Zugriff auf die einzelnen Datensätze und ermöglichen es zwei oder mehr Tabellen miteinander zu verknüpfen.

Ein Schlüssel der die Identifikation der Datensätze in der aktuellen Tabelle ermöglicht, heißt Primärschlüssel.

Wird der gleiche Schlüssel in einer anderen Tabelle verwendet, die einen eigenen Primärschlüssel hat, wird der Schlüssel Fremdschlüssel genannt.

Ein und der selbe Schlüssel kann in unterschiedlichen Tabellen also Primär- und Fremdschlüssel sein. So werden Tabellen miteinander verknüpft.

Attribute
Sie definieren die Struktur der Tabelle und haben Namen, die sich innerhalb einer Tabelle nicht wiederholen sollten.

Feldname
Der Feldname (auch Attributname) gibt einen Eindruck davon, welcher Inhalt in den einzelnen Datenfeldern zu finden sein wird.

Datenfeld
Die kleinste Einheit einer Tabelle oder Datenbank ist das einzelne Datenfeld. In einem Datenfeld findet man die Daten die laut des zugehörigen Attributs hier zu finden sein soll.

Datensatz
Die Zeilen einer Tabelle werden als Datensatz bezeichnet. Ein Datensatz enthält also alle in der Datenbank gespeicherten Daten zu (zum Beispiel) einem Kunden und/oder Verknüpfungen zu anderen Tabellen. Jeder Datensatz muss über einen Schlüssel eindeutig identifizierbar sein. (Vergleiche auch Karteikartensystem.)

Probleme
Bei der einfachen Speicherung von Daten in einer Tabelle kann es zu einigen Problemen kommen, die uns in der späteren Arbeit mit den Daten im schlimmsten Fall einen unbrauchbaren Datenbestand bescheren kann.

Redundanz
Eines der Probleme, die auftreten können ist der Effekt, das einzelne Daten eines Datensatzes mehrfach innerhalb einer Tabelle gespeichert werden. Dies bezeichnet man als Redundanz.

id Firma Anschrift Kontakt Titel Telefon E-Mail
1 XYZ GmbH Eine-Straße 23 Max Muster Geschäftsführer 23667 max@xyz.xy
2 XYZ GmbH Eine-Straße 23 Nick Techler Technik 23668 nick@xyz.xy
3 ABC AG Eine-Straße 47 Graf Zahl Buchhaltung 54321 gz@abc.ag

Abb: ein aus mehreren Gründen ungeeignetes Modell

 

Bei diesen drei Einträgen mögen Redundanzen jetzt nicht wirklich von Bedeutung erscheinen, wenn man sich das ganze aber als tatsächliche Kundendaten vorstellt, die schnell über 10.000 Einträge haben können, dann kann das die Tabelle schon massiv aufblähen. Das Resultat (mehrfach) redundanter Datenhaltung sind am Ende ein größerer Speicherplatzbedarf, und mit jedem neuen Datensatz steigende Zugriffszeiten.

Anomalien
Anhand der oben abgebildeten Tabelle kann man aber auch noch die drei schlimmsten Probleme einer solchen Datenhaltung erkennen: Die Anomalien.

Anomalien treten immer dann auf, wenn man einen schreibenden Zugriff auf die Datenbank ausführt, also entweder Daten einträgt, sie verändert, oder löscht. Und daher haben die einzelnen Anomalien auch Ihre Namen:

Insert Anomalie
Eine Insert-Anomalie entsteht immer dann, wenn in eine solche Tabelle ein neuer Datensatz eingetragen werden muss, aber nicht alle benötigten Daten zur Verfügung stehen. Beim Eintragen in einer Tabelle MÜSSEN immer alle Daten eines Datensatzes angegeben werden! In unserem Fall wäre es zum Beispiel nicht möglich eine Firma anzulegen, ohne einen konkreten Ansprechpartner.

Update Anomalie
Eine Update-Anomalie entsteht immer dann, wenn wir etwas an unseren Datensätzen verändern wollen. Nehmen wir an, die Firma XYZ GmbH würde umziehen. Um dies fehlerfrei mit unserer Tabelle abzubilden, müssten wir die neue Adresse in jedem Datensatz ändern. Bei großen Datenmengen kann dies zu einem echten Problem werden und natürlich eine immense Fehlerquelle darstellen.

Delete Anomalie
Eine Delete-Anomalie entsteht immer dann, wenn wir einen Datensatz aus unserer Tabelle löschen müssen. Würde Graf Zahl aus der Firma ABC AG ausscheiden und seine Kontaktdaten müssten aus dem Datenbestand gelöscht werden wären für den Moment dann sämtliche Firmendaten die mit Jens Käsbauer verbunden sind, ebenfalls gelöscht. Erst durch einen neuen Eintrag würden sie wieder eingepflegt werden können. Passiert das nicht, sind die Daten komplett weg und können nicht mehr für zukünftige Aufträge herangezogen werden.

Lösungen
Natürlich gibt es für diese Probleme auch Abhilfe. Zuvor müssen wir uns aber Gedanken darüber machen, welche Ziele wir verfolgen müssen: Es müssen zum einen die Redundanzen verhindert werden zum anderen müssen wir versuchen die oben beschriebenen Anomalien soweit wie möglich zu verhindern. Das Zauberwort hierfür heisst Normalisierung.

Den zweiten Teil zu diesem Thema gibt es im Lauf der Woche. Ich hoffe, dass Dir meine Erklärungen und Definitionen ein bisschen geholfen haben. Wenn Dir gefallen hat, was Du liest, dann schreib doch in die Kommentare und teile den Artikel auf Facebook, oder Twitter.

 

// EDIT:
Eine aufmerksame Leserin hat mich auf zwei Rechtschreibfehler hingewiesen, die ich eben ausgebessert habe. Vielen Dank, Anne.