DBS - HSLU
Datenbanksysteme
Datenbanksysteme
Fichier Détails
Cartes-fiches | 53 |
---|---|
Langue | Deutsch |
Catégorie | Informatique |
Niveau | Université |
Crée / Actualisé | 24.11.2020 / 28.01.2023 |
Lien de web |
https://card2brain.ch/box/20201124_dbs_hslu
|
Intégrer |
<iframe src="https://card2brain.ch/box/20201124_dbs_hslu/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was ist der Unterschied zwischen einer Datenbank und einem Informationssystem?
Eine Datenbank umfasst nur den Bestand an Daten. Ein Informationssystem hat auch Prozesse zur Verarbeitung der Daten, zur Benutzerinteraktion, Kommunikation und Prozesssteuerung. Informationssysteme sind soziotechnisch, d.h. Mensch-Maschinen-Systeme.
Was ist der Unterschied zwischen einem Datenbank-System und einem Dateisystem?
Ein Datenbanksystem umfasst die Datenbasis und die Verwaltungsprogramme, die als Einheit gekapselt sind. Ein Dateisystem bietet nur Speicherplatz für die Datenbasis, die Verwaltungsprogramme müssen pro Dateityp separat installiert werden.
Was ist der Unterschied zwischen einer SQL- und einer NoSQL-Datenbank?
SQL-Datenbanken sind relational, NoSQL-Datenbanken sind typischerweise nicht-relational und bieten keine Schnittstelle für die SQL-Sprache. Zudem sind NoSQL für grosse Datenmengen (Sharding, scale-out) und flexible Schemas ausgerichtet.
Was ist der Unterschied zwischen Datenbanken und Datenmanagement?
System vs. Prozess
Inwiefern handelte es sich gemäss der Datenbanktheorie bei IDS um eine Datenbank?
IDS kapselte erstmals die Datenspeicherung und den Datenzugriff bzw. deren Verwaltung in
einem einheitlichen, integrierten System unabhängig von der Applikationslogik (Data-
Independence)
Warum ist eine Sammlung von XML-Dateien auf einem Server kein Datenbank-System?
DBMS fehlt, Kapselung fehlt, Sprache für DQL usw.
Welche Ziele und Werkzeuge der 4 Eckpfeiler des Datenmanagements nach Meier und
Kaufmann 2016 sind im Beispiel erkennbar?
Beispiel: Börse Stuttgart
- Architektur
- Dimensionen wie Kunden, Kundengruppen, Anlageprodukte, Zeiträume
- Datenmodellierung mit Fokus auf Erweiterbarkeit
- Schema-Integration
- Administration
- In-House Administration
- Zentralisiertes Metadaten-Management: Datenherkunft und Verwendung
- Technik
- Einsatz von Standardkomponenten
- Integration IBM Tools und Microsoft SQL Server
- Tools für Business Analytics (Cognos)
- Nutzung
- Zentrale Datenplattform für Reports und Analysen zur Steuerung des zentralen Handelsprozesses
- Datenquelle: Ausgeführte Orders
- Zugriff über Web
- Kostensenkung bei Reporterstellung
Welche Vor- und Nachteile hat aus Ihrer Perspektive der Einsatz von Datenbank-Systemen?
Vorteile
- Schnelligkeit, Zeitersparnis
- Räumliche Unabhängigkeit
- Interaktivität
- Suchvariabilität: eine Suche kann großen Zeitraum umfassen, mehrere Datenbanken können gleichzeitig abgefragt werden
- Aktualität
- Mehrdimensionale Verknüpfungen möglich
- Suchstrategie kann problemlos nachvollzogen werden (bei Recherchen in gedruckten Diensten oft problematisch)
- mehr Einstiegspunkte pro Dokument
Nachteile
- Erschwerter Benutzungszugang
- "Kenntnis" einer Datenbank nur über Erfahrungswissen
- Unterschiedlichkeit der Suchsprachen und -oberflächen
- Daten reichen selten früher als vor 1965 zurück
- Abrechnung komplizierter als bei Print- oder CD-ROM-Produkt
- Kosten "erscheinen" hoch
- Abhängigkeit von Technik (Hard- und Software, Verbindung zum Host-Rechner)
- Schwierigkeit des Browsing
Welche Assoziationstypen gibt es?
1, c, m, mc (genau eins, keins oder eins, eins oder mehrere, keins, eins oder mehrere)
Wann ist eine Spezialisierung vollständig? Wann ist sie disjunkt?
Vollständig: Deckt alle Individuen der Superklasse ab.
Disjunkt: Individuen können nur in einer
der Subklassen vorkommen.
Wozu werden die Normalformen eingesetzt, und aus welchem Grund?
Um Redundanz in Daten und die damit verbundenen Anomalien zu vermeiden
Was ist eine Löschanomalie? Erklären Sie dies anhand eines konkreten Beispiels.
Wenn z.B. In einer Adressliste eines Vereins zum Mitglied auch die Mitgliederkategorie
gespeichert wird, und alle Mitglieder einer Kategorie aus der Adressliste gelöscht werden,
verschwindet die Kategorie aus der Datenbank, obwohl sie in den Statuen nach wie vor
existiert.
Was ist eine funktionale Abhängigkeit?
Eine injektive Abbildung
Was ist eine volle funktionale Abhängigkeit?
Bei zusammengesetzten Schlüsseln wird ein Datenwert durch eine Kombination sämtlicher
Teilschlüsselattribute bestimmt, nicht nur eine Untermenge davon
Was ist eine transitive Abhängigkeit?
A bestimmt B, B bestimmt C, C bestimmt nicht A: Dann ist C transitiv abhängig von A.
Welchen Bezug haben diese Abhängigkeiten zu den Normalformen 1 – 3?
NF 2: nur volle Funktionale Abh. NF3: keine transitiven Abh.
Was ist der Unterschied zwischen einer Tabelle und einer Relation?
In einer Relation können gleiche Tupel aufgrund des Mengenbegriffs nur einmal vorkommen.
Welches sind die zwei wichtigen Schlüsseleigenschaften?
Eindeutigkeit, Minimalität
Was ist der Unterschied zwischen mengenorientierten und relationalen Operatoren?
Mengenorientierte Operatoren gelten für alle Mengen; die relationalen Operatoren nur für
Mengen von Tupeln, also für Relationen
Was ist der Zusammehang von mengenorientierten Abfragesprachen und der
Relationenalgebra?
Relationen sind Mengen von Tupeln, und SQL arbeitet auf Mengen von
Datensätzen
Wie wird die Selektion in SQL umgesetzt?
Im where-Statement
Wie wird die Projektion in SQL umgesetzt?
Im select-Statement
Wie wird der Join in SQL umgesetzt?
Im from-Statement
Wie zeigt sich die Eigenschaft von SQL, dass sie deskriptiv ist?
Es werden keine Algorithmen / Prozeduren programmiert, sonder es wird das Zielresultat beschrieben
Was bedeutet die Aussage, dass SQL relational vollständig ist?
Sie ist gleich mächtig wie die lineare Algebra d.h. sie implementiert alle Mengenorientierten und relationalen Operatoren
Was war die Grundidee von SEQUEL? (siehe Abstract)
Englisch-sprachige Abfragen statt Mathe, auch für gelegentliche Benutzer verwendbar
Welche zwei Gründe sprachen für die Einführung von deklarativen Sprachen? (siehe
Introduction)
Reduktion von Software-Kosten, und gelegentliche Benutzer dazu zu bringen, selbstständig
DBs abzufragen
Was ist der grosse Unterschied zwischen SQUARE und SEQUEL? (Seite 253)
Mathematisch v.s. Englisch
Finden Sie einige Unterschiede zwischen dem ursprünglichen SEQUEL und dem heutigen SQL?
Z.B. UNION, die ganzen CREATE und DROP statements, Hochkomma bezi Zahlen ,Klammern bei Unterabfragen, ...
Was ist der Unterschied zwischen mengenorientierten und relationalen Operatoren?
Mengenorientierte Operatoren gelten für alle Mengen; die relationalen Operatoren nur für
Mengen von Tupeln, also für Relationen
Wie ist der Zusammenhang von Kreuzprodukt und Division?
Siehe Seite 72: „Der
Divisionsoperator RS berechnet eine Teiltabelle R' aus R mit der Eigenschaft, dass die
Kombinationen aller Tupel r' aus R' mit den Tupeln s aus S in der Tabelle R liegen. Es muss also
das kartesische Produkt R'x S in der Tabelle R enthalten sein.“
Was ist der Zusammehang von mengenorientierten Abfragesprachen und der
Relationenalgebra?
Relationen sind Mengen von Tupeln, und SQL arbeitet auf Mengen von
Datensätzen
Welche der Schichten der Datenbankarchitektur sind für die Anfrageoptimierung relevant,
und weshalb?
- Schicht 1: Anfrageübersetzung / Zugriffsoptimierung
Hier kann mithilfe der relationalen Algebra optimiert werden.
- • Schicht 3: Zugriffspfad- und Satzverwaltung
Hier kann mithilfe der Indexe optimiert werden.
Wie wirkt sich ein Index auf die Leistung des Nested Join (Verschachtelter Verbund) aus?
Der benötigte Aufwand wird linear (vorher: quadratisch). => sort-merge-Join
Was ist ein B-Baum, und wozu dient er im Zusammenhang mit der Anfrageoptimierung?
Ein B-Baum ist ein vollständig balancierter Baum, der Daten nach Schlüsseln speichert. In dieser
Datenstruktur werden die Indexe verwaltet. Durch einen Zugriff über den Pfad vom Wurzel- zum
Blattknoten wird der Zugriffspfad verkürzt, und so wird die Zugriffszeit mit dem Index optimiert.
Warum ist eine Query, welche mit Map-Reduce parallelisiert wird, schneller, als wenn sie
sequenziell bearbeitet wird?
- Parallelverarbeitung: 1 Task dauert sequentiell eine Zeit t, dann dauert der Task auf n Maschinen neu t/n + z, wobei z ein konstanter Zusatzaufwand der neuen Knoten im Cluster ist.
- Solange gilt: z < (1-1/n)*t, ist die Parallelverarbeitung scheller.
OLAP und OLTP
Warum laufen die beiden Ansätze häufig auf verschiedenen physischen Datenbanken?
Weil die beiden Ansätze unterschiedliche Anforderungen aufweisen (siehe Unterschied OLAP
/ OLTP). Zudem soll das produktive System nicht durch Analysevorgänge beeinflusst werden.
Was ist ein Data Warehouse?
Das Data Warehouse oder DWH ist ein verteiltes Informationssystem mit
folgenden Eigenschaften:
- Integriert:
Daten aus verschiedenen Datenquellen und Applikationen (Quellsystemen) werden periodisch zusammengefasst und in einem einheitlichen Schema abgelegt.
- Read only:
Daten im Data Warehouse werden, sobald sie festgeschrieben sind, nicht mehr verändert.
- Historisiert:
Daten können dank einer Zeitachse nach verschiedenen Zeitpunkten ausgewertet werden.
- Auswertungsorientiert:
Alle Daten zu verschiedenen Themenbereichen (Subject Areas) wie Kunden, Verträge und Produkte sind an einem Ort vollständig verfügbar.
- Entscheidungsunterstützend:
Die Fakten in mehrdimensionalen Datenwürfeln bilden die Grundlage von Management-Entscheiden.
Was ist ETL, und wozu dient es?
ETL (Extract, Transform, Load) ist ein Prozess, welcher Daten aus mehreren gegebenenfalls
unterschiedlich strukturierten Datenquellen in einer Zieldatenbank (Data-Warehouse)
vereinigt.
Was ist ein Sternschema?
Hauptmerkmal eines Sternschemas (engl. star schema) ist die Klassifikation der Daten in
die zwei Gruppen Indikatorendaten und Dimensionsdaten. Die Indikatorentabelle steht im
Zentrum, um welches die deskriptiven Dimensionstabellen angesiedelt sind; pro Dimension je
eine Tabelle. Die Dimensionstabellen hängen also sternartig an der Indikatorentabelle.