card2brain.ch

Karten	53
Sprache	Deutsch
Kategorie	Informatik
Stufe	Universität
Erstellt / Aktualisiert	24.11.2020 / 28.01.2023
Weblink	https://card2brain.ch/cards/20201124_dbs_hslu
Einbinden	<iframe src="https://card2brain.ch/box/20201124_dbs_hslu/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was ist der Unterschied zwischen einer Datenbank und einem Informationssystem?

Eine Datenbank umfasst nur den Bestand an Daten. Ein Informationssystem hat auch Prozesse zur Verarbeitung der Daten, zur Benutzerinteraktion, Kommunikation und Prozesssteuerung. Informationssysteme sind soziotechnisch, d.h. Mensch-Maschinen-Systeme.

Was ist der Unterschied zwischen einem Datenbank-System und einem Dateisystem?

Ein Datenbanksystem umfasst die Datenbasis und die Verwaltungsprogramme, die als Einheit gekapselt sind. Ein Dateisystem bietet nur Speicherplatz für die Datenbasis, die Verwaltungsprogramme müssen pro Dateityp separat installiert werden.

Was ist der Unterschied zwischen einer SQL- und einer NoSQL-Datenbank?

SQL-Datenbanken sind relational, NoSQL-Datenbanken sind typischerweise nicht-relational und bieten keine Schnittstelle für die SQL-Sprache. Zudem sind NoSQL für grosse Datenmengen (Sharding, scale-out) und flexible Schemas ausgerichtet.

Was ist der Unterschied zwischen Datenbanken und Datenmanagement?

System vs. Prozess

Inwiefern handelte es sich gemäss der Datenbanktheorie bei IDS um eine Datenbank?

IDS kapselte erstmals die Datenspeicherung und den Datenzugriff bzw. deren Verwaltung in
einem einheitlichen, integrierten System unabhängig von der Applikationslogik (Data-
Independence)

Warum ist eine Sammlung von XML-Dateien auf einem Server kein Datenbank-System?

DBMS fehlt, Kapselung fehlt, Sprache für DQL usw.

Welche Ziele und Werkzeuge der 4 Eckpfeiler des Datenmanagements nach Meier und
Kaufmann 2016 sind im Beispiel erkennbar?

Beispiel: Börse Stuttgart

Architektur
- Dimensionen wie Kunden, Kundengruppen, Anlageprodukte, Zeiträume
- Datenmodellierung mit Fokus auf Erweiterbarkeit
- Schema-Integration
Administration
- In-House Administration
- Zentralisiertes Metadaten-Management: Datenherkunft und Verwendung
Technik
- Einsatz von Standardkomponenten
- Integration IBM Tools und Microsoft SQL Server
- Tools für Business Analytics (Cognos)
Nutzung
- Zentrale Datenplattform für Reports und Analysen zur Steuerung des zentralen Handelsprozesses
- Datenquelle: Ausgeführte Orders
- Zugriff über Web
- Kostensenkung bei Reporterstellung

Welche Vor- und Nachteile hat aus Ihrer Perspektive der Einsatz von Datenbank-Systemen?

Vorteile

Schnelligkeit, Zeitersparnis
Räumliche Unabhängigkeit
Interaktivität
Suchvariabilität: eine Suche kann großen Zeitraum umfassen, mehrere Datenbanken können gleichzeitig abgefragt werden
Aktualität
Mehrdimensionale Verknüpfungen möglich
Suchstrategie kann problemlos nachvollzogen werden (bei Recherchen in gedruckten Diensten oft problematisch)
mehr Einstiegspunkte pro Dokument

Nachteile

Erschwerter Benutzungszugang
"Kenntnis" einer Datenbank nur über Erfahrungswissen
Unterschiedlichkeit der Suchsprachen und -oberflächen
Daten reichen selten früher als vor 1965 zurück
Abrechnung komplizierter als bei Print- oder CD-ROM-Produkt
Kosten "erscheinen" hoch
Abhängigkeit von Technik (Hard- und Software, Verbindung zum Host-Rechner)
Schwierigkeit des Browsing

Welche Assoziationstypen gibt es?

1, c, m, mc (genau eins, keins oder eins, eins oder mehrere, keins, eins oder mehrere)

Wann ist eine Spezialisierung vollständig? Wann ist sie disjunkt?

Vollständig: Deckt alle Individuen der Superklasse ab.

Disjunkt: Individuen können nur in einer
der Subklassen vorkommen.

Wozu werden die Normalformen eingesetzt, und aus welchem Grund?

Um Redundanz in Daten und die damit verbundenen Anomalien zu vermeiden

Was ist eine Löschanomalie? Erklären Sie dies anhand eines konkreten Beispiels.

Wenn z.B. In einer Adressliste eines Vereins zum Mitglied auch die Mitgliederkategorie
gespeichert wird, und alle Mitglieder einer Kategorie aus der Adressliste gelöscht werden,
verschwindet die Kategorie aus der Datenbank, obwohl sie in den Statuen nach wie vor
existiert.

Was ist eine funktionale Abhängigkeit?

Eine injektive Abbildung

Was ist eine volle funktionale Abhängigkeit?

Bei zusammengesetzten Schlüsseln wird ein Datenwert durch eine Kombination sämtlicher
Teilschlüsselattribute bestimmt, nicht nur eine Untermenge davon

Was ist eine transitive Abhängigkeit?

A bestimmt B, B bestimmt C, C bestimmt nicht A: Dann ist C transitiv abhängig von A.

Welchen Bezug haben diese Abhängigkeiten zu den Normalformen 1 – 3?

NF 2: nur volle Funktionale Abh. NF3: keine transitiven Abh.

Was ist der Unterschied zwischen einer Tabelle und einer Relation?

In einer Relation können gleiche Tupel aufgrund des Mengenbegriffs nur einmal vorkommen.

Welches sind die zwei wichtigen Schlüsseleigenschaften?

Eindeutigkeit, Minimalität

Was ist der Unterschied zwischen mengenorientierten und relationalen Operatoren?

Mengenorientierte Operatoren gelten für alle Mengen; die relationalen Operatoren nur für
Mengen von Tupeln, also für Relationen

Was ist der Zusammehang von mengenorientierten Abfragesprachen und der
Relationenalgebra?

Relationen sind Mengen von Tupeln, und SQL arbeitet auf Mengen von
Datensätzen

Wie wird die Selektion in SQL umgesetzt?

Im where-Statement

Wie wird die Projektion in SQL umgesetzt?

Im select-Statement

Wie wird der Join in SQL umgesetzt?

Im from-Statement

Wie zeigt sich die Eigenschaft von SQL, dass sie deskriptiv ist?

Es werden keine Algorithmen / Prozeduren programmiert, sonder es wird das Zielresultat beschrieben

Was bedeutet die Aussage, dass SQL relational vollständig ist?

Sie ist gleich mächtig wie die lineare Algebra d.h. sie implementiert alle Mengenorientierten und relationalen Operatoren

Was war die Grundidee von SEQUEL? (siehe Abstract)

Englisch-sprachige Abfragen statt Mathe, auch für gelegentliche Benutzer verwendbar

Welche zwei Gründe sprachen für die Einführung von deklarativen Sprachen? (siehe
Introduction)

Reduktion von Software-Kosten, und gelegentliche Benutzer dazu zu bringen, selbstständig
DBs abzufragen

Was ist der grosse Unterschied zwischen SQUARE und SEQUEL? (Seite 253)

Mathematisch v.s. Englisch

Finden Sie einige Unterschiede zwischen dem ursprünglichen SEQUEL und dem heutigen SQL?

Z.B. UNION, die ganzen CREATE und DROP statements, Hochkomma bezi Zahlen ,Klammern bei Unterabfragen, ...

Was ist der Unterschied zwischen mengenorientierten und relationalen Operatoren?

Mengenorientierte Operatoren gelten für alle Mengen; die relationalen Operatoren nur für
Mengen von Tupeln, also für Relationen

Wie ist der Zusammenhang von Kreuzprodukt und Division?

Siehe Seite 72: „Der
Divisionsoperator RS berechnet eine Teiltabelle R' aus R mit der Eigenschaft, dass die
Kombinationen aller Tupel r' aus R' mit den Tupeln s aus S in der Tabelle R liegen. Es muss also
das kartesische Produkt R'x S in der Tabelle R enthalten sein.“

Was ist der Zusammehang von mengenorientierten Abfragesprachen und der
Relationenalgebra?

Relationen sind Mengen von Tupeln, und SQL arbeitet auf Mengen von
Datensätzen

Welche der Schichten der Datenbankarchitektur sind für die Anfrageoptimierung relevant,
und weshalb?

Schicht 1: Anfrageübersetzung / Zugriffsoptimierung

Hier kann mithilfe der relationalen Algebra optimiert werden.

• Schicht 3: Zugriffspfad- und Satzverwaltung

Hier kann mithilfe der Indexe optimiert werden.

Wie wirkt sich ein Index auf die Leistung des Nested Join (Verschachtelter Verbund) aus?

Der benötigte Aufwand wird linear (vorher: quadratisch). => sort-merge-Join

Was ist ein B-Baum, und wozu dient er im Zusammenhang mit der Anfrageoptimierung?

Ein B-Baum ist ein vollständig balancierter Baum, der Daten nach Schlüsseln speichert. In dieser
Datenstruktur werden die Indexe verwaltet. Durch einen Zugriff über den Pfad vom Wurzel- zum
Blattknoten wird der Zugriffspfad verkürzt, und so wird die Zugriffszeit mit dem Index optimiert.

Warum ist eine Query, welche mit Map-Reduce parallelisiert wird, schneller, als wenn sie
sequenziell bearbeitet wird?

Parallelverarbeitung: 1 Task dauert sequentiell eine Zeit t, dann dauert der Task auf n Maschinen neu t/n + z, wobei z ein konstanter Zusatzaufwand der neuen Knoten im Cluster ist.
Solange gilt: z < (1-1/n)*t, ist die Parallelverarbeitung scheller.

OLAP und OLTP

Warum laufen die beiden Ansätze häufig auf verschiedenen physischen Datenbanken?

Weil die beiden Ansätze unterschiedliche Anforderungen aufweisen (siehe Unterschied OLAP
/ OLTP). Zudem soll das produktive System nicht durch Analysevorgänge beeinflusst werden.

Was ist ein Data Warehouse?

Das Data Warehouse oder DWH ist ein verteiltes Informationssystem mit
folgenden Eigenschaften:

Integriert:

Daten aus verschiedenen Datenquellen und Applikationen (Quellsystemen) werden periodisch zusammengefasst und in einem einheitlichen Schema abgelegt.

Read only:

Daten im Data Warehouse werden, sobald sie festgeschrieben sind, nicht mehr verändert.

Historisiert:

Daten können dank einer Zeitachse nach verschiedenen Zeitpunkten ausgewertet werden.

Auswertungsorientiert:

Alle Daten zu verschiedenen Themenbereichen (Subject Areas) wie Kunden, Verträge und Produkte sind an einem Ort vollständig verfügbar.

Entscheidungsunterstützend:

Die Fakten in mehrdimensionalen Datenwürfeln bilden die Grundlage von Management-Entscheiden.

Was ist ETL, und wozu dient es?

ETL (Extract, Transform, Load) ist ein Prozess, welcher Daten aus mehreren gegebenenfalls
unterschiedlich strukturierten Datenquellen in einer Zieldatenbank (Data-Warehouse)
vereinigt.

Was ist ein Sternschema?

Hauptmerkmal eines Sternschemas (engl. star schema) ist die Klassifikation der Daten in
die zwei Gruppen Indikatorendaten und Dimensionsdaten. Die Indikatorentabelle steht im
Zentrum, um welches die deskriptiven Dimensionstabellen angesiedelt sind; pro Dimension je
eine Tabelle. Die Dimensionstabellen hängen also sternartig an der Indikatorentabelle.

DBS - HSLU

Lernkarteien erstellen oder kopieren

Lernkarteien erstellen oder kopieren

Melde dich an, um alle Karten zu sehen.

SWITCHaai

Office 365

Edulog

Apple ID

Google