DEng
Data Engineering
Data Engineering
Fichier Détails
| Résumé | Diese Vokabelkartei mit 102 Karteikarten hilft beim Erlernen von Deutsch auf Universitätsniveau, mit einem Fokus auf Datenbanken und Informatik. Die Karteikarten decken Themen wie NoSQL-Kategorien, Joins, Queries, Indexstrukturen und Transaktionsmanagement ab. Beispiele sind "Welche NoSQL Kategorien gibt es?", "Was ist ein Classic Hash Join?" und "Welche Arten von Queries gibt es?". Die Plattform unterstützt auch das Rückwärtslernen von der Zielsprache zur Ausgangssprache, was sie ideal für Studierende und Fortgeschrittene macht, die ihr Fachvokabular erweitern möchten. |
|---|---|
| Cartes-fiches | 102 |
| Utilisateurs | 2 |
| Langue | Deutsch |
| Catégorie | Allemand |
| Niveau | Université |
| Crée / Actualisé | 07.08.2019 / 03.09.2019 |
| Lien de web |
https://card2brain.ch/box/20190807_deng
|
| Intégrer |
<iframe src="https://card2brain.ch/box/20190807_deng/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Créer ou copier des fichiers d'apprentissage
Avec un upgrade tu peux créer ou copier des fichiers d'apprentissage sans limite et utiliser de nombreuses fonctions supplémentaires.
Connecte-toi pour voir toutes les cartes.
Beschreibe Eventually Consistent im Kontext des BASE-Theorem
Das System wir irgendwann konsistent sein, sobald es keine Eingaben mehr empfängt.
Strong vs. weak consistency. Beschreibe.
Bei strong consistency ist garantiert, dass nach jedem Update jeder Zugriff den aktualisierten Wert erhält.
Bei weak consistency ist dies nicht garantiert. Eine Anzahl von Bedingungen muss möglicherweise erfüllt sein, vor der aktualisierte Wert retourniert wird. -> Inconsistency Window
Beschreibe den Ablauf der internen Ebene in 3 Schritten welcher bei Lesen oder Schreiben von Sätzen ausgeführt wird.
- Datei-Manager lokalisiert Seite des gesuchten Satzes
- Datei-Manager beauftrags Puffer-Manager die Seite in den Hauptspeicher zu übertragen
- Puffer-Manager führt Auftrag aus und meldet dies dem Datei-Manager
Welche Aussagen zu B-Bäumen / B+-Bäumen sind korrekt?
Welches sind die Kriterien bei der Wahl von Indizes?
- Tabellengrösse
- Regelmässigkeit der Mutation
- Verwendung der einzelnen Attribute in SELECTs, JOINs
- Wertebereich der Attribute
Welche Attribute sind typischerweise Indexkandidaten?
- Schlüssel
- Jointeilnehmer
- Gleichheits- oder Bereichsbedingungen
- Sortier- / Gruppierrelevant
Notiere eine beispielhafte Syntax für die Erstellung eines Index
CREATE INDEX IX_YEET
ON tFoo(bar);
Löschen mit:
DROP INDEX IX_YEET;
Was ist das Ziel der Kostenabschätzung?
- Abschätzen der Anzahl I/O Operationen für eine Anfrage
- Zeit für in-memory Berechnungen = 0
Nenne Definitionen welche im Kostenmodell verwendet werden.
- P = Anzahl Data Pages mit Fillfaktor = 67%
- R = Anzahl Records per Page (per Block)
- Für Tree Indizes:
- F = Fanout -> Anzahl Children in Nonleaf-Node
- PI = Anzahl Pages im Leaf-Level des Index
Wie ist die Kostenabschätzung bei einem Heap Scan?
Wie ist Sie bei der Suche nach einem eindeutigen Attribut?
Anzahl I/O = P
(P = Anz. Data Pages mit Fillfaktor > 67%)
Bei eindeutigem Attribut:
Anzahl I/O = 1/2 * P
Wie ist die Kostenabschätzung bei einem Clustered Index?
Wie ist sie bei Range Selektion?
Eindeutige Suche mit Gleichheitsbedingung:
- Annahme: Lokalisierung der ersten Page mit Gleichheitsbedingung in logF(P) (-> Index), Binary Search in der Page liefert gesuchten Record
- Anzahl I/O = logF(P)
F = Fan out = Anzahl Einträge im Index
Suche mit Range-Selektion:
- Annahme: Lokalisierung der ersten Records wie mit Gleichheitsbedingung, Sequentielles Lesen der n sortieren Records => n / R Pages
- Anzahl I/O = logF(P) + ceiling(n/R)
Welche Operationen für Oracle bei der Ausführung einer Query aus?
- Table Scan
- Index Range Scan
- Index Unique Scan => unique Index
- Table Access by RowId => Direktzugriff auf Tabelle
- Sort
- Hash
- Filter
- View
Welche Operationen führt PG bei Ausführung einer Query aus?
- Seq Scan
- Index Scan: B-Tree traversal
- Index Only San: (vgl. Index Scan, aber ohne Tabellenzugriff)
- Bitmap Index Scan / Bitmap Heap Scna
- Sort
- HashAggregate
- GroupAggregate
Welche Arten von Queries gibt es?
- Point Query (1 Record)
- Multipoint Query (mehrere Records)
- Range Query
- Prefix Match Query
- Extremal Query
- Ordering Query
- Grouping Query
- Join Query
Welche Arten von Joins gibt es?
- Classic Hash Join
- Nestes Loop Join
- Block based Nested Loop Join
- Sort-Merge Join
Was ist ein Classic Hash Join?
- Erstelle eine Hashtabelle im Memory für die kleinere Relation
- Für jeder Zeile in der grösseren Relation, Tashtable 'proben'
Funktioniert wenn kleinere Relation in Memory platz hat. Falls nicht wird sie in kleinere Teile aufgebrochen.
Welche NoSQL Kategorien gibt es?
- Key/Value Stroes / Databases
- Document Stores / Databases
- Graph Stores / Databases
- Column-Family Stores / Databases
Welche Aussagen zu Cassandra sind korrekt / treffen zu?
Welche Aussagen zu Cassandra Column sind korrekt / treffen zu?
Welche Aussagen zu IMDBs sind korrekt / treffen zu?
Ein PL/SQL-DML-Datenbanktrigger hat drei Ausführungszeitpunkte. Bitte in alphabetischer Rei-henfolge angeben
AFTER, BEFORE, INSTEAD OF
Welche Aussagen über OIDs (object identifier) sind wahr?
Welche Aussagen über NESTED TABLE-Datentypen sind bei Oracle wahr?
Welche Aussagen über NESTED TABLE-Datentypen sind bei Oracle wahr?
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Complex / multiple joins
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Schema flexibility
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
High performance
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Different transaction levels
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Linear scalability
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Advanced security needs
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Advanced query functionality needs
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Efficient calculation of aggregate functions
Nennen Sie die drei Eigenschaften des CAP-Theorems
CAP = Consistency, Availability und Partition-Tolerance
Von wievielen Eigenschaften des CAP-Theorems kann ein System jeweils maximal gleichzeitig profitieren?
2
Erklären Sie die Speicherstruktur Heap
Heap = filestructure, lists of unordered records <> In-memory heap
retrieval inefficient as searching has to be linear
I.d.R. Datapage Grösse von 8kB, zusammengefasst in Extents
Erklären Sie die Speicherstruktur B+ Index
Diskbasierter B-Baum über einem Attribut, Innere Knoten enhalten nur Zeiger, Blatt-Knoten enthalten Disk-Referenz auf das gespeicherte Tupel,
Erklären Sie die Speicherstruktur Clustered B+ Index
Wie B+-Index, aber Blatt-Knoten enthalten die Tuples, dh Tupels sind sortiert nach dem Attribut des Index
Erklären Sie die Speicherstruktur B+ Index basierend auf einem Clustered Index
Da es nur einen Clustered.Index pro Tabelle geben kann, werden weiter B+-Indexes auf anderen Attributen definiert. Im Gegensatz zu den B+-Indexes sind in den Blattknoten die Werte des Clustered-Indexes gespeichert => bedingt einen zuätzlichen Zugriff auf den clustered index
Gegeben ist eine Relation R mit Primary Key P.
R hat 250‘000 Tupels. 50 Tupels belegen einen Block (->total 5‘000 Blöcke).
Wie viele IO’s benötigt die Suche nach einem Tupel (und dem anschliessenden Lesen des gefundenen Tupels) mit einem Primary Key-Wert von P=p0 im Durchschnitt.
Annahme: das Tupel mit P=p0 existiert.
a. Wenn kein Index auf R definiert ist
Lineare Suche auf R (durchschn 50% der Blöcke durchsuchen): 2‘500 IO’s sind nötig
Gegeben ist eine Relation R mit Primary Key P.
R hat 250‘000 Tupels. 50 Tupels belegen einen Block (->total 5‘000 Blöcke).
Wie viele IO’s benötigt die Suche nach einem Tupel (und dem anschliessenden Lesen des gefundenen Tupels) mit einem Primary Key-Wert von P=p0 im Durchschnitt.
Annahme: das Tupel mit P=p0 existiert.
b. Wenn ein Clustered Index auf dem Schlüssel P definiert ist
Index Block enthält 100 Einträge; 10‘000 im Level 1, 100‘000 im Level 2, 1‘000‘000 im Level 3
d.h 3 Block-IO’s für das Laden des korrekten Index-Blocks und damit des Tupels
-
- 1 / 102
-