DEng
Data Engineering
Data Engineering
Fichier Détails
Cartes-fiches | 102 |
---|---|
Langue | Deutsch |
Catégorie | Allemand |
Niveau | Université |
Crée / Actualisé | 07.08.2019 / 03.09.2019 |
Lien de web |
https://card2brain.ch/box/20190807_deng
|
Intégrer |
<iframe src="https://card2brain.ch/box/20190807_deng/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Créer ou copier des fichiers d'apprentissage
Avec un upgrade tu peux créer ou copier des fichiers d'apprentissage sans limite et utiliser de nombreuses fonctions supplémentaires.
Connecte-toi pour voir toutes les cartes.
Welche Attribute sind typischerweise Indexkandidaten?
- Schlüssel
- Jointeilnehmer
- Gleichheits- oder Bereichsbedingungen
- Sortier- / Gruppierrelevant
Notiere eine beispielhafte Syntax für die Erstellung eines Index
CREATE INDEX IX_YEET
ON tFoo(bar);
Löschen mit:
DROP INDEX IX_YEET;
Was ist das Ziel der Kostenabschätzung?
- Abschätzen der Anzahl I/O Operationen für eine Anfrage
- Zeit für in-memory Berechnungen = 0
Nenne Definitionen welche im Kostenmodell verwendet werden.
- P = Anzahl Data Pages mit Fillfaktor = 67%
- R = Anzahl Records per Page (per Block)
- Für Tree Indizes:
- F = Fanout -> Anzahl Children in Nonleaf-Node
- PI = Anzahl Pages im Leaf-Level des Index
Wie ist die Kostenabschätzung bei einem Heap Scan?
Wie ist Sie bei der Suche nach einem eindeutigen Attribut?
Anzahl I/O = P
(P = Anz. Data Pages mit Fillfaktor > 67%)
Bei eindeutigem Attribut:
Anzahl I/O = 1/2 * P
Wie ist die Kostenabschätzung bei einem Clustered Index?
Wie ist sie bei Range Selektion?
Eindeutige Suche mit Gleichheitsbedingung:
- Annahme: Lokalisierung der ersten Page mit Gleichheitsbedingung in logF(P) (-> Index), Binary Search in der Page liefert gesuchten Record
- Anzahl I/O = logF(P)
F = Fan out = Anzahl Einträge im Index
Suche mit Range-Selektion:
- Annahme: Lokalisierung der ersten Records wie mit Gleichheitsbedingung, Sequentielles Lesen der n sortieren Records => n / R Pages
- Anzahl I/O = logF(P) + ceiling(n/R)
Welche Operationen für Oracle bei der Ausführung einer Query aus?
- Table Scan
- Index Range Scan
- Index Unique Scan => unique Index
- Table Access by RowId => Direktzugriff auf Tabelle
- Sort
- Hash
- Filter
- View
Welche Operationen führt PG bei Ausführung einer Query aus?
- Seq Scan
- Index Scan: B-Tree traversal
- Index Only San: (vgl. Index Scan, aber ohne Tabellenzugriff)
- Bitmap Index Scan / Bitmap Heap Scna
- Sort
- HashAggregate
- GroupAggregate
Welche Arten von Queries gibt es?
- Point Query (1 Record)
- Multipoint Query (mehrere Records)
- Range Query
- Prefix Match Query
- Extremal Query
- Ordering Query
- Grouping Query
- Join Query
Welche Arten von Joins gibt es?
- Classic Hash Join
- Nestes Loop Join
- Block based Nested Loop Join
- Sort-Merge Join
Was ist ein Classic Hash Join?
- Erstelle eine Hashtabelle im Memory für die kleinere Relation
- Für jeder Zeile in der grösseren Relation, Tashtable 'proben'
Funktioniert wenn kleinere Relation in Memory platz hat. Falls nicht wird sie in kleinere Teile aufgebrochen.
Welche NoSQL Kategorien gibt es?
- Key/Value Stroes / Databases
- Document Stores / Databases
- Graph Stores / Databases
- Column-Family Stores / Databases
Welche Aussagen zu Cassandra sind korrekt / treffen zu?
Welche Aussagen zu Cassandra Column sind korrekt / treffen zu?
Welche Aussagen zu IMDBs sind korrekt / treffen zu?
Ein PL/SQL-DML-Datenbanktrigger hat drei Ausführungszeitpunkte. Bitte in alphabetischer Rei-henfolge angeben
AFTER, BEFORE, INSTEAD OF
Welche Aussagen über OIDs (object identifier) sind wahr?
Welche Aussagen über NESTED TABLE-Datentypen sind bei Oracle wahr?
Welche Aussagen über NESTED TABLE-Datentypen sind bei Oracle wahr?
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Complex / multiple joins
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Schema flexibility
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
High performance
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Different transaction levels
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Linear scalability
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Advanced security needs
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Advanced query functionality needs
Passt dieser Begriff eher zu RDBMS und / oder NoSQL?
Efficient calculation of aggregate functions
Nennen Sie die drei Eigenschaften des CAP-Theorems
CAP = Consistency, Availability und Partition-Tolerance
Von wievielen Eigenschaften des CAP-Theorems kann ein System jeweils maximal gleichzeitig profitieren?
2
Erklären Sie die Speicherstruktur Heap
Heap = filestructure, lists of unordered records <> In-memory heap
retrieval inefficient as searching has to be linear
I.d.R. Datapage Grösse von 8kB, zusammengefasst in Extents
-
- 1 / 102
-