DEng

Data Engineering

102

0.0 (0)

M. S.

Fichier Détails

Résumé	Diese Vokabelkartei mit 102 Karteikarten hilft beim Erlernen von Deutsch auf Universitätsniveau, mit einem Fokus auf Datenbanken und Informatik. Die Karteikarten decken Themen wie NoSQL-Kategorien, Joins, Queries, Indexstrukturen und Transaktionsmanagement ab. Beispiele sind "Welche NoSQL Kategorien gibt es?", "Was ist ein Classic Hash Join?" und "Welche Arten von Queries gibt es?". Die Plattform unterstützt auch das Rückwärtslernen von der Zielsprache zur Ausgangssprache, was sie ideal für Studierende und Fortgeschrittene macht, die ihr Fachvokabular erweitern möchten.
Cartes-fiches	102
Utilisateurs	2
Langue	Deutsch
Catégorie	Allemand
Niveau	Université
Crée / Actualisé	07.08.2019 / 03.09.2019
Lien de web	https://card2brain.ch/box/20190807_deng
Intégrer	<iframe src="https://card2brain.ch/box/20190807_deng/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Liste des carte

Beschreibe Eventually Consistent im Kontext des BASE-Theorem

Das System wir irgendwann konsistent sein, sobald es keine Eingaben mehr empfängt.

Strong vs. weak consistency. Beschreibe.

Bei strong consistency ist garantiert, dass nach jedem Update jeder Zugriff den aktualisierten Wert erhält.

Bei weak consistency ist dies nicht garantiert. Eine Anzahl von Bedingungen muss möglicherweise erfüllt sein, vor der aktualisierte Wert retourniert wird. -> Inconsistency Window

Beschreibe den Ablauf der internen Ebene in 3 Schritten welcher bei Lesen oder Schreiben von Sätzen ausgeführt wird.

Datei-Manager lokalisiert Seite des gesuchten Satzes
Datei-Manager beauftrags Puffer-Manager die Seite in den Hauptspeicher zu übertragen
Puffer-Manager führt Auftrag aus und meldet dies dem Datei-Manager

Welche Aussagen zu B-Bäumen / B+-Bäumen sind korrekt?

Knotengrösse entspricht Seitengrösse

Verzweigungsgrad hängt ab von möglicher Anzahl Einträge auf einer Seite

Logarithmische Zugriffszeiten können nicht garantiert werden

Knotengrösse entspricht Seitengrösse

Verzweigungsgrad hängt ab von möglicher Anzahl Einträge auf einer Seite

Logarithmische Zugriffszeiten können nicht garantiert werden

Welches sind die Kriterien bei der Wahl von Indizes?

Tabellengrösse
Regelmässigkeit der Mutation
Verwendung der einzelnen Attribute in SELECTs, JOINs
Wertebereich der Attribute

Welche Attribute sind typischerweise Indexkandidaten?

Schlüssel
Jointeilnehmer
Gleichheits- oder Bereichsbedingungen
Sortier- / Gruppierrelevant

Notiere eine beispielhafte Syntax für die Erstellung eines Index

CREATE INDEX IX_YEET

ON tFoo(bar);

Löschen mit:

DROP INDEX IX_YEET;

Was ist das Ziel der Kostenabschätzung?

Abschätzen der Anzahl I/O Operationen für eine Anfrage
Zeit für in-memory Berechnungen = 0

Nenne Definitionen welche im Kostenmodell verwendet werden.

P = Anzahl Data Pages mit Fillfaktor = 67%
R = Anzahl Records per Page (per Block)
Für Tree Indizes:
- F = Fanout -> Anzahl Children in Nonleaf-Node
- PI = Anzahl Pages im Leaf-Level des Index

Wie ist die Kostenabschätzung bei einem Heap Scan?

Wie ist Sie bei der Suche nach einem eindeutigen Attribut?

Anzahl I/O = P

(P = Anz. Data Pages mit Fillfaktor > 67%)

Bei eindeutigem Attribut:

Anzahl I/O = 1/2 * P

Wie ist die Kostenabschätzung bei einem Clustered Index?

Wie ist sie bei Range Selektion?

Eindeutige Suche mit Gleichheitsbedingung:

Annahme: Lokalisierung der ersten Page mit Gleichheitsbedingung in logF(P) (-> Index), Binary Search in der Page liefert gesuchten Record
Anzahl I/O = logF(P)

F = Fan out = Anzahl Einträge im Index

Suche mit Range-Selektion:

Annahme: Lokalisierung der ersten Records wie mit Gleichheitsbedingung, Sequentielles Lesen der n sortieren Records => n / R Pages
Anzahl I/O = logF(P) + ceiling(n/R)

Welche Operationen für Oracle bei der Ausführung einer Query aus?

Table Scan
Index Range Scan
Index Unique Scan => unique Index
Table Access by RowId => Direktzugriff auf Tabelle
Sort
Hash
Filter
View

Welche Operationen führt PG bei Ausführung einer Query aus?

Seq Scan
Index Scan: B-Tree traversal
Index Only San: (vgl. Index Scan, aber ohne Tabellenzugriff)
Bitmap Index Scan / Bitmap Heap Scna
Sort
HashAggregate
GroupAggregate

Welche Arten von Queries gibt es?

Point Query (1 Record)
Multipoint Query (mehrere Records)
Range Query
Prefix Match Query
Extremal Query
Ordering Query
Grouping Query
Join Query

Welche Arten von Joins gibt es?

Classic Hash Join
Nestes Loop Join
Block based Nested Loop Join
Sort-Merge Join

Was ist ein Classic Hash Join?

Erstelle eine Hashtabelle im Memory für die kleinere Relation
Für jeder Zeile in der grösseren Relation, Tashtable 'proben'

Funktioniert wenn kleinere Relation in Memory platz hat. Falls nicht wird sie in kleinere Teile aufgebrochen.

Welche NoSQL Kategorien gibt es?

Key/Value Stroes / Databases
Document Stores / Databases
Graph Stores / Databases
Column-Family Stores / Databases

Welche Aussagen zu Cassandra Column sind korrekt / treffen zu?

Is a basic unit of storage

Columns are key-value pairs

There are dedicated primary keys which cannot be the names

Timestamp is used to expire data

Is a basic unit of storage

Columns are key-value pairs

There are dedicated primary keys which cannot be the names

Timestamp is used to expire data

Welche Aussagen zu IMDBs sind korrekt / treffen zu?

Sind 10-1000x schneller als RDBMS

Datenbank wird in den CPU Cache geladen

ACID wird eingehalten

Geänderte Daten werden nie mit persistentem Speicher abgeglichen

Sind 10-1000x schneller als RDBMS

Datenbank wird in den CPU Cache geladen

ACID wird eingehalten

Geänderte Daten werden nie mit persistentem Speicher abgeglichen

Ein PL/SQL-DML-Datenbanktrigger hat drei Ausführungszeitpunkte. Bitte in alphabetischer Rei-henfolge angeben

Commandes clavier:

= tourner,

= avant/arrière,

= faire défiler

AFTER, BEFORE, INSTEAD OF

Welche Aussagen über NESTED TABLE-Datentypen sind bei Oracle wahr?

Jedes Element hat nur eine Spalte, die entweder einen atomaren oder einen strukturierten Datentyp hat.

Einzelne Einträge in einer NESTED TABLE können direkt geändert werden.

Die Daten der NESTED TABLE-Spalte werden in einer separaten Tabelle gespeichert.

NESTED TABLEs sind Kollektionsdatentypen und stellen daher eine Verletzung der 1. NF im relationalen Modell dar.

Commandes clavier:

= tourner,

= avant/arrière,

= faire défiler

Jedes Element hat nur eine Spalte, die entweder einen atomaren oder einen strukturierten Datentyp hat.

Einzelne Einträge in einer NESTED TABLE können direkt geändert werden.

Die Daten der NESTED TABLE-Spalte werden in einer separaten Tabelle gespeichert.

NESTED TABLEs sind Kollektionsdatentypen und stellen daher eine Verletzung der 1. NF im relationalen Modell dar.

Passt dieser Begriff eher zu RDBMS und / oder NoSQL?

Complex / multiple joins

RDBMS

NOSQL

Commandes clavier:

= tourner,

= avant/arrière,

= faire défiler

RDBMS

NOSQL

Passt dieser Begriff eher zu RDBMS und / oder NoSQL?

Schema flexibility

RDBMS

NoSQL

Commandes clavier:

= tourner,

= avant/arrière,

= faire défiler

RDBMS

NoSQL

Passt dieser Begriff eher zu RDBMS und / oder NoSQL?

High performance

RDBMS

NoSQL

Commandes clavier:

= tourner,

= avant/arrière,

= faire défiler

RDBMS

NoSQL

Passt dieser Begriff eher zu RDBMS und / oder NoSQL?

Different transaction levels

RDBMS

NoSQL

Commandes clavier:

= tourner,

= avant/arrière,

= faire défiler

RDBMS

NoSQL

Passt dieser Begriff eher zu RDBMS und / oder NoSQL?

Linear scalability

RDBMS

NoSQL

Commandes clavier:

= tourner,

= avant/arrière,

= faire défiler

RDBMS

NoSQL

Passt dieser Begriff eher zu RDBMS und / oder NoSQL?

Advanced security needs

RDBMS

NoSQL

Commandes clavier:

= tourner,

= avant/arrière,

= faire défiler

RDBMS

NoSQL

Passt dieser Begriff eher zu RDBMS und / oder NoSQL?

Advanced query functionality needs

RDBMS

NoSQL

RDBMS

NoSQL

Passt dieser Begriff eher zu RDBMS und / oder NoSQL?

Efficient calculation of aggregate functions

RDBMS

NoSQL

RDBMS

NoSQL

Nennen Sie die drei Eigenschaften des CAP-Theorems

CAP = Consistency, Availability und Partition-Tolerance

Von wievielen Eigenschaften des CAP-Theorems kann ein System jeweils maximal gleichzeitig profitieren?

Erklären Sie die Speicherstruktur Heap

Heap = filestructure, lists of unordered records <> In-memory heap
retrieval inefficient as searching has to be linear

I.d.R. Datapage Grösse von 8kB, zusammengefasst in Extents

Erklären Sie die Speicherstruktur B+ Index

Diskbasierter B-Baum über einem Attribut, Innere Knoten enhalten nur Zeiger, Blatt-Knoten enthalten Disk-Referenz auf das gespeicherte Tupel,

Erklären Sie die Speicherstruktur Clustered B+ Index

Wie B+-Index, aber Blatt-Knoten enthalten die Tuples, dh Tupels sind sortiert nach dem Attribut des Index

Erklären Sie die Speicherstruktur B+ Index basierend auf einem Clustered Index

Da es nur einen Clustered.Index pro Tabelle geben kann, werden weiter B+-Indexes auf anderen Attributen definiert. Im Gegensatz zu den B+-Indexes sind in den Blattknoten die Werte des Clustered-Indexes gespeichert => bedingt einen zuätzlichen Zugriff auf den clustered index

Gegeben ist eine Relation R mit Primary Key P.
R hat 250‘000 Tupels. 50 Tupels belegen einen Block (->total 5‘000 Blöcke).
Wie viele IO’s benötigt die Suche nach einem Tupel (und dem anschliessenden Lesen des gefundenen Tupels) mit einem Primary Key-Wert von P=p0 im Durchschnitt.
Annahme: das Tupel mit P=p0 existiert.

a. Wenn kein Index auf R definiert ist

Lineare Suche auf R (durchschn 50% der Blöcke durchsuchen): 2‘500 IO’s sind nötig

b. Wenn ein Clustered Index auf dem Schlüssel P definiert ist

Index Block enthält 100 Einträge; 10‘000 im Level 1, 100‘000 im Level 2, 1‘000‘000 im Level 3
d.h 3 Block-IO’s für das Laden des korrekten Index-Blocks und damit des Tupels

1 / 102

Liste des carte

Étudier

DEng

Créer ou copier des fichiers d'apprentissage

Créer ou copier des fichiers d'apprentissage

Connecte-toi pour voir toutes les cartes.

SWITCHaai

Office 365

Edulog

Apple ID

Google