Introduction to Fault-Tolerance-Patterns
Begriffe der Fault-Tolerance
Begriffe der Fault-Tolerance
Kartei Details
Karten | 32 |
---|---|
Sprache | Deutsch |
Kategorie | Informatik |
Stufe | Universität |
Erstellt / Aktualisiert | 25.12.2015 / 29.12.2015 |
Lizenzierung | Keine Angabe (Jeyanthan Ravindran) |
Weblink |
https://card2brain.ch/box/faulttolerancepattern_introduction
|
Einbinden |
<iframe src="https://card2brain.ch/box/faulttolerancepattern_introduction/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
FAULT
Begriffserklärung
Die Ursache eines Errors, oftmals ein Bug, oder ein Defekt im System:
- Coding Fehler (Bugs)
- Falsche Designs (z.B. Desing falsch umgesetzt)
- Falsche Anforderungsspezifikation (z.B. falsche Anforderungsspezifikatio erhalten)
Beispiel: Beim Beispiel mit dem Bankautomaten ist der Fault, dass der Bankangestellte die Banknoten in das falsche Fach legte.
FAULT, der (bis jetzt) nicht zu einem Error geführt hat
Begriffserklärung
Latent Fault
Faults können zu einem Error führen. Sie sind grundsätzlich in jedem System vorhanden, treten aber nicht unbedingt auf. In diesem Fall werden werden die Faults als latent bezeichnet.
ERROR
Begriffserklärung
Ein Error ist ein falscher Systemzustand, welcher einen „failure“ hervorrufen kann, aber nicht muss. Error werden in zwei Kategorien unterteil: Timing (z.B. Race Condition oder Endlosschleife) und Value (z.B. Dateninkonsistenz oder Wild Write -> Daten werden an einem falschen Ort geschrieben).
Beispiel: In unserem Beispiel mit dem Bankomat (siehe Failure) wäre der Error, dass die Banknoten im falschen liegen.
FAILURE
Begriffserklärung
Bezeichnet ein System, das seine Spezifikationen nicht mehr befolgt. Ohne Spezifikation kann aber auch kein Failure statfinden.
Beispiel: Bei einem Bankomat wäre ein Failure, wenn ein falscher Betrag ausgegeben wird.
Andere Beispiele:
- Falsche Resultate werden geliefert
- System ist nicht erreichbar zu unerwartetem Zeitpunkt
- Applikation reagiert nicht auf Benutzereingabe
FAILURE Typen
Fail-Silent (Fail Mode): Das System liefert entweder das korrekte, oder gar kein Resultat mehr.
Crash-Failure (Fail Mode): Nach einem fail-silent failure stürzt das Subsystem ab
Fail-Stop (Fail Mode): Der crash-failure ist für den Rest des Systems sichtbar.
Consistent Failures: Das System scheitert und für alle Beobachter erzeugt dies das selbe Resultat.
Inconsistent (Malicious) Failures: Der Fehler im System wird von veschiedenen Benutzern auf verschiedene Art und Weise erkannt.
COVERAGE Begriffserklärung
Coverage ist die Fähigkeit eines Systems, wenn ein Fehler auftaucht, in einer gewissen Zeit zu automatisch zu korrigieren.
RELIABILITY Begriffserklärung
Reliability ist die Wahrscheinlichkeit, dass ein System für eine gewisse Zeit ohne Failure läuft.
AVAILABILITY Begriffserklärung
Availability, Verfügbarkeit, beschäftigt sich mit der prozentualen Zeit in welcher das System fehlerfrei arbeitet und verfügbar ist.
MTTF/(MTTF+MTTR) == MeanTimeToFailure / (MeantTimeToFailure + MeanTimeToRepair)