Premium Partner

Introduction to Fault-Tolerance-Patterns

Begriffe der Fault-Tolerance

Begriffe der Fault-Tolerance

Nicht sichtbar

Nicht sichtbar

Kartei Details

Karten 32
Sprache Deutsch
Kategorie Informatik
Stufe Universität
Erstellt / Aktualisiert 25.12.2015 / 29.12.2015
Lizenzierung Keine Angabe    (Jeyanthan Ravindran)
Weblink
https://card2brain.ch/box/faulttolerancepattern_introduction
Einbinden
<iframe src="https://card2brain.ch/box/faulttolerancepattern_introduction/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

FAULT

Begriffserklärung

Die Ursache eines Errors, oftmals ein Bug, oder ein Defekt im System:

  • Coding Fehler (Bugs)
  • Falsche Designs (z.B. Desing falsch umgesetzt)
  • Falsche Anforderungsspezifikation (z.B. falsche Anforderungsspezifikatio erhalten)

Beispiel: Beim Beispiel mit dem Bankautomaten ist der Fault, dass der Bankangestellte die Banknoten in das falsche Fach legte.

FAULT, der (bis jetzt) nicht zu einem Error geführt hat

Begriffserklärung

Latent Fault

Faults können zu einem Error führen. Sie sind grundsätzlich in jedem System vorhanden, treten aber nicht unbedingt auf. In diesem Fall werden werden die Faults als latent bezeichnet.

ERROR

Begriffserklärung

Ein Error ist ein falscher Systemzustand, welcher einen „failure“ hervorrufen kann, aber nicht muss. Error werden in zwei Kategorien unterteil: Timing (z.B. Race Condition oder Endlosschleife) und Value (z.B. Dateninkonsistenz oder Wild Write -> Daten werden an einem falschen Ort geschrieben).

Beispiel: In unserem Beispiel mit dem Bankomat (siehe Failure) wäre der Error, dass die Banknoten im falschen liegen.

FAILURE

Begriffserklärung

Bezeichnet ein System, das seine Spezifikationen nicht mehr befolgt. Ohne Spezifikation kann aber auch kein Failure statfinden.

Beispiel: Bei einem Bankomat wäre ein Failure, wenn ein falscher Betrag ausgegeben wird.

Andere Beispiele:

  • Falsche Resultate werden geliefert
  • System ist nicht erreichbar zu unerwartetem Zeitpunkt
  • Applikation reagiert nicht auf Benutzereingabe

FAILURE Typen

Fail-Silent (Fail Mode): Das System liefert entweder das korrekte, oder gar kein Resultat mehr.

Crash-Failure (Fail Mode): Nach einem fail-silent failure stürzt das Subsystem ab

Fail-Stop (Fail Mode): Der crash-failure ist für den Rest des Systems sichtbar.

Consistent Failures: Das System scheitert und für alle Beobachter erzeugt dies das selbe Resultat.

Inconsistent (Malicious) Failures: Der Fehler im System wird von veschiedenen Benutzern auf verschiedene Art und Weise erkannt.

COVERAGE Begriffserklärung

Coverage ist die Fähigkeit eines Systems, wenn ein Fehler auftaucht, in einer gewissen Zeit zu automatisch zu korrigieren.

RELIABILITY Begriffserklärung

Reliability ist die Wahrscheinlichkeit, dass ein System für eine gewisse Zeit ohne Failure läuft.

AVAILABILITY Begriffserklärung

Availability, Verfügbarkeit, beschäftigt sich mit der prozentualen Zeit in welcher das System fehlerfrei arbeitet und verfügbar ist.

MTTF/(MTTF+MTTR) == MeanTimeToFailure / (MeantTimeToFailure + MeanTimeToRepair)