Zeichenkodierung


Set of flashcards Details

Flashcards 10
Language Deutsch
Category Educational Science
Level University
Created / Updated 09.11.2023 / 22.11.2023
Weblink
https://card2brain.ch/box/20231109_mabm_eeducation_wahlmodul_informatik_01873
Embed
<iframe src="https://card2brain.ch/box/20231109_mabm_eeducation_wahlmodul_informatik_01873/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was ist der glatte Text?

Der Inhalt ist ein grundlegender Bestandteil eines strukturierten Dokuments und besteht aus dem glatten Text.

Dies ist eine Folge von elementaren Texteinheiten wie Buchstaben, Ziffern, Interpunktionszeichen und anderen Zeichen.

Diese Zeichen müssen letztendlich in Bits und Bytes kodiert werden. Eine Zeichenkodierung gibt dazu eine Vorschrift an.

Beispiel für eine Zeichenkodierung

US-ASCII

Bestandteile eines Kodierungsmodells:

• ein abstrakter Zeichensatz,
• eine Codetabelle,
• ein Kodierungsformat,
• ein Kodierungsschema und
• eine Übertragungssyntax, die über so genannten „glatten Text“ hinaus-geht.

Der abstrakte Zeichensatz besteht aus, ...

  • Buchstaben, Ziffern, Leerzeichen
  • Glyphen (Präsentationsebene)
  • Unicode (zB. Zeichen ► Codetabelle, Designprinzipien)

beinhaltet keine Ordnung oder Nummerierung!

Die Codetabelle ,...

  • weißt abstrakten Zeichen eine Codeposition zu
  • meist als Hexadecimal Notation
  • Coderaum /Codepositionen sind z.T. für  Kontrollzeichen und LOGOs reserviert

Das Kodierungsformat,...

Mithilfe des Kodierungsformats für eine Codetabelle werden die Bitrepräsentationen für die Codeposition festgelegt.

Dazu gibt es eine Code-Einheit, die in der Regel aus acht oder sechzehn Bits besteht.

Durch das Kodierungsformat werden dann die Positionen eines Code-Raums in Sequenzen von Code-Einheiten und somit in Bitmuster abgebildet.

 

Definiere die Länge eines Kodierungsformates:

Wird jede Codeposition einer Codetabelle auf die gleiche Anzahl von Code-Einheiten abgebildet,

sprechen wir von einem Kodierungsformat fester Länge; andernfalls hat das Kodierungsformat variable Länge.

Was ist die Serialisierung von Zeichenkodierungen?

Damit Daten über Netzwerke zuverlässig ausgetauscht werden können, müssen sie in eine lineare Folge von Bytes gebracht werden.

Dieser Vorgang wird auch Serialisierung genannt.

Welche zwei wichtigen Faktoren machen digitale Dokumente zu modernen Informationsträgern?

Modell der strukturierten Dokumente & Standardisierung der Textkodierung 

   ► moderne Informationsträger

Unterschied Big Endian und Little Endian:

Reihenfolge der Speicherung:

Big: Höchstwertige Byte wird zuerst gespeichert - zB. Stunde:Minute:Sekunde

Little: niedrigstwertige Byte wird zuerst gespeichert - zB. Tag.Monat.Jahr