Premium Partner

MABM eEducation Wahlmodul Informatik 01873

Zeichenkodierung

Zeichenkodierung


Kartei Details

Karten 10
Sprache Deutsch
Kategorie Pädagogik
Stufe Universität
Erstellt / Aktualisiert 09.11.2023 / 22.11.2023
Lizenzierung Namensnennung (CC BY)    (Prof. Anne Brüggemann-Klein, Prof. Jörg Keller, Prof. Dominic Heutelbeck, Prof. Dr. Matthias Hemmje (2021.) 01873 Daten- und Dokumentenmanagement im Internet. Kurseinheit 1-4. Fakultät für Mathematik und Informatik. Fernuniversität Hagen.)
Weblink
https://card2brain.ch/box/20231109_mabm_eeducation_wahlmodul_informatik_01873
Einbinden
<iframe src="https://card2brain.ch/box/20231109_mabm_eeducation_wahlmodul_informatik_01873/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was ist der glatte Text?

Der Inhalt ist ein grundlegender Bestandteil eines strukturierten Dokuments und besteht aus dem glatten Text.

Dies ist eine Folge von elementaren Texteinheiten wie Buchstaben, Ziffern, Interpunktionszeichen und anderen Zeichen.

Diese Zeichen müssen letztendlich in Bits und Bytes kodiert werden. Eine Zeichenkodierung gibt dazu eine Vorschrift an.

Beispiel für eine Zeichenkodierung

US-ASCII

Bestandteile eines Kodierungsmodells:

• ein abstrakter Zeichensatz,
• eine Codetabelle,
• ein Kodierungsformat,
• ein Kodierungsschema und
• eine Übertragungssyntax, die über so genannten „glatten Text“ hinaus-geht.

Der abstrakte Zeichensatz besteht aus, ...

  • Buchstaben, Ziffern, Leerzeichen
  • Glyphen (Präsentationsebene)
  • Unicode (zB. Zeichen ► Codetabelle, Designprinzipien)

beinhaltet keine Ordnung oder Nummerierung!

Die Codetabelle ,...

  • weißt abstrakten Zeichen eine Codeposition zu
  • meist als Hexadecimal Notation
  • Coderaum /Codepositionen sind z.T. für  Kontrollzeichen und LOGOs reserviert

Das Kodierungsformat,...

Mithilfe des Kodierungsformats für eine Codetabelle werden die Bitrepräsentationen für die Codeposition festgelegt.

Dazu gibt es eine Code-Einheit, die in der Regel aus acht oder sechzehn Bits besteht.

Durch das Kodierungsformat werden dann die Positionen eines Code-Raums in Sequenzen von Code-Einheiten und somit in Bitmuster abgebildet.

 

Definiere die Länge eines Kodierungsformates:

Wird jede Codeposition einer Codetabelle auf die gleiche Anzahl von Code-Einheiten abgebildet,

sprechen wir von einem Kodierungsformat fester Länge; andernfalls hat das Kodierungsformat variable Länge.

Was ist die Serialisierung von Zeichenkodierungen?

Damit Daten über Netzwerke zuverlässig ausgetauscht werden können, müssen sie in eine lineare Folge von Bytes gebracht werden.

Dieser Vorgang wird auch Serialisierung genannt.