Premium Partner

Data Science

BFH Wahlmodul Data Science

BFH Wahlmodul Data Science

Nicht sichtbar

Nicht sichtbar

Kartei Details

Karten 11
Sprache Deutsch
Kategorie Informatik
Stufe Andere
Erstellt / Aktualisiert 06.11.2017 / 28.12.2022
Lizenzierung Keine Angabe
Weblink
https://card2brain.ch/box/20171106_data_science
Einbinden
<iframe src="https://card2brain.ch/box/20171106_data_science/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Nenne den Unterschied zwischen strukturierten und unstrukturierten Daten anhand von Beispielen
 

structured

  • numbers
  • graphs
  • SQL
  • XML

unstructured

  • text
  • audio
  • images
  • video

Was ist ein Text?

Eine Sequenz von Wörter (tokens)

 

Was ist ein Morphem?

 

Kleinste Spracheinheit, die eine konstante Bedeutung oder grammatische Funktion hat.

 

Welche Wortklassen gibt es?

 

Verben, Nomen, Adjektive

 

Was sind Stems?

 

Wörter mit Kernaussagen. Bsp: foxes -> fox, talking -> talk

 

Was versteht man unter Tokenization?

 

Zerlegen eines Textes in seine einzelnen Wörter.

 

Was führt zu Schwierigkeiten bei der tokenization?

 

  • Satzzeichen
  • Zahlen
  • unterschiedliche Sprachen
  • Mehrzahl
  • Abkürzungen

 

Was sind Stopwörter?

 

Wörder ohne sematischen Bedeutung -> die nicht zum SInn in einem Satz beitragen. Bsp: the, a to, of