Premium Partner

Data Science

BFH Wahlmodul Data Science

BFH Wahlmodul Data Science

Invisible

Invisible

Set of flashcards Details

Flashcards 11
Language Deutsch
Category Computer Science
Level Other
Created / Updated 06.11.2017 / 28.12.2022
Licencing Not defined
Weblink
https://card2brain.ch/box/20171106_data_science
Embed
<iframe src="https://card2brain.ch/box/20171106_data_science/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Nenne den Unterschied zwischen strukturierten und unstrukturierten Daten anhand von Beispielen
 

structured

  • numbers
  • graphs
  • SQL
  • XML

unstructured

  • text
  • audio
  • images
  • video

Was ist ein Text?

Eine Sequenz von Wörter (tokens)

 

Was ist ein Morphem?

 

Kleinste Spracheinheit, die eine konstante Bedeutung oder grammatische Funktion hat.

 

Welche Wortklassen gibt es?

 

Verben, Nomen, Adjektive

 

Was sind Stems?

 

Wörter mit Kernaussagen. Bsp: foxes -> fox, talking -> talk

 

Was versteht man unter Tokenization?

 

Zerlegen eines Textes in seine einzelnen Wörter.

 

Was führt zu Schwierigkeiten bei der tokenization?

 

  • Satzzeichen
  • Zahlen
  • unterschiedliche Sprachen
  • Mehrzahl
  • Abkürzungen

 

Was sind Stopwörter?

 

Wörder ohne sematischen Bedeutung -> die nicht zum SInn in einem Satz beitragen. Bsp: the, a to, of