Data Science
BFH Wahlmodul Data Science
BFH Wahlmodul Data Science
11
0.0 (0)
Nicht sichtbar
Nicht sichtbar
Kartei Details
Karten | 11 |
---|---|
Sprache | Deutsch |
Kategorie | Informatik |
Stufe | Andere |
Erstellt / Aktualisiert | 06.11.2017 / 28.12.2022 |
Lizenzierung | Keine Angabe |
Weblink |
https://card2brain.ch/box/20171106_data_science
|
Einbinden |
<iframe src="https://card2brain.ch/box/20171106_data_science/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Nenne den Unterschied zwischen strukturierten und unstrukturierten Daten anhand von Beispielen
structured
- numbers
- graphs
- SQL
- XML
unstructured
- text
- audio
- images
- video
Was ist ein Text?
Eine Sequenz von Wörter (tokens)
Was ist ein Morphem?
Kleinste Spracheinheit, die eine konstante Bedeutung oder grammatische Funktion hat.
Welche Wortklassen gibt es?
Verben, Nomen, Adjektive
Was sind Stems?
Wörter mit Kernaussagen. Bsp: foxes -> fox, talking -> talk
Was versteht man unter Tokenization?
Zerlegen eines Textes in seine einzelnen Wörter.
Was führt zu Schwierigkeiten bei der tokenization?
- Satzzeichen
- Zahlen
- unterschiedliche Sprachen
- Mehrzahl
- Abkürzungen
Was sind Stopwörter?
Wörder ohne sematischen Bedeutung -> die nicht zum SInn in einem Satz beitragen. Bsp: the, a to, of