BUIBID

BUIBID

BUIBID


Set of flashcards Details

Flashcards 79
Language Deutsch
Category Technology
Level University
Created / Updated 13.03.2022 / 18.06.2022
Weblink
https://card2brain.ch/box/20220313_buibid
Embed
<iframe src="https://card2brain.ch/box/20220313_buibid/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was sind mögliche Anwendungsgebiete für Data Mining?

  • Optimierung der Supply Chain
  • Prognose der Nachfrage
  • Predictive Maintenance 
  • Risikoanalysen von Banken

Was sind Vor- und Nachteile von Data Mining?

Vorteile:

  • Frühzeitige Erkennung von Trends 
  • Verständnis von Kundensegmenten 
  • Zeitersparnis
  • Optimierung von Geschäftsprozessen

 

Nachteile:

  • Nur Computerbasiert (der gesunde Menschenverstand fehlt)
  • Fehler können Passieren
  • Daten bringen Verantwortung mit sich (Datenschutzbestimmungen)

Was ist Process Mining?

Process Mining ist eine Technologie zur systematischen Analyse und Auswertung von Geschäftsprozessen. Sobald eine Prozessinstanz durchlaufen wird, werden alle wichtigen Transaktionsdaten dazu in einer Log-Datei gespeichert. Die Daten werden dann für Prozessschaubilder gebraucht. 

Welche 5 Schritte durchläuft man beim Process Mining?

  1. Prozessdatenaufnahme
  2. Prozessvisualisierung
  3. Prozessanalyse
  4. Prozess-Benchmarking
  5. Prozessoptimierung

Was sind Vor- und Nachteile von Process Mining?

Vorteile:

  • Prozess-Effizienz steigern
  • Kundenzufriedenheit wird durch kürzere Wartezeiten erhöht

 

Nachteile:

  • Erfordert Event-Logs, welche aufwändig zu erheben sind
  • Relativ hoher Einführungsaufwand

Was ist Machine Learning?

Machine Learning ist ein Teilbereich der künstlichen Intelligenz, der Systeme in die Lage versetzt, automatisch aus Erfahrungen (Daten) zu lernen und sich zu verbessern, ohne explizit programmiert zu sein.

Dafür müssen aber Algorithmen vorhanden sein, die es dem Programm ermöglichen, zu lernen. 

Wie funktioniert Machine Learning?

Welche Methoden gibt es bei Machine Learning?

Überwachtes Lernen: 

Beim überwachten Lernen (Supervised Learning) wird das System mit Beispielen versorgt. Die Entwickler geben dabei an, welchen Wert die jeweilige Information erhält, also etwa, ob diese in Kategorie A oder B gehört. Daraus zieht das 
selbstlernende System Schlüsse, erkennt Muster und kann dann mit unbekannten Daten besser umgehen.

 

Unüberwachtes Lernen: 

Im Gegensatz zum überwachten Lernen versucht das Programm, von selbst ohne Entwickler Muster zu erkennen. Dafür kann es z. B. Clustering anwenden: Aus der Menge an Daten wird ein Element ausgewählt, auf seine Merkmale untersucht und dann mit den bereits untersuchten verglichen. Sollte es schon gleichwertige Elemente untersucht haben, wird das aktuelle Objekt diesen hinzugefügt. Ist dem nicht so, wird es isoliert abgelegt. 

 

Teilüberwachtes Lernen:

Beim semiüberwachten maschinellen Lernen handelt es sich um eine Kombination aus überwachtem und unüberwachtem maschinellen Lernen. Der Unterschied liegt darin, dass für den Lernprozess nur eine geringe Menge Daten mit bekannter 
Zielvariable genutzt wird und eine große Menge, bei der diese Zielvariable noch nicht vorhanden ist. Das hat den Vorteil, dass Kosten und Arbeitsaufwand für die Beschaffung entsprechender Daten eingespart werden kann und bereits ein geringer Datensatz ausreicht, um das Modell zu trainieren.

 

Bestärkendes Lernen: 

Bestärkendes Lernen ist ein Sonderfall, dort gibt es eine Umgebung und ein Belohnungssystem für den Algorithmus. o Dadurch sollte er eigenständig seine beste Strategie finden. Das Belohnungssystem funktioniert so, dass sie bei falschen Entscheidungen in irgendeiner weise bestraft werden und für gut Entscheidungen belohnt.

 

Was sind Vor- und Nachteile von Machine Learning?

Was sind Entscheidungsbäume?

Entscheidungsbäume werden zum Erstellen von Klassifizierungs- und Regressionsmodellen verwendet. Sie werden gebraucht, um Datenmodelle zu erstellen, die Klassenbezeichnungen oder Werte für den Entscheidungsprozess vorhersagen. 

Was ist die Bayes-Klassifikation?

  • Mathematische Funktion
  • Weist jedes Objekt der Klasse zu, zu der es mit der grössten Wahrscheinlichkeit gehört oder bei der durch die Einordnung die wenigsten Kosten entstehen

Was ist das Nächste-Nachbarn-Verfahren?

Was sind Vor- und Nachteile von Machine Learning?

Vorteile:

  • Parallele Abwicklung von Daten (Mensch und Maschine arbeiten zusammen)
  • Schnelle Verarbeitung von grossen Datensätzen

 

Nachteile:

  • Durch fehlerhafte Trainingsdaten kann ML auf falsche Resultate kommen
  • Aus kleinen Datensätzen kann kaum eine Lernfunktion generiert werden

Wieso kann Machine Learning ein ethisches Problem sein?

Es isch schwierig zu bestimmen, wer für einen Schaden haftet? Wenn ein Auto mit KI z.B. einen Unfall baut, wer muss für den Schaden aufkommen?

Was sind neuronale Netze?

  • Künstliche Neuronale Netze sind Algorithmen, die der Funktionsweise des menschlichen Gehirns nachempfunden sind
  • Der Aufbau eines Künstlichen Neuronalen Netzwerks setzt sich aus den Bereichen: Eingabeschicht (Input Layer), verborgene Schicht (Hidden Layer) und einer Ausgabeschicht (Output Layer) zusammen
  • Computerbasiert lassen sich damit diverse Problemstellungen lösen, die für uns Menschen fast unmöglich wären

Was sind Vor- und Nachteile von neuronalen Netzen?

Vorteile:

  • Können Features (Patterns) selbst lernen (im gegensatz zu herkömmlichen Machine Learning Algorithmen)

 

Nachteile:

  • Mehr Rechenleistung und Speicher erforderlich
  • Lange Trainingszeiten (bis zu mehreren Wochen)

Was ist Predictive Maintenance?

Die Predictive Maintenance ist eines der Anwendungsgebiete von Predictive Analytics. Mithilfe von Predictive Maintenance-Techniken wird der Zustand von in Betrieb befindlichen Geräten bestimmt, um vorauszusagen, wann eine Wartung durchgeführt werden sollte. 

Wie wird bei Predictive Maintenance vorgegangen?

Was sind Vor- und Nachteile von Predictive Maintenance?

Was sind Vor- und Nachteile von zentralen Data Warehouses?

Was sind Vor-  und Nachteile von dezentralen Data Warehouses?

Was sind Data Warehouses mit Data Marts?

Der Aufbau eines unternehmensweiten Datenmodells in einem zentralen Data Warehouse scheitert oft an der kurz- bis mittelfristigen Planungsperspektive solcher Grossprojekte. Dies führte zu Entwicklung sogenannter Datamarts, die als personengruppen- bzw. funktionsspezifische Data Warehouse-Systeme kurzfristig implementiert werden können zu Beantwortung spezifischer Geschäftsfragen.

Was sind Vor- und Nachteile von Data Warehouses mit Datamarts?

Was ist ETL?

Extract, Transform and Load

Damit sind Schritte gemeint, um Daten aus verschiedenen Datenquellen in ein Data Warehouse einzuspeisen.

Die Extraktion stellt den ersten Schritt des Datenverarbeitungsprozesses dar. In diesem werden aus den Quellsystemen oder -dokumenten Daten extrahiert, also herausgezogen, und für die weiteren 
Bearbeitungsschritte in der Eingangsschicht des DWHs bereitgestellt. Dabei können auch nur Teilaspekte der Quelldaten verwendet werden. Alle nicht benötigten Daten, werden nicht extrahiert.

Im zweiten Schritt erfolgt die Transformation der Daten in der Stage- oder Cleanse-Schicht. In dieser werden die Quelldatentypen in die Spaltentypen der Zieltabellen umgewandelt. Zudem erfolgt eine inhaltliche Überprüfung der Daten. Dadurch werden bspw. Duplikate ermittelt und herausgefiltert, Berechnungen durchgeführt oder zusätzliche (Stamm-)Daten verknüpft.

Im dritten Schritt werden die Daten in das Data Warehouse geladen. Dort werden die sie strukturiert und normalisiert gespeichert. Ein Teil der Daten wird zudem historisiert, um Änderungen über einen Zeitverlauf nachvollziehbar und auswertbar zu machen.

Was kann zum ETL Extraktionsprozess gesagt werden?

Was kann zum ETL Transformationsprozess gesagt werden?

Was kann zum ETL Ladeprozess gesagt werden?

Was ist ein Planungsbericht?

Hier werden Berichte zur Entscheidungsvorbereitung bzw. -unterstützung eingesetzt. Sie sollen den Entscheidungsträgern als unterstützende Massnahme zur Entscheidungsfindung helfen.

Was ist ein Kontrollbericht?

Ein weiterer Zweck eines Berichts ist die Kontrolle. Bei Abweichungen können Ergebnisse aus der Kontrolle in direkte Massnahmen münden. 

Was ist ein Dokumentationsbericht?

Der Bedarf zur Dokumentation folgt aus den Regelungen des externen Finanz- und Rechnungswesens, das Aufbewahrungspflichten und –fristen für bestimmte Bilanz- und Finanzdaten vorsieht.

Des Weiteren werden solche Berichte auch im internen Gebrauch verwendet, um z.B. Auswertungen auf Basis von historisierten Daten mit Referenzständen durchzuführen.

Welche Berichtsarten gibt es?

Standardbericht:

Die Standardberichte lassen sich dadurch kennzeichnen, dass wesentliche Elemente wie Inhalt, Form und Erscheinungstermin fest standardisiert sind. Da ein Standardbericht einen hohen Stellenwert in der Unternehmenspraxis einnimmt, sollte bei der Gestaltung feste Konventionen zur Analyse und Erstellung angewendet werden.

 

Bedarfsberichte:

Die Bedarfsberichte werden angefordert, wenn der Informationsbedarf des Managements über den Informationsgehalt von Standardberichte hinausgeht. Der Umfang und Informationsgehalt eines Bedarfsberichts hängt vom Analyse- und Informationsbedarf des Empfängers ab. Eine besondere Form solcher Berichte ist der Adhoc-Bericht. Sie werden häufig und kurzfristig nachgefragt. Das hat zur Folge, dass sowohl Empfänger als auch Träger dieser Berichte nicht mehr zwischen der Vielfalt eines Berichts unterscheiden können und dadurch viele Berichte im Berichtswesen untergehen.

 

Abweichungsberichte:

Die Abweichungsberichte werden nicht nach einem festen Zyklus erstellt. Sie werden meistens automatisiert erstellt und dem Management vorgelegt, wenn bestimmte Grenzwerte von bestimmten Kennzahlen unter- bzw. überschritten werden. Die Abweichungsberichte werden zur Kontrolle von bestimmten Schwellenwerten verwendet.

Was ist ein OLAP Cube?

Der OLAP-Cube (Würfel) dient zur Grundlage für multidimensionale Analysen. Die Dimensionen werden durch die Kanten des Würfels repräsentiert. Die Länge der Kanten wird durch die Anzahl der Merkmale bestimmt. Innerhalb der Würfelzellen werden ein oder mehrere Fakten hinterlegt. Damit wird jedes Faktum durch die jeweils in Relation stehende Dimension charakterisiert.

Was ist mit Drill-Down-/Roll-Up-Operationen gemeint?

Die OLAP-Operationen Drill-Down und Roll-Up ermöglichen das Durchlaufen der Verdichtungsstufen, entlang der auf einer Dimension zugeordneten Merkmale in einem Würfel.

Mit der Funktion Drill-Down steigt man von einem aggregierten Merkmal auf ein Merkmal mit der nächsttieferen detaillierten Verdichtungsstufe ab.

Mit Hilfe der Operation Roll-Up aggregiert man von einer tieferen detaillierten Verdichtungsstufe zu einer nächsthöheren verallgemeinerten Verdichtungsstufe.

Was ist mit Slice/Dice Operationen gemeint?

Die OLAP-Operation Slice gleicht dem Herausschneiden einer Scheibe aus einem dreidimensionalen Würfel. Das Ergebnis wird in einer zweidimensionalen Tabelle zurückgeliefert. Die OLAP-Operation Dice schneidet einen Teilwürfel aus einem OLAP-Cube heraus. Auf Basis des Teilwürfels können weitere Operationen, wie z.B. dem weiteren Herausschneiden (Slice) durchgeführt werden.

Was ist mit Rotate-Operationen gemeint?

Die OLAP-Operation Rotate dreht einen OLAP-Cube um seine eigenen Achsen. Durch die Drehung erhält der Anwender unterschiedliche Sichten auf einen Datenwürfel.

Was ist mit Informationsart bei Berichten gemeint?

Sie definiert, welche Aussage an den Empfänger kommuniziert wird. Die Information kann faktische, erklärende, normative und prognostische Aussagen beinhalten.

Was ist die Balanced Scorecard?

Ist ein Steuerungsinstrument für das Controlling. Sie beinhaltet die wichtigsten strategischen Ziele eines Unternehmens. Hierzu werden Kennzahlen, Zielvorgaben und Maßnahmen zugeordnet und in einer einheitlichen Ansicht zusammengefasst.

Was ist mit Informationsgegenstand bei Berichten gemeint?

Der Informationsgegenstand charakterisiert die Perspektive auf die Informationsart. Es können Ausschnitte aus einem bestimmten Geschäftsbereich oder Vergleiche zwischen IST- oder SOLL-Werte sein. Oft werden solche Vergleiche auf historisierte Referenzstände durchgeführt.

Was ist mit Informationsstruktur bei Berichten gemeint?

Die Informationsstruktur besteht aus dem Inhaltsverzeichnis, einer Management Summary (bei sehr langen Berichten) und den wesentlichen, stark verdichteten Informationen.

Die Management Summary verfolgt eine pyramidenförmige Struktur, welche von der Kernaussage bis auf detaillierten Ausprägungen heruntergebrochen werden kann. Als Beispiel könnte ein Bericht dienen, der im Allgemeinen den Zustand des Unternehmens beschreibt und im Detail den Gewinn pro Einheit darstellt.