CAS Data Engineering

Anbieter

ZHAW Departement School of Management and Law

Ort

auf Anfrage

Start

22.08.2026

Anmeldeschluss

07.08.2026

Dauer

132 Lektionen

Preis

CHF 8'340.00

Abschluss

CAS

Hinweis zum Datenschutz

Das Phänomen der stetig zunehmenden Menge und Verbreitung von Daten begleitet uns seit Jahrzehnten. Zu Beginn dieser Entwicklung entstanden Daten in Systemen, bei denen die gewünschte Funktionalität die Form und Verarbeitung der Daten vorgab. Heutzutage verbreiten sich aber auch Systeme, in denen ein Nutzen dank dem Einbezug vorhandener Daten gestiftet wird. Zielpublikum:

Der CAS richtet sich an Fach- und Führungskräfte aus allen Branchen, welche ein Grundlagenverständnis für das Datenmanagement mitbringen, bereits Erfahrungen im generellen Umgang mit Daten gesammelt haben (bspw. durch den Besuch des CAS Data Competence for Business) und sich im Bereich der Sammlung, Aufbereitung, Validierung und Distribution von Daten vertiefen wollen. Idealerweise haben Sie bereits erste Erfahrungen mit 1 – 2 Abfrage-, Programmier- oder Skriptsprachen gesammelt. Der CAS bereitet Sie darauf vor, Aufgaben im Bereich des Data Engineering selbst durchzuführen sowie auf einem fachlichen Niveau zu überwachen.

Ziele:

Sie können im Anschluss an diesen CAS:

Fragestellungen identifizieren, denen mit dem Einbezug von Daten und unterschiedlichen Aufbereitungs- und Analysemethoden begegnet werden kann
für den Erkenntnisgewinn erforderliche Daten identifizieren und spezifizieren
Speicherlösungen konzeptionieren und Datenmodelle skizzieren
Daten mittels unterschiedlicher Vorgehensweisen beschaffen und in geeignete Speicherlösungen überführen
für die Datenpipeline geeignete Transformationsmethoden kennen und anwenden, um die Datenkompatibilität herzustellen
für die Datenpipeline geeignete Bereinigungsmethoden kennen und anwenden, um eine akzeptable Datenqualität herzustellen
Grundsätzliche Überlegungen und Wege zur Bereitstellung von Daten für die Anwendungsfälle Analytik und Machine Learning kennen
die wichtigsten Überlegungen im Bereich der Informationssicherheit kennen
Überlappungen des Data Engineering – Lebensyzklus mit Datenmanagement, Orchestrierung, Software Engineeering und DevOps/DataOps/MLOps kennen
Statistische Methoden und Modelle des maschinellen Lernens für die Analyse und Validation der Daten innerhalb des Data Engineering - Lebenszyklus kennen und anwenden
Statistische Methoden und Modelle des maschinellen Lernens für die Identifikation von Anomalien in Daten kennen und anwenden
Werkzeuge und Methoden für den Umgang mit natürlicher Sprache kennen und anwenden
Werkzeuge und Methoden für den Umgang mit Bilddaten kennen und anwenden
Werkzeuge und Methoden für den Umgang mit räumlichen Daten kennen und anwenden
Daten über ausgewählte Deployment-Lösungen bereitstellen und Datenübergänge automatisieren

Zwei Perspektiven auf den Data Value Stack:
CAS Data Engineering vs. CAS Data Competence for Business

Der CAS Data Engineering fokussiert stärker auf die technischen Grundlagen, Architekturen und Prozesse entlang des Data Value Stack, während der CAS Data Competence for Business die geschäftliche Nutzung, Bewertung und verantwortungsvolle Einordnung von Daten- und KI-Anwendungen in den Vordergrund stellt.

Inhalt:

Data Engineering bildet die technische Grundlage moderner daten- und KI-getriebener Systeme. Während sich Data Science primär mit der Analyse, Modellierung und Interpretation von Daten befasst, konzentriert sich Data Engineering auf die Konzeption, Entwicklung und den Betrieb von Datenarchitekturen, Datenpipelines und Datenplattformen. Ziel ist es, Daten aus unterschiedlichen Quellen effizient zu erfassen, zu integrieren, zu transformieren und für analytische sowie operative Anwendungen nutzbar zu machen.

Mit dem rasanten Wachstum von Datenmengen, Cloud-Plattformen und Künstlicher Intelligenz steigt in Unternehmen die Bedeutung von Fachpersonen, die Daten entlang des gesamten Datenlifecycles systematisch bereitstellen, verarbeiten und verwalten können. Moderne Data-Engineering-Lösungen bilden heute die Grundlage für Business Intelligence, Machine Learning, generative KI, automatisierte Prozesse und datenbasierte Entscheidungsunterstützung.

Im CAS Data Engineering erwerben die Teilnehmenden praxisorientierte Kompetenzen zur Entwicklung moderner Daten- und KI-Systeme. Der CAS verbindet technische Grundlagen mit produktionsnahen Anwendungen und vermittelt ein breites Spektrum an Methoden, Werkzeugen und Architekturen aus den Bereichen Data Engineering, Data Science und AI Engineering.

Jeder Themenblock kombiniert theoretische Grundlagen, architektonische und prozessorientierte Perspektiven sowie umfangreiche praktische Übungen. Die Übungen basieren auf öffentlich zugänglichen Datensätzen aus unterschiedlichen Domänen wie Gesundheit, Energie, Mobilität, Versicherungen, Finanzen oder Industrie. Es besteht zudem die Möglichkeit, mit eigenen Daten und individuellen Anwendungsfällen aus dem beruflichen Umfeld zu arbeiten.

Modul 1: Werkzeuge und Methoden

Das erste Modul widmet sich den Werkzeugen und Methoden der folgenden Phasen des Data Engineering Lifecycle (Reis & Housley, 2022).

1. Einführung

Definition von Data Engineering, Abgrenzung zu verwandten Themenbereichen
Motivation, Organisation, Anforderungen, Organisatorisches
Tools und Equipment (Programmier-, Abfrage- und Skriptsprachen, Umgebungen)
Einführungscases

2. Architekturen

Datenarchitekturen und ihrer Grundsätze
Architekturkonzepte

3. Ingestion

Formate und Datentypen
Datenquellen und -identifikation
API’s
Webscraping
Streaming

4. Storage

Verteilte Systeme
Datenbankeigenschaften
Raw ingredients
Data Storage Systems

5. Transformation

ROI der Transformation
Zeitfenster
Kombination von Streams mit anderen Daten
Kompatibilitäten
Integration
Datenqualität

6. Serving

Überlegungen zur Bereitstellung von Daten
Wege zur Bereitstellung von Daten
Anwendungsfälle Analytik und Machine Learning
Reverse ETL

7. Unterströmungen

Datenmanagement
Orchestrierung
Software Engineering
DevOps und DataOps
Informationssicherheit

Modul 2: Domänen und Daten

Im 2. Modul stehen Anwendungsfälle in den folgenden Themenblöcken im Fokus.

1. Generative KI: Von Prompts zu RAG

2. Use Cases und Best Practices im Service Public

3. Plattformen und Aggregatoren

4. Agentic AI

5. Räumliche Daten

6. Bilddaten

Sprachen und Umgebungen

Wir arbeiten mit den folgenden Sprachen und Umgebungen.

Programmier-, Abfrage- und Skriptsprachen:

Python
SQL
MongoDB Query Language (MQL)
Cypher
InfluxQL
R (optional)
Visual Basic (optional)

Frameworks und Libraries:

pandas
NumPy
Matplotlib
Seaborn
scikit-learn
TensorFlow / Keras (optional)
Flask
Dash
LangChain
Apache Spark

Entwicklungsumgebungen und Tools:

OpenRefine
Jupyter Notebook / JupyterLab
Spyder
Marimo
Visual Studio Code
GitHub Codespaces
PyCharm (optional)
Google Colab (optional)
MS Excel
MS Access (optional)

Datenmodelle und Datenbanksysteme:

Relational: SQLite, MySQL, MariaDB
Dokument-basiert: MongoDB
Graphen-basiert: Neo4j
Zeitreihen-basiert: InfluxDB
Vektor-Datenbanken: pgvector, Chroma
Lokale und cloudbasierte Datenplattformen und Datenbanksysteme (z.B. Microsoft Azure, Google Cloud Platform, Amazon Web Services)

KI und AI Engineering:

Generative KI und Large Language Models (LLMs): ChatGPT, Claude, Gemini
Lokale LLM-Umgebungen: Ollama
Editor-integrierte KI: GitHub Copilot, Cursor

Weitere Technologien und Plattformen:

Google Cloud Platform (GCP)
Git
Shell / Terminal
Docker
QT Designer (optional)
Django (optional)

Weitere Details

Kontakt

School of Management and Law
Tel... anzeigen
E-Mail Anfrage