Data Engineering & AI Producten

Data die écht waarde toevoegt

DataDepth ontwikkelt data engineering oplossingen en AI-aangedreven producten voor organisaties die hun data willen omzetten naar operationele inzichten — gebouwd op moderne lakehouses, PySpark en agentic LLM-architecturen.

Bekijk producten → Neem contact op

// Tech stack

PySpark

Delta Lake

Apache Iceberg

Databricks

DuckDB

Power BI

FastAPI

Docker

Python

LLM / RAG

Producten

Gebouwd voor de moderne data engineer

Concrete, productie-ready tools die ik ontwikkel buiten mijn vaste rol — aangedreven door agentic AI en moderne open table formats.

🏗️

Medallion Lakehouse Pipeline

Een volledig portfolio-ready medallion architectuur pipeline op PySpark, Delta Lake en Apache Iceberg in parallel. Met FastAPI, Trino en 55 doorgaande tests. Open source referentie-implementatie.

Open Source PySpark Delta Lake Iceberg FastAPI Trino

🤖

RAG POC — Lokale AI Stack

Een volledig offline RAG-systeem met SSE token streaming, een vier-container Docker Compose stack (Qdrant, FastAPI, Node/Express, nginx) en RBAC-ondersteuning. Alle architectuurpatronen gedocumenteerd in een skill-bestand.

Qdrant FastAPI Docker LLM SSE Streaming

📊

Power BI + Claude Framework

Een Python + React framework dat Claude verbindt met de Power BI REST API via Few/Tufte design principes. Uitgebreid naar een lokale variant die de Power BI Desktop Analysis Services instantie benut.

Power BI Claude API Python React DAX

Werkervaring

Bewezen in de praktijk

Meer dan twee decennia ervaring in data engineering, van on-premise SQL Server omgevingen tot moderne cloud lakehouse architecturen.

Argenta

Apr 2025 — Heden

Stedin

Jul 2023 — Apr 2025

PwC

Okt 2022 — Jun 2023

NIBC

Feb 2022 — Sep 2022

NS via HotItem

Jul 2020 — Jan 2022

Staedion

Jan 2003 — Mar 2019

Senior Data Engineer

Argenta Apr 2025 — Heden

Taken & resultaten

Voorbereiding van datawarehouse migratie naar Databricks
Inrichting van datawarehouse conform Kimball methodologie
Opstellen van business requirements en testautomatisering
Verbeteren legacy datawarehouse ter voorbereiding op migratie
Verbetering van datakwaliteit en automatisering van werkprocessen via Python

PL-SQL DevOps Datavault Kimball Python ODI Mermaid

Agentic AI

LLM's als werkinstrument

Ik zet agentic inzet van grote taalmodellen in als serieuze engineering tool — niet als gimmick. Van het orkestreren van data pipelines tot het bouwen van RAG-systemen en het automatiseren van BI workflows.

🔗

Multi-agent orkestratie

Claude Code in agentic modus met GitHub MCP integratie voor geautomatiseerde code review, refactoring en documentatiegeneratie in data engineering projecten.

📦

RAG voor data context

Volledig lokale RAG-systemen die domeinkennis ontsluiten voor data engineers — van schema-documentatie tot pipeline troubleshooting, zonder data het pand te verlaten.

📊

BI + LLM integratie

Power BI dashboards aangedreven door Claude via de REST API — semantische laag vertaald naar natural language inzichten voor business stakeholders.

LLM Orchestrator claude-sonnet

Data Source Lakehouse / Delta

Vector Store Qdrant RAG

Pipeline PySpark / Iceberg

Output Power BI / API

Orchestration Docker Compose

Skills

Brede technische diepgang

Van traditionele SQL Server omgevingen tot de moderne open lakehouse stack — gecombineerd met sterke kennis van datamodellering en governance.

Lakehouse & Cloud

Databricks
Apache Iceberg
Delta Lake
Azure / Azure DevOps
DuckDB
Trino

Engineering

PySpark
Python / Pandas
T-SQL / PL-SQL
FastAPI
Docker Compose
ETL / Airflow

Modellering

Data Vault 2.0
Kimball / Stermodel
One Big Table
Data Governance
Data Lineage
SSAS Tabular

BI & AI

Power BI / DAX
Power Query
LLM / RAG
Qdrant
Claude API
SSIS / SSRS

Contact

Laten we samenwerken

DataDepth staat open voor interessante vraagstukken op het vlak van data engineering, lakehouse architectuur of AI-integratie. Ik werk transparant — ook over mijn inzet van AI-tooling.

✉ [email protected] ⌥ GitHub in LinkedIn