Data Engineering & AI Producten

Data die écht waarde toevoegt

DataDepth ontwikkelt data engineering oplossingen en AI-aangedreven producten voor organisaties die hun data willen omzetten naar operationele inzichten — gebouwd op moderne lakehouses, PySpark en agentic LLM-architecturen.

// Tech stack
PySpark
Delta Lake
Apache Iceberg
Databricks
DuckDB
Power BI
FastAPI
Docker
Python
LLM / RAG
20+
Jaar ervaring
6+
Grote migraties
55+
Testen in portfolio
3
Actieve producten
Producten

Gebouwd voor de moderne data engineer

Concrete, productie-ready tools die ik ontwikkel buiten mijn vaste rol — aangedreven door agentic AI en moderne open table formats.

🤖

RAG POC — Lokale AI Stack

Een volledig offline RAG-systeem met SSE token streaming, een vier-container Docker Compose stack (Qdrant, FastAPI, Node/Express, nginx) en RBAC-ondersteuning. Alle architectuurpatronen gedocumenteerd in een skill-bestand.

Qdrant FastAPI Docker LLM SSE Streaming
📊

Power BI + Claude Framework

Een Python + React framework dat Claude verbindt met de Power BI REST API via Few/Tufte design principes. Uitgebreid naar een lokale variant die de Power BI Desktop Analysis Services instantie benut.

Power BI Claude API Python React DAX
Werkervaring

Bewezen in de praktijk

Meer dan twee decennia ervaring in data engineering, van on-premise SQL Server omgevingen tot moderne cloud lakehouse architecturen.

Argenta
Apr 2025 — Heden
Stedin
Jul 2023 — Apr 2025
PwC
Okt 2022 — Jun 2023
NIBC
Feb 2022 — Sep 2022
NS via HotItem
Jul 2020 — Jan 2022
Staedion
Jan 2003 — Mar 2019
Senior Data Engineer
Argenta Apr 2025 — Heden

Taken & resultaten

  • Voorbereiding van datawarehouse migratie naar Databricks
  • Inrichting van datawarehouse conform Kimball methodologie
  • Opstellen van business requirements en testautomatisering
  • Verbeteren legacy datawarehouse ter voorbereiding op migratie
  • Verbetering van datakwaliteit en automatisering van werkprocessen via Python
PL-SQL DevOps Datavault Kimball Python ODI Mermaid

LLM's als werkinstrument

Ik zet agentic inzet van grote taalmodellen in als serieuze engineering tool — niet als gimmick. Van het orkestreren van data pipelines tot het bouwen van RAG-systemen en het automatiseren van BI workflows.

🔗

Multi-agent orkestratie

Claude Code in agentic modus met GitHub MCP integratie voor geautomatiseerde code review, refactoring en documentatiegeneratie in data engineering projecten.

📦

RAG voor data context

Volledig lokale RAG-systemen die domeinkennis ontsluiten voor data engineers — van schema-documentatie tot pipeline troubleshooting, zonder data het pand te verlaten.

📊

BI + LLM integratie

Power BI dashboards aangedreven door Claude via de REST API — semantische laag vertaald naar natural language inzichten voor business stakeholders.

LLM Orchestrator claude-sonnet
Data Source Lakehouse / Delta
Vector Store Qdrant RAG
Pipeline PySpark / Iceberg
Output Power BI / API
Orchestration Docker Compose
Skills

Brede technische diepgang

Van traditionele SQL Server omgevingen tot de moderne open lakehouse stack — gecombineerd met sterke kennis van datamodellering en governance.

Lakehouse & Cloud

  • Databricks
  • Apache Iceberg
  • Delta Lake
  • Azure / Azure DevOps
  • DuckDB
  • Trino

Engineering

  • PySpark
  • Python / Pandas
  • T-SQL / PL-SQL
  • FastAPI
  • Docker Compose
  • ETL / Airflow

Modellering

  • Data Vault 2.0
  • Kimball / Stermodel
  • One Big Table
  • Data Governance
  • Data Lineage
  • SSAS Tabular

BI & AI

  • Power BI / DAX
  • Power Query
  • LLM / RAG
  • Qdrant
  • Claude API
  • SSIS / SSRS

Laten we samenwerken

DataDepth staat open voor interessante vraagstukken op het vlak van data engineering, lakehouse architectuur of AI-integratie. Ik werk transparant — ook over mijn inzet van AI-tooling.