Привет, Хабр!
В этой статье разберём, как построить SQL-пайплайн для анализа A/B тестов с акцентом на чистку данных — дедупликацию, фильтрацию фрода, агрегацию и финальную сводку по пользователям.
Писать будем на PostgreSQL 13+, так как он отлично поддерживает нужные нам конструкции: FILTER
, ROW_NUMBER()
, CASE
, NULLIF
, CTE
.