Связка analytics

Data Engineering

Полный стек для построения data pipelines. ETL, хранилища данных, оркестрация и качество данных.

4 MCP
3 навыков
3 агентов
Установить одной командой
curl -fsSL https://vibebaza.com/i/data-engineering | bash

Что входит в связку

MCP-серверы

4 серверов для подключения инструментов

Агенты

3 агентов для автоматизации задач

Подробнее

Для кого эта связка

Для дата-инженеров и аналитиков, строящих пайплайны обработки данных.

Что включено

MCP-серверы

PostgreSQL — OLTP база данных. Транзакции, источник данных.

ClickHouse — OLAP база для аналитики. Быстрые агрегации на больших данных.

SQLite — легковесная база для локальной разработки и тестирования.

Airflow — оркестрация пайплайнов. DAG, расписание, мониторинг.

Навыки

Airflow DAG Builder — создание DAG для оркестрации задач.

Change Data Capture — захват изменений из источников.

BigQuery Partitioning — оптимизация партиционирования таблиц.

Агенты

Data Engineer — построение надежных data pipelines.

Database Optimizer — оптимизация запросов и схем.

Analytics Reporter — создание аналитических отчетов.

Как использовать

  1. Определите источники данных
  2. Создайте DAG для ETL процессов
  3. Настройте CDC для инкрементальной загрузки
  4. Оптимизируйте запросы с Database Optimizer

Пример промпта

Создай Airflow DAG для ETL пайплайна:
- Источник: PostgreSQL (orders, products, users)
- Приемник: ClickHouse (data warehouse)
- Расписание: каждый час
- Логика: инкрементальная загрузка по updated_at
- Алерты: Slack при ошибках

Архитектура Data Pipeline

┌────────────┐     ┌────────────┐     ┌────────────┐
│ PostgreSQL │     │   MySQL    │     │    API     │
│   (OLTP)   │     │   (OLTP)   │     │  Sources   │
└─────┬──────┘     └─────┬──────┘     └─────┬──────┘
      │                  │                  │
      └──────────────────┼──────────────────┘
                         │
                  ┌──────▼──────┐
                  │   Airflow   │
                  │  (Extract)  │
                  └──────┬──────┘
                         │
                  ┌──────▼──────┐
                  │  Transform  │
                  │   (dbt)     │
                  └──────┬──────┘
                         │
                  ┌──────▼──────┐
                  │ ClickHouse  │
                  │   (OLAP)    │
                  └──────┬──────┘
                         │
                  ┌──────▼──────┐
                  │  Dashboards │
                  │  (Metabase) │
                  └─────────────┘

Результат

  • Надежные data pipelines
  • Real-time аналитика
  • Оптимизированные запросы
  • Мониторинг качества данных
Zambulay Спонсор

Карта для оплаты Claude, ChatGPT и других AI