MCP Бесплатно

Databricks Smart SQL MCP сервер

MCP сервер, который позволяет AI агентам взаимодействовать с метаданными Databricks Unity Catalog, выполнять SQL запросы и исследовать линейность данных, включая зависимости ноутбуков и задач для комплексного анализа данных.

автор: RafaelCartenet

Установка
Копируй и вставляй в терминал
curl -fsSL https://vibebaza.com/i/databricks-smart-sql | bash

MCP сервер, который позволяет AI агентам взаимодействовать с метаданными Databricks Unity Catalog, выполнять SQL запросы и исследовать линейность данных, включая зависимости ноутбуков и задач для комплексного анализа данных.

Установка

Pip

pip install -r requirements.txt

UV

uv pip install -r requirements.txt

Конфигурация

Cursor (UV)

{
    "mcpServers": {
        "databricks": {
            "command": "uv",
            "args": [
                "--directory",
                "/path/to/your/mcp-databricks-server",
                "run",
                "main.py"
            ]
        }
    }
}

Cursor (Python)

{
    "mcpServers": {
        "databricks": {
            "command": "python",
            "args": [
                "/path/to/your/mcp-databricks-server/main.py"
            ]
        }
    }
}

Доступные инструменты

Инструмент Описание
list_uc_catalogs Выводит список всех доступных Unity Catalog с их именами, описаниями и типами
describe_uc_catalog Предоставляет обзор конкретного Unity Catalog, перечисляя все его схемы с именами и описаниями...
describe_uc_schema Предоставляет детальную информацию о конкретной схеме в Unity Catalog, опционально включая...
describe_uc_table Предоставляет детальное описание таблицы Unity Catalog с комплексными возможностями линейности в...
execute_sql_query Выполняет SQL запросы к Databricks SQL warehouse и возвращает отформатированные результаты

Возможности

  • Выполнение произвольных SQL запросов с помощью Databricks SDK
  • Markdown вывод, оптимизированный для LLM, для всех описательных инструментов
  • Комплексное исследование Unity Catalog и доступ к метаданным
  • Анализ линейности данных, включая связи между таблицами
  • Обнаружение зависимостей ноутбуков и задач
  • Понимание на уровне кода через исследование содержимого ноутбуков
  • Анализ потоков данных от начала до конца - от получения до потребления
  • Анализ влияния и отладка проблем в пайплайнах данных

Переменные окружения

Обязательные

  • DATABRICKS_HOST - Имя хоста вашего экземпляра Databricks
  • DATABRICKS_TOKEN - Ваш персональный токен доступа Databricks
  • DATABRICKS_SQL_WAREHOUSE_ID - ID SQL Warehouse для выполнения запросов и получения линейности

Примеры использования

Найти и исследовать доступные каталоги данных и схемы
Понять структуры таблиц и детали столбцов перед запросами
Отследить линейность данных для понимания зависимостей выше и ниже по потоку
Обнаружить ноутбуки и задачи, которые обрабатывают конкретные таблицы
Выполнять сложные SQL запросы для анализа и получения данных

Ресурсы

Примечания

Требует Python 3.10+. Идентичность, связанная с DATABRICKS_TOKEN, должна иметь соответствующие разрешения Unity Catalog (USE CATALOG, USE SCHEMA, SELECT на таблицы) и разрешение CAN_USE на SQL Warehouse. Для продакшн использования рекомендуется сервисный принципал с узко определенными разрешениями.

Zambulay Спонсор

Карта для оплаты Claude, ChatGPT и других AI