Databricks Smart SQL MCP сервер
MCP сервер, который позволяет AI агентам взаимодействовать с метаданными Databricks Unity Catalog, выполнять SQL запросы и исследовать линейность данных, включая зависимости ноутбуков и задач для комплексного анализа данных.
автор: RafaelCartenet
curl -fsSL https://vibebaza.com/i/databricks-smart-sql | bash
MCP сервер, который позволяет AI агентам взаимодействовать с метаданными Databricks Unity Catalog, выполнять SQL запросы и исследовать линейность данных, включая зависимости ноутбуков и задач для комплексного анализа данных.
Установка
Pip
pip install -r requirements.txt
UV
uv pip install -r requirements.txt
Конфигурация
Cursor (UV)
{
"mcpServers": {
"databricks": {
"command": "uv",
"args": [
"--directory",
"/path/to/your/mcp-databricks-server",
"run",
"main.py"
]
}
}
}
Cursor (Python)
{
"mcpServers": {
"databricks": {
"command": "python",
"args": [
"/path/to/your/mcp-databricks-server/main.py"
]
}
}
}
Доступные инструменты
| Инструмент | Описание |
|---|---|
list_uc_catalogs |
Выводит список всех доступных Unity Catalog с их именами, описаниями и типами |
describe_uc_catalog |
Предоставляет обзор конкретного Unity Catalog, перечисляя все его схемы с именами и описаниями... |
describe_uc_schema |
Предоставляет детальную информацию о конкретной схеме в Unity Catalog, опционально включая... |
describe_uc_table |
Предоставляет детальное описание таблицы Unity Catalog с комплексными возможностями линейности в... |
execute_sql_query |
Выполняет SQL запросы к Databricks SQL warehouse и возвращает отформатированные результаты |
Возможности
- Выполнение произвольных SQL запросов с помощью Databricks SDK
- Markdown вывод, оптимизированный для LLM, для всех описательных инструментов
- Комплексное исследование Unity Catalog и доступ к метаданным
- Анализ линейности данных, включая связи между таблицами
- Обнаружение зависимостей ноутбуков и задач
- Понимание на уровне кода через исследование содержимого ноутбуков
- Анализ потоков данных от начала до конца - от получения до потребления
- Анализ влияния и отладка проблем в пайплайнах данных
Переменные окружения
Обязательные
DATABRICKS_HOST- Имя хоста вашего экземпляра DatabricksDATABRICKS_TOKEN- Ваш персональный токен доступа DatabricksDATABRICKS_SQL_WAREHOUSE_ID- ID SQL Warehouse для выполнения запросов и получения линейности
Примеры использования
Найти и исследовать доступные каталоги данных и схемы
Понять структуры таблиц и детали столбцов перед запросами
Отследить линейность данных для понимания зависимостей выше и ниже по потоку
Обнаружить ноутбуки и задачи, которые обрабатывают конкретные таблицы
Выполнять сложные SQL запросы для анализа и получения данных
Ресурсы
Примечания
Требует Python 3.10+. Идентичность, связанная с DATABRICKS_TOKEN, должна иметь соответствующие разрешения Unity Catalog (USE CATALOG, USE SCHEMA, SELECT на таблицы) и разрешение CAN_USE на SQL Warehouse. Для продакшн использования рекомендуется сервисный принципал с узко определенными разрешениями.