практикум
ClickHouse для дата-инженеров
стек, который вы освоите
практикумы по инфраструктуре с 2018 года
- Автоматические проверки — мгновенная обратная связь по заданиям
- Проверки менторами — DevOps-инжерами с опытом в индустрии от 5+ лет
- Возможность общаться с опытными практикующими специалистами
- Свободный темп — проходите без жёстких дедлайнов
- Прикладные задачи — кейсы, приближенные к реальной работе DevOps-инженера
Кому подойдёт
Дата-инженеры
Вы строите пайплайны, но ваша аналитическая БД — узкое горлышко? Научитесь проектировать и поддерживать высокопроизводительное хранилище, которое не сломается под нагрузкой.
Backend-разработчики
Вам нужно хранить и анализировать горы логов, ивентов или метрик вашего сервиса? Забудьте о медленных вставках и запросах. ClickHouse станет вашим оружием для встроенной аналитики.
Аналитики / BI-разработчики
Вы устали ждать результата запросов по несколько минут? Поймите, как устроен ClickHouse, чтобы правильно структурировать данные и формулировать запросы, летающие на скорости света.
Как проходит
практикум
Команда Rebrain изучает, какие из компетенций требуются на разных уровнях профессий. Мы понимаем, что нужно знать, чтобы на собеседовании или при выполнении задач чувствовать себя уверенно. После наших практикумов специалисты легко адаптируются к реальным рабочим условиям.
Материалы останутся с вами навсегда
Проходите в удобное для вас время
программа практикума
Онбординг
- Входной тест
- Введение
Основы ClickHouse
- Кратко о модуле
- Знакомство с ClickHouse
- Установка, базовая настройка, управление сервером
- Подключение и аутентификация
- Создание таблиц
- Управление пользователями и доступом
- Чтение логов
- Проверьте себя
- Лабораторная работа № 1
- Подводим итоги
- Обратная связь
Структура базы данных
- Кратко о модуле
- Основные движки таблиц
- Лабораторная работа № 2
- Специализированные движки таблиц
- Лабораторная работа № 3
- Типы данных
- Агрегатные типы данных
- Лабораторная работа № 4
- Индексы: теория
- Индексы: практика
- Лабораторная работа № 5
- ZooKeeper в кластерной инсталляции
- Лабораторная работа № 6
- Проверьте себя
- Подводим итоги
- Обратная связь
Проектирование структуры БД и SQL-запросы
- Кратко о модуле
- Изменение данных и структуры БД
- Лабораторная работа № 7
- Партицирование таблиц
- Лабораторная работа № 8
- Реплицируемые таблицы
- Лабораторная работа № 9
- Простые и материализованные представления
- Лабораторная работа № 10
Проектирование структуры БД и SQL-запросы (Часть 2)
- Проекции в ClickHouse
- Лабораторная работа № 11
- Distributed. Как изменять движки таблиц
- Как изменять движки таблиц: продолжение
- Explain
- Join
- Лабораторная работа № 12
- Словари
- Проверьте себя
- Подводим итоги
- Обратная связь
Потоки данных
- Кратко о модуле
- Интеграция с внешними источниками
- Примеры data pipelines
- Подводим итоги
- Обратная связь
Настройка и мониторинг
- Кратко о модуле
- Системные таблицы и основные метрики для мониторинга: часть 1
- Системные таблицы и основные метрики для мониторинга: часть 2
- Диагностика и анализ метрик для создания уведомлений о критических ситуациях
- Настройка Yandex Cloud Monitoring
- Управление нагрузкой: квоты и ограничения
- Проверьте себя
- Лабораторная работа № 13
- Подводим итоги
- Обратная связь
Резервное копирование и обновление кластера
- Кратко о модуле
- Обеспечение консистентности данных
- Резервное копирование и восстановление
- Техническое обслуживание и обновление кластера
- Проверьте себя
- Подводим итоги
- Обратная связь
Эффективное использование ClickHouse
- Кратко о модуле
- Подходы к оптимизации производительности
- Проектирование
- Проверьте себя
- Подводим итоги
- Обратная связь
Итоги практикума
- Финишная прямая
- Итоговый тест
- Итоги курса
Ключевые навыки для резюме:
немного о
технологии
Вы упираетесь в ограничения PostgreSQL или MySQL на больших данных
Ваши аналитические запросы выполняются минутами или часами? ClickHouse, с его column-oriented архитектурой и векторизацией, ускорит их в сотни раз, изменив ваш подход к аналитике.
Вам нужно работать с данными в реальном времени (real-time analytics)
Загрузка данных пачками раз в сутки — это вчерашний день. Вы научитесь настраивать потоковую загрузку из Kafka, чтобы анализировать данные с задержкой в секунды.
Вы хотите понимать механику, а не просто писать запросы
Мы не будем учить вас простому SQL. Мы разберём, как данные физически лежат на диске, как работает сжатие, зачем нужен первичный ключ в MergeTree. Это знание — основа для реальной оптимизации.
Управлять своим кластером — дорого и сложно
Вы узнаете, как эффективно использовать Managed Service for ClickHouse от Yandex Cloud: делегировать рутину (обновления, отказоустойчивость) облаку, фокусируясь на логике данных и запросах.
Вы знаете, что производительность — это не «волшебная кнопка»
Мы честно разберём, где ClickHouse сияет (аналитика по «широким» таблицам), а где он не подходит (частые точечные UPDATE/DELETE, транзакции). Вы научитесь выбирать правильный инструмент под задачу.
и подробнее расскажем о практикуме.
практикум
ClickHouse для дата-инженеров
В стоимость входит:
- Выполнение задач на настоящей инфраструктуре
- Сопровождение — менторы, координатор
- Бессрочный доступ к теоретической части практикума