практикум

Greenplum в Yandex MPP Analytics for PostgreSQL

Освойте востребованную MPP-СУБД Greenplum для больших данных от экспертов, которые её создают. Курс разработан командой Yandex Cloud и даёт практические навыки работы с полностью управляемым сервисом Yandex MPP Analytics for PostgreSQL.

темы, которые вы освоите

Greenplum
Экспертиза от Yandex.Cloud
Курс разработан и проводится командой Yandex Cloud. Все обучение построено на реальных кейсах и будет проходить на инструментах Yandex Cloud.
Мощь параллельных вычислений
Greenplum — это MPP-система, которая распределяет данные и запросы по сотням узлов. Это позволяет анализировать петабайты информации в разы быстрее классических баз данных.
Интеграция в экосистему
Технология идеально встраивается в современные data-стейки. Вы научитесь загружать данные из Kafka, S3, Hadoop и строить на их основе быстрые аналитические витрины и дашборды.
Управление Big Data
Знание Greenplum позволяет проектировать эффективные хранилища для больших данных, управлять их распределением и оптимизировать сложные запросы, что критично для дата-инженеров.
Rebrain
— большое сообщество IT-специалистов, создаём
практикумы по инфраструктуре с 2018 года
Почему выбирают наши программы
  • Автоматические проверки — мгновенная обратная связь по заданиям
  • Проверки менторами — DevOps-инжерами с опытом в индустрии от 5+ лет
  • Возможность общаться с опытными практикующими специалистами
  • Свободный темп — проходите без жёстких дедлайнов
  • Прикладные задачи — кейсы, приближенные к реальной работе DevOps-инженера
phone

Кому подойдёт

Data-инженеры / ETL-разработчики

Специалисты, которые хотят освоить новую мощную СУБД для построения масштабируемых хранилищ данных и пайплайнов, чтобы работать с объёмами в сотни терабайт и более.

Аналитики данных / BI-специалисты

Для тех, кому не хватает скорости и мощности текущих инструментов. Навыки работы с Greenplum позволят самостоятельно готовить данные для сложных отчетов и быстро выполнять глубокую аналитику.

Разработчики БД / Архитекторы

Профессионалы, которые стремятся расширить экспертизу в области распределенных систем, изучить архитектуру MPP и научиться проектировать высоконагруженные аналитические базы данных.

Как проходит
практикум

Команда Rebrain изучает, какие из компетенций требуются на разных уровнях профессий. Мы понимаем, что нужно знать, чтобы на собеседовании или при выполнении задач чувствовать себя уверенно. После наших практикумов специалисты легко адаптируются к реальным рабочим условиям.

Материалы останутся с вами навсегда
Проходите в удобное для вас время

программа практикума

Онбординг

  • Введение
  • Входной тест

Общая информация о Greenplum

  • Знакомство с Greenplum
  • Архитектура Greenplum
  • Greenplum в сервисе Yandex MPP Analytics for PostgreSQL
  • Лабораторная работа #1

Физическая модель данных и DDL

  • Ключевые сущности Greenplum
  • Таблицы: виды, дистрибуция и сжатие
  • Таблицы: партицирование
  • Типы данных
  • Преобразование типов данных
  • Индексы, ограничения целостности, последовательности
  • Представления и функции. Зависимости между объектами БД
  • Лабораторная работа #2

Работа с внешними источниками

  • Инструменты СУБД Greenplum для загрузки и выгрузки данных
  • Лабораторная работа #3

Оптимизация производительности запросов

  • Как выполняются запросы в Greenplum
  • Операторы в плане запроса. Спилл-файлы
  • Факторы, влияющие на план запроса
  • Анализ запросов
  • Оптимизация производительности запросов
  • Лабораторная работа #4

Итоги

  • Итоговый тест
  • Заключение
Эксперт практикума
Никита Целищев
Никита Целищев
Консалтинг, ретейл, спикер практикумов Yandex Cloud
Архитектор Data Platform

Ключевые навыки для резюме:

Проектирование и создание кластеров Greenplum в управляемом сервисе Yandex MPP Analytics for PostgreSQL.
Оптимизация физической модели данных: дистрибуция, партиционирование и сжатие таблиц для максимальной производительности.
Написание эффективных DDL-скриптов с учётом особенностей распределенной архитектуры Greenplum.
Загрузка и выгрузка данных из внешних источников с использованием встроенных инструментов Greenplum.
Анализ и чтение планов выполнения сложных запросов в распределённой среде.
Выявление и устранение узких мест производительности запросов, работа со спилл-файлами.
Применение лучших практик от команды Yandex Cloud для построения отказоустойчивых аналитических хранилищ.

немного о
технологии

Лидер в аналитике больших данных

Greenplum — одна из самых популярных MPP (Massively Parallel Processing) СУБД в мире. Она используется в крупнейших компаниях для обработки петабайтов данных, где обычные базы не справляются.

Полностью управляемое решение в облаке

В Yandex Cloud Greenplum доступен как сервис Yandex MPP Analytics. Вам не нужно администрировать кластер — можно сосредоточиться на данных, а облако обеспечит масштабирование и отказоустойчивость.

Скорость, которая меняет подходы

Благодаря распределённой архитектуре, сложные аналитические запросы, которые выполнялись часами, в Greenplum могут занимать минуты. Это ускоряет принятие бизнес-решений.

Карьерный рост для дата-специалиста

Навык работы с Greenplum — это весомое конкурентное преимущество на рынке труда. Эксперты в этой области высоко ценятся в финтехе, телекоме, ритейле и других data-driven индустриях.

Построен на PostgreSQL

Если вы уже знакомы с PostgreSQL, освоить Greenplum будет значительно проще. Вы сможете использовать знакомый SQL, но получите в распоряжение мощь распределенных вычислений для big data.

Пример задания

  1. Разверните кластер Greenplum в сервисе Yandex MPP Analytics for PostgreSQL.

  2. Изучите архитектуру Greenplum Master Segment — распределение данных.

  3. Проверьте корректность создания кластера и доступность компонентов.

  4. Подготовьте краткое описание архитектуры развёрнутого решения и сценариев отказоустойчивости.

Спроектируйте таблицу для аналитического сценария с учётом типа таблицы схемы дистрибуции партицирования.

  1. Создайте таблицу с использованием DDL.

  2. Настройте индексы и ограничения целостности.

  3. Проверьте влияние выбранной дистрибуции на выполнение запросов.

  1. Подготовьте внешний источник данных для загрузки.

  2. Используйте встроенные инструменты Greenplum для загрузки данных.

  3. Выполните выгрузку данных из Greenplum во внешний источник.

  4. Проанализируйте скорость и корректность загрузки и выгрузки.

  1. Выполните аналитический SQL-запрос к подготовленным данным.

  2. Проанализируйте план выполнения запроса.

  3. Определите узкие места операторы спилл файлы.

  4. Оптимизируйте запрос и сравните показатели производительности до и после.

Остались вопросы?
Приходите на бесплатную консультацию с экспертом. Мы ответим на все вопросы
и подробнее расскажем о практикуме.

практикум

Greenplum в Yandex MPP Analytics for PostgreSQL

В стоимость входит:

  • Выполнение задач на настоящей инфраструктуре
  • Сопровождение — менторы, координатор
  • Бессрочный доступ к теоретической части практикума
стоимость
55.000 руб.
от 13.750 руб./мес.

долями на 4 платежа

от 13.750 руб./мес.

долями на 4 платежа, или сразу - 55.000 руб.

Перейти к оплате >>>

Файлы куки

При использовании данного сайта, вы подтверждаете свое согласие на использование файлов cookie и других похожих технологий в соответствии с настоящим Уведомлением.