Бесплатный мастер-класс «Trino для нетерпеливых»

Бесплатный мастер-класс «Trino для нетерпеливых»
13 февраля 2025
ЧЕТВЕРГ
17:00

Специализированный учебный центр по технологиям Big data — Школа Больших данных. https://www.bigdataschool.ru/ запускает новый курс обучения TRINO для инженеров данных.

Trino – это распределенный SQL движок, разработанный для работы с большими датасетами, распределенными между одним или несколькими неоднородными источниками данных.

На meetup мы развернем кластер Trino, убедимся, насколько это просто.

Разберёмся с архитектурой (коннекторы, федеральные запросы), настроим и поработаем с данным из PostgreSQL, объектного хранилища, кратко познакомимся с особенностями использования Apache Iceberg.

Погрузимся в детали процесса исполнения запросов (stage, task, driver), на примере запросов бенчмарка TPC-DS познакомимся с работой планировщик Trino, увидим, насколько хорошо он позволяет загрузить, а значит и использовать вычислительный ресурсы кластера.

Во время митапа участники смогут самостоятельно поработать с Trino, подготовленная в юпитер ноутбуках среда сделает процесс работы с Trino максимально удобным.

Участники получат раздаточные материалы, а также набор упражнений с целью закрепления полученных навыков.

Аудитория: аналитики, архитекторы платформ данных, инженеры данных, разработчики и просто интересующиеся современными технологиями обработки данных.

Уровень подготовки:

специальной подготовки не требуется, все будет происходить в интерактивной среде подготовленной нашей школой в Yandex Cloud

Продолжительность meetup: 2 академических часа, дистанционно. Trino кластер будет доступен участникам митапа 2 часа после окончания meetup.

Дата проведения: 13 февраля 2025 года в 17.00 часов

Содержание мастер-класса

 

  1. Краткий обзор
    1. История
    2. Архитектура
  2. Установка и настройка
    1. Требования к системе
    2. Конфигурационные файлы
    3. Старт/стоп кластера
    4. Клиенты и доступ
    5. Вэб интерфейс
  3. Коннекторы
    1. Встроенные
    2. MEMORY
    3. РСУБД (на пример PostgreSQL)
    4. Объектные хранилища (на примере Яндекс облака)
      1. Метастор (на примере HMS)
      2. Apache Iceberg
  4. Процесс исполнения
    1. Принципы и сравнение с другими движками
    2. Stage, task, driver, split
    3. Планировщик
    4. Оптимизатор
  5. Системные таблицы
    1. История запросов
    2. Статистика исполнения запроса
    3. Визуализация

Контактная информация: [email protected] или +7 (495) 41-41-121, +7 (995) 100 45 63 или @Bigdataschool_msk 


изменить информацию сообщить о проблеме

С этим мероприятием что-то не так?

  • Неправильная дата или время
  • Неправильный адрес
  • Неправильно указан тип мероприятия
  • Плохое описание
  • Мероприятие отменено или отложено
  • Неприемлемый/неприличный контент
  • Нарушение авторских прав
  • Это спам
  • Не получается купить билет

Онлайн

похожие мероприятия

Все мероприятия в онлайне