Специализированный учебный центр по технологиям Big data — Школа Больших данных. https://www.bigdataschool.ru/ запускает новый курс обучения TRINO для инженеров данных.
Trino – это распределенный SQL движок, разработанный для работы с большими датасетами, распределенными между одним или несколькими неоднородными источниками данных.
На meetup мы развернем кластер Trino, убедимся, насколько это просто.
Разберёмся с архитектурой (коннекторы, федеральные запросы), настроим и поработаем с данным из PostgreSQL, объектного хранилища, кратко познакомимся с особенностями использования Apache Iceberg.
Погрузимся в детали процесса исполнения запросов (stage, task, driver), на примере запросов бенчмарка TPC-DS познакомимся с работой планировщик Trino, увидим, насколько хорошо он позволяет загрузить, а значит и использовать вычислительный ресурсы кластера.
Во время митапа участники смогут самостоятельно поработать с Trino, подготовленная в юпитер ноутбуках среда сделает процесс работы с Trino максимально удобным.
Участники получат раздаточные материалы, а также набор упражнений с целью закрепления полученных навыков.
Аудитория: аналитики, архитекторы платформ данных, инженеры данных, разработчики и просто интересующиеся современными технологиями обработки данных.
Уровень подготовки:
специальной подготовки не требуется, все будет происходить в интерактивной среде подготовленной нашей школой в Yandex Cloud
Продолжительность meetup: 2 академических часа, дистанционно. Trino кластер будет доступен участникам митапа 2 часа после окончания meetup.
Дата проведения: 13 февраля 2025 года в 17.00 часов
Содержание мастер-класса
Контактная информация: [email protected] или +7 (495) 41-41-121, +7 (995) 100 45 63 или @Bigdataschool_msk
Вы будете получать информацию о предстоящих мероприятиях в онлайне в выбранных категориях.
Обещаем, никакого спама! Вы сможете отписаться в любое время.