Приглашаем вас на десятный митап сообщества Database Internals. В программе пять докладов про PostgreSQL, Data Fusion, графовые СУБД и применение JIT в компиляции запросов.
Мероприятие пройдет офлайн на секции конференции ISPRAS Open по адресу Москва, Раменский бульвар, д. 1. Кластер «Ломоносов». При очном участии обязательно наличие паспорта.
ВАЖНО! Для участия в мероприятии пройдите регистрацию на сайте конференции ISPRAS Open.
13:00-14:00 Расширяя пределы PostgreSQL: архитектура и интеграция OrioleDB. Александр Коротков, Head of PostgreSQL group, Supabase, Константин Осипов, Управляющий директор, Аренадата
14:00 - 15:00 Проблема медленного JIT решена? Тимур Сафин, Директор лаборатории DBLab, LRI
15:00 - 16:00 Кофе/ланч брейк
16:00 - 17:00 Разработка нативного акселератора SQL-запросов на Rust для Trino. Владимир Озеров, Генеральный директор, CedrusData
17:00 - 18:00 Линейная алгебра как основа для языка запросов к графам. Семен Григорьев, Доцент кафедры системного программирвоания СПбГУ
18:00 - 19:00 Проблемы субтранзакций и мультитранзакций в Postgres. Андрей Бородин, Руководитель разработки СУБД с открытым кодом, Яндекс
PostgreSQL традиционно ценят за продуманную расширяемость, заложенную ещё в ранних архитектурных решениях времён Berkeley. Однако при всей гибкости системы её реализация MVCC долго оставалась уязвимым местом и регулярно становилась объектом обоснованной критики. OrioleDB реализует табличный движок, реализующий не только MVCC на базе UNDO log, но и привносящий ряд совершенно новых для PostgreSQL концепций: row-level WAL, copy-on-write checkpoints, squizzling pointers. Это удалось сделать внутри расширения ценой небольшого по объёму патча к ядру PostgreSQL. В данном докладе я расскажу об основных алгоритмах и технических челленджах самого движка OrioleDB, сложностях интеграции с ядром PostgreSQL, а также о перспективах продвижения этих разработок в комьюнити.
Для достижения максимума производительности разработчики СУБД рано или поздно начинают применять JIT кодогенерацию. Обычно для такого используется LLVM JIT, так сделано и в PostgreSQL, и в ClickHouse, в GaussDB, и множестве других проектов. Но проблема в том, что накладные расходы на кодогенерацию в инфраструктуре LLVM JIT могут привести к замедлению исполнения запросов, а не ускорению. Мы рассмотрим альтернативные подходы, и текущий state of the art в данной области, которые позволят решить эту проблему.
Многие популярные big data технологии основаны на Java. Этот язык дает высокую скорость разработки, стабильность и богатую экосистему вспомогательных проектов. Вместе с тем, Java не всегда позволяет добиться наилучшей производительности. Из-за этого набирает популярность подход, когда часть движка переписывают на нативные языки C++ или Rust. Примерами являются проекты Comet (Spark), Velox (Presto, Spark), Iron Vector (Flink).
В данном докладе Владимир расскажет о разработке проекта Oxide, нативного акселератора для Trino на основе Rust и Apache Arrow DataFusion. Обсудим мотивацию, архитектуру решения и результаты, которых удалось добиться.
GraphBLAS предалгает разреженную линейную алгебру как путь к высокопроизводительному (параллельному) анализу графов. Попробуем поглубже познакомиться с таким подходом. Начнём разговор с рассмотрения базовых связей между задачами анализа графов и линейной алгеброй. Обсудим, как может быть устроена параметризация операций над матрицами и векторами, и причём тут полукольца. Посмотрим на то, как в рамках линейной алгебры можно учитывать не только топологию графа, но атрибуты вершин и рёбер. В финале поговорим о том, каких успехов уже удалось добиться мировому сообществу на пути трансляции привычных языков запросов в операции линейной алгебры, и каковы сейчас основные направления развития в этой области.
В докладе я расскажу о своей работе по улучшению подсистем, которые хранят информацию о статусах подтранзакций и мультитранзакций. Эта информация критична в не самых часто используемых аспектах MVCC, но без неё полностью эффективно реализовать все возможности стандарта SQL затруднительно. Вместе с тем, сами эти подсистемы вызывали значительное количество инцидентов целостности данных и проблем производительности в прошлом, несмотря на довольно простую архитектуру.
ВАЖНО! Для участия в мероприятии пройдите регистрацию на сайте конференции ISPRAS Open

Вы будете получать информацию о предстоящих мероприятиях в онлайне в выбранных категориях.
Обещаем, никакого спама! Вы сможете отписаться в любое время.