Database Internals Meetup #10 (офлайн + онлайн): 5 докладов на конференции ISPRAS Open

Name: Database Internals Meetup #10 (офлайн + онлайн): 5 докладов н…
Start: 2025-12-09T13:00
Location: Онлайн

Database Internals Meetup #10 (офлайн + онлайн): 5 докладов на конференции ISPRAS Open

9 декабря 2025

ВТОРНИК

13:00

Приглашаем вас на десятный митап сообщества Database Internals. В программе пять докладов про PostgreSQL, Data Fusion, графовые СУБД и применение JIT в компиляции запросов.

Мероприятие пройдет офлайн на секции конференции ISPRAS Open по адресу Москва, Раменский бульвар, д. 1. Кластер «Ломоносов». При очном участии обязательно наличие паспорта.

ВАЖНО! Для участия в мероприятии пройдите регистрацию на сайте конференции ISPRAS Open.

Программа

13:00-14:00 Расширяя пределы PostgreSQL: архитектура и интеграция OrioleDB. Александр Коротков, Head of PostgreSQL group, Supabase, Константин Осипов, Управляющий директор, Аренадата

14:00 - 15:00 Проблема медленного JIT решена? Тимур Сафин, Директор лаборатории DBLab, LRI

15:00 - 16:00 Кофе/ланч брейк

16:00 - 17:00 Разработка нативного акселератора SQL-запросов на Rust для Trino. Владимир Озеров, Генеральный директор, CedrusData

17:00 - 18:00 Линейная алгебра как основа для языка запросов к графам. Семен Григорьев, Доцент кафедры системного программирвоания СПбГУ

18:00 - 19:00 Проблемы субтранзакций и мультитранзакций в Postgres. Андрей Бородин, Руководитель разработки СУБД с открытым кодом, Яндекс

Доклады

Расширяя пределы PostgreSQL: архитектура и интеграция OrioleDB.

Александр Коротков, Head of PostgreSQL group, Supabase, Константин Осипов, Управляющий директор, Аренадата

PostgreSQL традиционно ценят за продуманную расширяемость, заложенную ещё в ранних архитектурных решениях времён Berkeley. Однако при всей гибкости системы её реализация MVCC долго оставалась уязвимым местом и регулярно становилась объектом обоснованной критики. OrioleDB реализует табличный движок, реализующий не только MVCC на базе UNDO log, но и привносящий ряд совершенно новых для PostgreSQL концепций: row-level WAL, copy-on-write checkpoints, squizzling pointers. Это удалось сделать внутри расширения ценой небольшого по объёму патча к ядру PostgreSQL. В данном докладе я расскажу об основных алгоритмах и технических челленджах самого движка OrioleDB, сложностях интеграции с ядром PostgreSQL, а также о перспективах продвижения этих разработок в комьюнити.

Проблема медленного JIT решена?

Тимур Сафин, Директор лаборатории DBLab, LRI

Для достижения максимума производительности разработчики СУБД рано или поздно начинают применять JIT кодогенерацию. Обычно для такого используется LLVM JIT, так сделано и в PostgreSQL, и в ClickHouse, в GaussDB, и множестве других проектов. Но проблема в том, что накладные расходы на кодогенерацию в инфраструктуре LLVM JIT могут привести к замедлению исполнения запросов, а не ускорению. Мы рассмотрим альтернативные подходы, и текущий state of the art в данной области, которые позволят решить эту проблему.

Разработка нативного акселератора SQL-запросов на Rust для Trino.

Владимир Озеров, Генеральный директор, CedrusData

Многие популярные big data технологии основаны на Java. Этот язык дает высокую скорость разработки, стабильность и богатую экосистему вспомогательных проектов. Вместе с тем, Java не всегда позволяет добиться наилучшей производительности. Из-за этого набирает популярность подход, когда часть движка переписывают на нативные языки C++ или Rust. Примерами являются проекты Comet (Spark), Velox (Presto, Spark), Iron Vector (Flink).

В данном докладе Владимир расскажет о разработке проекта Oxide, нативного акселератора для Trino на основе Rust и Apache Arrow DataFusion. Обсудим мотивацию, архитектуру решения и результаты, которых удалось добиться.

Линейная алгебра как основа для языка запросов к графам.

Семен Григорьев, Доцент кафедры системного программирвоания СПбГУ

GraphBLAS предалгает разреженную линейную алгебру как путь к высокопроизводительному (параллельному) анализу графов. Попробуем поглубже познакомиться с таким подходом. Начнём разговор с рассмотрения базовых связей между задачами анализа графов и линейной алгеброй. Обсудим, как может быть устроена параметризация операций над матрицами и векторами, и причём тут полукольца. Посмотрим на то, как в рамках линейной алгебры можно учитывать не только топологию графа, но атрибуты вершин и рёбер. В финале поговорим о том, каких успехов уже удалось добиться мировому сообществу на пути трансляции привычных языков запросов в операции линейной алгебры, и каковы сейчас основные направления развития в этой области.

Проблемы субтранзакций и мультитранзакций в Postgres.

Андрей Бородин, Руководитель разработки СУБД с открытым кодом, Яндекс

В докладе я расскажу о своей работе по улучшению подсистем, которые хранят информацию о статусах подтранзакций и мультитранзакций. Эта информация критична в не самых часто используемых аспектах MVCC, но без неё полностью эффективно реализовать все возможности стандарта SQL затруднительно. Вместе с тем, сами эти подсистемы вызывали значительное количество инцидентов целостности данных и проблем производительности в прошлом, несмотря на довольно простую архитектуру.