title

text

Marco Slot
Marco Slot Citus Data Главный инженер-программист
15:00 17 марта
45 мин

Ускоряясь до миллиона записей в секунду: масштабирование PostgreSQL с помощью Citus MX

Инструмент Citus позволяет распределять таблицы PostgreSQL между несколькими серверами. Расширяя возможности PostgreSQL в плане делегирования и распараллеливания задач между группой рабочих узлов, Citus позволяет горизонтально масштабировать CPU-ресурсы и память для выполнения запросов.

Год назад мы ступили на долгий путь реализации в Citus возможности горизонтального масштабирования в новом измерении - для повышения скорости записи. Так как все запросы на запись обрабатывались через один узел PostgreSQL, скорость записи в Citus ограничивалась CPU-ресурсами одного узла. Citus MX - это новая версия Citus, которая предоставляет доступ к распределенным таблицам с любого узла, обеспечивая повышение скорости записи до уровня NoSQL решений.

Слайды

Другие доклады

  • Masahiko Sawada
    Masahiko Sawada NTT OSS Center
    45 мин

    Встроенный шардинг: текущее состояние и будущее

    Шардингом базы данных называют распределение данных по большому количеству серверов для повышения производительности при работе с большими объемами данных. С появлением технологии Foreign Data Wrappers (FDW), стало возможным рассматривать шардинг в постгресе при разумном объеме изменений программного кода. Я занимаюсь улучшением инфраструктуры FDW, в т.ч. наследованием внешних таблиц и push-down запросов, что позволяет постгресу эффективно исполнять распределенные запросы через FDW. В этом докладе мы рассмотрим шардинг на FDW и его сценарии использования, затем я продемонстрирую, как организовать шардинг, и покажу, что для этого было сделано в постгресе. В заключение мы рассмотрим основные планы на будущее - в первую очередь, это асинхронное исполнение запросов и поддержка распределенных транзакций.

  • Алексей Мергасов
    Алексей Мергасов НОКСА Дата Лаб Директор по разработке
    22 мин

    Эффективная работа с 10+ ПБ данных в PostgreSQL или новая парадигма построения "бережливых" инфраструктур данных для Data-Driven Enterprise

    Алексей расскажет о технических деталях и опыте применения подхода экстремальной нормализации данных для создания инфраструктур данных с уникальными потребительскими характеристиками. В сравнении с решениями лидеров рынка такие инфраструктуры обладают, например, такими преимуществами, как: - оперативная обработка 10 ПБ данных и больше, - в 2-6 раз более высокая производительность, - сквозная 100% консистентность данных, - практически линейная горизонтальная масштабируемость, - в 4-10 более низкая стоимость владения, - и т. д. Изложенный подход уже нашел применение за пределами России в решениях для операторов связи, ритейла, финтеха, современном производстве (Industry 4.0, индустриальный IoT), в государственном секторе.

    ВИДЕО

  • Jean-Paul Argudo
    Jean-Paul Argudo Dalibo CEO
    22 мин

    temBoard – новый инструмент для PostgreSQL

    Команда Dalibo уже много лет выпускает open-source инструменты для работы с PostgreSQL наряду с другими программными решениями (см. http://dalibo.github.io/).

    В этот раз я расскажу о temBoard, новом инструменте удаленного управления БД PostgreSQL. Данный проект доступен по ссылке https://github.com/dalibo/temboard.

    temBoard позволяет осуществлять мониторинг состояния БД, контроль за выполнением процессов, удаленную настройку параметров и задач... А в будущем мы планируем еще больше новых полезных фич! Основное назначение temBoard – это создание полноценной консоли управления для PostgreSQL, которая так необходима DBA для выполнения ежедневных задач.

  • Александр Коротков
    Александр Коротков Postgres Professional Руководитель разработки
    45 мин

    RUM-индексы и их применение

    Я представлю новый метод доступа, который расширяет имеющиеся возможности GIN-индексов, используя дополнительную информацию, хранящуюся в списке/дереве идентификаторов. Например, дополнительная информация о позициях позволяет новому методу доступа возвращать результаты по релевантности, что может значительно сократить время исполнения полнотекстовых запросов. Это также может ускорить фразовый поиск, так что данный метод будет весьма эффективным при полнотекстовом поиске. Сохранение временных меток открывает перед нами несколько интересных возможностей – мы можем отсортировать результаты по времени (например, свежие статьи, удовлетворяющие полнотекстовому запросу) на основе временных меток как таковых или сохраненных указателей, упорядоченных по временным меткам. Оба способа обеспечивают на порядок большее ускорение для таких типов запросов.