Возможности полнотекстового поиска в PostgreSQL
Полнотекстовый поиск в PostgreSQL является, вероятно, наиболее совершенным из всех, которые имеются в реляционных СУБД. Мы расскажем о том, как настроить полнотекстовые конфигурации и словари и покажем настройку полнотекстового поиска на примере небольшого научно-популярного сайта, в котором можно выполнять поиск, используя различные функции ранжирования. Также расскажем о новом индексе RUM, который позволяет значительно ускорить некоторые виды полнотекстовых запросов и добавляет новую функцию ранжирования результатов для лучшей сортировки.
Слайды
Видео
Другие доклады
-
Андрей Бородин Яндекс Разработчик
Возможности ускорения GiST: патчи, хаки, твики
В этом докладе будут рассмотрены идеи и их реализации по ускорению различных частей обобщённых поисковых деревьев (GiST) :
- Внутристраничное индексирование
- Технология фрактальных деревьев
- Применение современных алгоритмов индексирования многомерных данных (RR*-дерево)
- Возможные расширения интерфейса GiST
ВИДЕО
-
Михаил Каган Mellanox Technologies Технический Директор
Построение высокопроизводительных горизонтально-масштабируемых СУБД
Современным высокопроизводительным и горизонтально-масштабируемым СУБД в ходе своей работы требуется перемещать огромные объемы данных между компонентами системы. Справляться с этой задачей они должны быстро и без задержек для пользователей. Именно на высочайшей пропускной способности, ультранизких задержках, а также разгрузке CPU от сетевых задач фокусируется компания Mellanox при разработке своих технологий интерконнекта. В своем докладе Михаил расскажет какую роль быстрая сетевая инфраструктура играет в системах СУБД и Big Data, а также поделится опытом компании Mellanox по построению таких систем совместного с ведущими мировыми производителями.
ВИДЕО
-
Дмитрий Белобородов UIS, CoMagic Технический директор
Опыт использования PostgreSQL в проектах UIS, CoMagic
Мы используем PostgreSQL с 2003 года и прошли путь от базы в пару гигабайт до кластера с текущим размером более 5Тб. Текущие кол-во таблиц > 700, число хранимых процедур ~1500. Чем готовы поделиться: - рассказать о проблемах, с которыми пришлось сталкиваться на разных этапах развития и найденными решениями - наработанными практиками администрирования - мы работаем с несколькими базами, которые тесно связаны друг с другом, используем для этого свое расширение - у нас работает несколько команд, и есть выработанная методика и инструменты, которые позволяют им не мешать друг другу - мы используем много различных стендов для тестирования, готовы рассказать по какому принципу и как мы их поднимаем - ну, и конечно, про оптимизацию, поиск узких мест и ситуаций, с которыми нам приходится сталкиваться при нагрузках
ВИДЕО
-
Marco Slot Citus Data Главный инженер-программист
Ускоряясь до миллиона записей в секунду: масштабирование PostgreSQL с помощью Citus MX
Инструмент Citus позволяет распределять таблицы PostgreSQL между несколькими серверами. Расширяя возможности PostgreSQL в плане делегирования и распараллеливания задач между группой рабочих узлов, Citus позволяет горизонтально масштабировать CPU-ресурсы и память для выполнения запросов.
Год назад мы ступили на долгий путь реализации в Citus возможности горизонтального масштабирования в новом измерении - для повышения скорости записи. Так как все запросы на запись обрабатывались через один узел PostgreSQL, скорость записи в Citus ограничивалась CPU-ресурсами одного узла. Citus MX - это новая версия Citus, которая предоставляет доступ к распределенным таблицам с любого узла, обеспечивая повышение скорости записи до уровня NoSQL решений.