Использование Postgres для дедупликации музыкальных треков

Андрей Аносов

Mail.Ru Group

программист

Николай Шуляковский

Mail.ru

Заместитель технического директора

В музыкальном сервисе Mail.ru мы используем публичную базу данных MusicBrainz, которая сделана на PostgreSQL. В докладе:

  • Попытка использовать Postgres для дедупликации музыкальных треков. Использование Gist/Gin индексов для этой задачи.
  • Использование массивов, использование обратной таблицы и обычных деревянных индексов.
  • Какие проблемы преследовали, попытки их решить.