Аналитическое расширение, реализующее базовые алгоритмы машинного обучения в среде PostgreSQL
Традиционный подход к машинному обучению — выгрузка данных из SQL-базы в Python с последующей загрузкой результатов — порождает проблемы с безопасностью данных, задержками и усложнением инфраструктуры. Мы предлагаем иной путь: реализовать алгоритмы непосредственно внутри PostgreSQL на чистом PL/pgSQL, что позволяет производить вычисления там, где уже хранятся данные. В докладе мы расскажем о разработанном нами аналитическом пакете, закрывающем нишу, которую не занимают существующие решения: это работа с чувствительными данными, быстрое прототипирование без прав суперпользователя и встраивание ML непосредственно в логику работы приложения. Вы узнаете, как устроены реализованные нами алгоритмы (линейная и полиномиальная регрессия, KNN и градиентный спуск), увидите результаты тестирования производительности и познакомитесь с нашими планами по развитию проекта.