Facebook Presto

Продукт
Разработчики: Meta Platforms
Дата премьеры системы: 2013/01/15
Дата последнего релиза: 2015/12/12
Технологии: СУБД

Presto - распределенная СУБД. Реализована на Java.

Система поддерживает стандартный язык запросов SQL и допускает создание кластеров из сотен узлов, обрабатывая на них петабайты данных.

Архитектура Presto словами одного из разработчиков[1]:

«Клиент отправляет SQL координатору Presto. Координатор разбирает запрос, анализирует его, а затем планирует исполнение запроса. Диспетчер соединяет конвейер исполнения, даёт поручения узлам, которые расположены ближе всего к данным, и следит за продвижением обработки. Клиент извлекает данные из внешней ступени, которая, в свою очередь, заимствует их с ещё более низких уровней».

Архитектура Presto, 2014

Система способна компилировать в байт-код Java запросы SQL и делает это так, чтобы избежать проблем с выделением памяти и сборкой мусора. На этом превращения запроса на заканчиваются: виртуальная машина, исполняющая байт-код, «на лету» компилирует его в машинный код. В результате он выполняется ещё быстрее.Как с помощью EvaProject и EvaWiki построить прозрачную бесшовную среду для успешной работы крупного холдинга 2.3 т

В начале 2013 года первые версии системы внедрили в Facebook. Весной 2013 года соцсеть начала полномасштабный переход на Presto. На 7 июля 2015 года система работает на нескольких гигантских кластерах (количество узлов в одном из них может достигать тысячи), ежедневно исполняя более 30 тысяч запросов к петабайту информации.

Исходные коды Presto опубликованы на сервисе Github - репозиторий.

Система доступна по лицензии Apache.

2016: Teradata активно поддержала проект Presto

30 июня 2016 года корпорация Teradata сообщила о сертификации нескольких решений для бизнес-аналитики и визуализации данных в распределенной СУБД Presto.

К этим решениям относятся Information Builders, Looker Data Platform, платформа визуальной аналитики Qlik, набор аналитических инструментов Tableau и ZoomData. Компания MicroStrategy обязалась выполнить сертификацию и завершает тестирование приложения Microsoft Power BI.

Несколько сертификаций предоставляют заказчикам большие возможности выбора и способствуют эффективному использованию профессиональных навыков и инвестиций в инструменты бизнес-аналитики, чтобы анализировать данные в Hadoop.

«
Сертификация приложений бизнес-аналитики и аналитических приложений для использования с распределенной СУБД Presto, поддерживаемой Teradata, является важным начинанием в отрасли. Это весьма своевременный шаг, учитывая многие проблемы, с которыми в настоящее время сталкиваются компании при развертывании и использовании платформы Hadoop. В то время, когда технология Presto, благодаря корпорации Teradata, стала решением по выполнению SQL-запросов на Hadoop в корпоративном секторе, интеграция с инструментами бизнес-аналитики добавит необходимые функциональные возможности для эффективного использования в рамках организации. Независимо от предпочитаемого компанией поставщика приложений бизнес-аналитики и аналитических приложений, положительный результат заключается в появлении эффективного механизма выполнения аналитических запросов, который открывает новую яркую страницу в области визуальной аналитики для всех пользователей Hadoop.

Клаудиа Имхофф (Claudia Imhoff), ведущий консультант по бизнес-аналитике и хранилищам данных, основатель фонда Boulder BI Brain Trust
»

На июнь 2016 года Presto позволяет отправлять запросы в разные файловые системы, поддерживаемые платформой Hadoop, включая HDFS, Amazon S3, Cassandra, реляционные базы данных и даже корпоративные хранилища данных – и подходит для аналитиков данных, запросы которых требуют отклика в пределах секунд или минуты.

Объединение распределенной СУБД Presto, поддерживаемой Teradata, с несколькими инструментами бизнес-аналитики означает, что компании могут разрабатывать приложения и отчеты бизнес-аналитики на платформах, используя распределенную СУБД Presto, драйверы ODBC и JDBC для Presto от Teradata. Такая интеграция помогает обеспечить быструю разработку приложений и важнейшие данные по результатам анализа клиентом интенсивности событий, анализа оттока клиентов, анализа информации от датчиков для визуализации Интернета вещей и многое другое. В результате, компании могут быстрее создавать для себя новые возможности, эффективно используя имеющиеся инвестиционные ресурсы в основанные на SQL приложения для бизнес-аналитики и Hadoop.

Примечания



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  SAP CIS (САП СНГ) (38)
  Softline (Софтлайн) (35)
  РДТЕХ (33)
  BeringPro (БерингПойнт) ранее BearingPoint Russia (28)
  ФОРС - Центр разработки (25)
  Другие (732)

  Сапиенс солюшнс (Sapiens solutions) (7)
  BeringPro (БерингПойнт) ранее BearingPoint Russia (3)
  Navicon (Навикон) (3)
  Крок (2)
  Softline (Софтлайн) (2)
  Другие (35)

  Атомдата (Atomdata) (1)
  Группа Борлас (Borlas) (1)
  Диасофт (Diasoft) (1)
  КРИТ (KRIT) (1)
  Корус Консалтинг (1)
  Другие (20)

  Arenadata (Аренадата Софтвер) (5)
  Тантор Лабс (Tantor Labs) (3)
  ФОРС - Центр разработки (2)
  Документум Системс (1)
  ЗащитаИнфоТранс ФГУП (1)
  Другие (18)

  Arenadata (Аренадата Софтвер) (5)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (2)
  Гринатом (Greenatom) (1)
  Диасофт (Diasoft) (1)
  НПП СпецТек (Spectec) (1)
  Другие (16)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Oracle (44, 179)
  SAP SE (6, 178)
  Microsoft (23, 142)
  PostgreSQL Global Development Group (14, 126)
  Постгрес профессиональный (ППГ, Postgres Professional) (6, 40)
  Другие (263, 242)

  SAP SE (3, 11)
  Microsoft (3, 11)
  PostgreSQL Global Development Group (3, 10)
  Oracle (2, 4)
  Постгрес профессиональный (ППГ, Postgres Professional) (2, 3)
  Другие (10, 13)

  PostgreSQL Global Development Group (4, 9)
  Постгрес профессиональный (ППГ, Postgres Professional) (2, 6)
  VK Tech (ранее VK Цифровые технологии, ВК Цифровые технологии и Mail.ru Цифровые технологии) (2, 3)
  Arenadata (Аренадата Софтвер) (3, 2)
  Apache Software Foundation (ASF) (2, 2)
  Другие (9, 9)

  PostgreSQL Global Development Group (3, 13)
  Постгрес профессиональный (ППГ, Postgres Professional) (1, 6)
  Arenadata (Аренадата Софтвер) (3, 5)
  Apache Software Foundation (ASF) (3, 4)
  Тантор Лабс (Tantor Labs) (2, 3)
  Другие (8, 10)

  PostgreSQL Global Development Group (4, 11)
  Arenadata (Аренадата Софтвер) (3, 6)
  VMware (2, 6)
  Постгрес профессиональный (ППГ, Postgres Professional) (2, 5)
  Сбербанк-Технологии (СберТех) (2, 2)
  Другие (5, 7)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Oracle Database - 106
  Microsoft SQL Server - 104
  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 103
  PostgreSQL СУБД - 80
  SAP HANA (High Performance Analytic Appliance) - 72
  Другие 374

  Microsoft SQL Server - 9
  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 8
  PostgreSQL СУБД - 7
  Oracle Database - 3
  SAP HANA (High Performance Analytic Appliance) - 3
  Другие 21

  Postgres Pro СУБД - 5
  ADB - Arenadata DB - 2
  PostgreSQL СУБД - 2
  Tarantool Платформа in‑memory вычислений - 2
  Oracle Database - 2
  Другие 13

  Postgres Pro СУБД - 6
  PostgreSQL СУБД - 4
  Tantor СУБД - 3
  ADB - Arenadata DB - 3
  ClickHouse - система управления базами данных (СУБД) - 2
  Другие 10

  PostgreSQL СУБД - 5
  ADB - Arenadata DB - 5
  Postgres Pro СУБД - 3
  Diasoft Digital Q.Database - 2
  ADH - Arenadata Hadoop - 2
  Другие 9