Presto(プレスト)とは、分析クエリ実行用分散型SQLクエリエンジンです。

オープンソースのデータベース/Prestoとは

Presto(プレスト)とは、分析クエリ実行用分散型SQLクエリエンジンです。

「Presto」基本情報

■概要

Presto(プレスト)とは、分析クエリ実行用分散型SQLクエリエンジンです。

■基本説明

Prestoは、ペタバイトクラスまでのあらゆるサイズのデータ​​ソースに対してインタラクティブな分析クエリを実行するためのオープンソースの分散型SQLクエリエンジンです。

そのアーキテクチャにより、ユーザーは「Hadoop」「AWS S3」「Alluxio」「MySQL」「Cassandra」「Kafka」「MongoDB」などのさまざまなデータソースにクエリを実行できます。

■経緯

・2013年 初版リリース

■導入事例

「Facebook」では、Prestoを使用して、300PBのデータウェアハウスを含む複数の内部データストアに対するインタラクティブなクエリを実行しています。1日あたり、1000人を超えるFacebookスタッフが、合計1ペタバイトを超える合計30000件を超えるクエリを実行しています。

また、「Airbnb」や「Dropbox」を含む大手インターネット企業でもPrestoが採用されています。

■オフィシャルサイト情報

オフィシャルサイト

→Presto(Distributed SQL Query Engine for Big Data)

ライセンス情報

Prestoのライセンスは「Apache License 2.0」です。

詳細について、こちらを参照ください。
→GitHub →prestodb/presto →LICENSE

ダウンロード

Prestoは「Linux」または「Mac OS X」で動作します。

→GitHub →prestodb/presto

■同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「Apache Drill」など。

「Presto」の主な特徴

■分析用データベース

Prestoは、データウェアハウスまたは分析用に設計および最適化されているデータベースです。1秒~数分の応答時間を期待するアナリストを対象としています。

そのため、「MySQL」「PostgreSQL」「Oracle」などの汎用リレーショナルデータベースに代わるものではなく、オンライントランザクション処理を実行するようには設計されていません。

■分散システム

Prestoはクラスタ上で動作する分散システムです。

フルインストールには「コーディネーター」+「複数のワーカー」が含まれます。クエリはPresto CLIなどのクライアントからコーディネータに送信されます。コーディネーターが「照会」「解析」「分析」などを計画し、ワーカーに分配します。

■組織全体の分析

Prestoは、分散照会を使用して膨大な量のデータを効率的に照会するように設計されたツールです。「Hive」「Cassandra」「各種リレーショナルデータベース」「独自データストア」など、さまざまな場所に存在するデータを照会できます。

1つのPrestoクエリで複数ソースからのデータを組み合わせることができ、組織全体の分析が可能になります。

■Prestoリソース

多くのPresto用リソースが用意されています。
・Presto管理ツール
・Prestoクライアント
・PrestoODBC
・Prestoライブラリ
・Prestoホスティング
・Prestoコネクタ
・Prestoエンタープライズサポート
・PrestoCloud(AWS/Azure)

→Presto →Resources

 

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

Presto最新TOPICS

最新情報はありません。

Presto最新CLOSEUPコラム

  • 勉強会
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter