Presto(プレスト)とは、分析クエリ実行用分散型SQLクエリエンジンです。
Prestoは、ペタバイトクラスまでのあらゆるサイズのデータソースに対してインタラクティブな分析クエリを実行するためのオープンソースの分散型SQLクエリエンジンです。
そのアーキテクチャにより、ユーザーは「Hadoop」「AWS S3」「Alluxio」「MySQL」「Cassandra」「Kafka」「MongoDB」などのさまざまなデータソースにクエリを実行できます。
・2013年 初版リリース
「Facebook」では、Prestoを使用して、300PBのデータウェアハウスを含む複数の内部データストアに対するインタラクティブなクエリを実行しています。1日あたり、1000人を超えるFacebookスタッフが、合計1ペタバイトを超える合計30000件を超えるクエリを実行しています。
また、「Airbnb」や「Dropbox」を含む大手インターネット企業でもPrestoが採用されています。
→Presto(Distributed SQL Query Engine for Big Data)
Prestoのライセンスは「Apache License 2.0」です。
詳細について、こちらを参照ください。
→GitHub →prestodb/presto →LICENSE
Prestoは「Linux」または「Mac OS X」で動作します。
同様な機能を提供する製品として、次のようなものがあります。
オープンソース製品:「Apache Drill」など。
Prestoは、データウェアハウスまたは分析用に設計および最適化されているデータベースです。1秒~数分の応答時間を期待するアナリストを対象としています。
そのため、「MySQL」「PostgreSQL」「Oracle」などの汎用リレーショナルデータベースに代わるものではなく、オンライントランザクション処理を実行するようには設計されていません。
Prestoはクラスタ上で動作する分散システムです。
フルインストールには「コーディネーター」+「複数のワーカー」が含まれます。クエリはPresto CLIなどのクライアントからコーディネータに送信されます。コーディネーターが「照会」「解析」「分析」などを計画し、ワーカーに分配します。
Prestoは、分散照会を使用して膨大な量のデータを効率的に照会するように設計されたツールです。「Hive」「Cassandra」「各種リレーショナルデータベース」「独自データストア」など、さまざまな場所に存在するデータを照会できます。
1つのPrestoクエリで複数ソースからのデータを組み合わせることができ、組織全体の分析が可能になります。
多くのPresto用リソースが用意されています。
・Presto管理ツール
・Prestoクライアント
・PrestoODBC
・Prestoライブラリ
・Prestoホスティング
・Prestoコネクタ
・Prestoエンタープライズサポート
・PrestoCloud(AWS/Azure)
参考元サイト
※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。
OSS×Cloud ACCESS RANKING