「Amazon Redshift」基本情報
概要
Amazon Redshiftとは、AWSが提供するクラウド型データウェアハウス(DWH)サービスです。大容量データを高速処理でき、費用対効果の高いデータウェアハウスを利用できます。
基本データ
プラットフォーム | AWS |
クラウドサービス名 | Amazon Redshift |
読み方 | アマゾン レッドシフト |
略称 | --- |
基本説明
Amazon Redshiftを利用すると、「標準SQL」および「既存のビジネスインテリジェンス(BI)ツール」を使用して、すべてのデータをシンプルかつコスト効率よく分析できます。
主な特徴
大容量データ処理
Amazon Redshiftは、1エクサバイトを超える大容量データに対応します。
高速処理
Amazon Redshiftでは、さまざまな革新的技術を駆使して、ペタバイト単位の構造化データに対して高速な分析クエリ性能を実現しています。
・高パフォーマンスのローカルディスク
・列指向ストレージテクノロジー(I/O効率向上)
・データ圧縮
・ゾーンマッピング
・クエリ最適化(SQL操作の並列化と分散化)
・超並列クエリ実行(複数ノード間でのクエリ並列化)
ほとんどの結果は数秒で返され、従来のデータベースよりも最大で10倍のパフォーマンスを達成します。
Amazon S3用クエリ実行機能「Redshift Spectrum」
「Redshift Spectrum」とは、「Amazon Redshift」から、「Amazon S3」のエクサバイト単位の非構造化データに対してSQLクエリを直接実行できる機能です。
ポイント
・ロードや変換は不要
・さまざまなオープンデータフォーマットに対応
・データセットのサイズに関係なく高速なクエリ実行が可能
・「Amazon S3」をデータレイクとして使用できる
スケーラブル
パフォーマンスや容量のニーズの変化に合わせて、コンソール/APIから、クラスタサイズを簡単に変更できます。
耐障害性
ノードに書き込まれたデータはすべてクラスタ内の別ノードへ自動的に複製され、全データは常時Amazon S3にバックアップされます。
クラスタ状態は常時モニタリングされており、障害があるドライブから自動的にデータを再度複製し、必要に応じてノードの交換が行われます。
セキュリティ
保管中/移動中/バックアップのデータについて、ハードウェアアクセラレーション対応の「AES-256」および「SSL」を使用して暗号化できます。
分析作業の自動化
Amazon Redshiftでは、「データウェアハウスの管理」「モニタリング」「スケーリング」など、一般的な管理作業の大半を簡単に自動化できます。
「PostgreSQL」準拠
Amazon Redshiftは、「PostgreSQL 8.0.2」に準拠しています。
PostgreSQL標準の「クライアントコマンド」「psql」を使用可能で、JDBCやODBCなどの接続もサポートしています。
コスト削減
従来のデータウェアハウス構築と比較すると、年間費用で10倍~1000倍近くのコストダウンも見込め、スモールスタートで始められるメリットもあります。
同様サービス
同様なサービスとして、次のようなものがあります。
Azure「SQL Data Warehouse」、Google Cloud Platform「BigQuery」など
オフィシャルサイト
オフィシャルサイト
→AWS →Amazon Redshift
料金情報
→AWS →Amazon Redshift →料金
導入事例
→AWS →Amazon Redshift →Customer Success
参考元サイト
- AWS →Amazon Redshift
- AWS →Amazon Redshift →Amazon Redshift のよくある質問
- フリーランスITエンジニア案件・求人 →Redshiftとは|5つの特徴と他のビッグデータ技術との比較
※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。