データマートとは

データウェアハウスのサブセット

データマートはデータウェアハウス論理モデルのサブジェクト指向のスライスであり、狭いグループのユーザーにサービスを提供します。 多くの場合、データウェアハウスの完全なテーブルからのデータのサブセットのみを必要とします。 たとえば、マートには販売取引、製品、在庫記録しかない場合があります。 ほとんどの場合、4,000ではなく5〜20のテーブルしかありません。

データウェアハウスのサブセット

データマートはデータウェアハウス論理モデルのサブジェクト指向のスライスであり、狭いグループのユーザーにサービスを提供します。 多くの場合、データウェアハウスの完全なテーブルからのデータのサブセットのみを必要とします。 たとえば、マートには販売取引、製品、在庫記録しかない場合があります。 ほとんどの場合、4,000ではなく5〜20のテーブルしかありません。

スタースキーマ
データマートとスタースキーマは密接に関連しています。 5つのスプレッドシートに含まれるデータの行と列を想像してみてください。 4つのスプレッドシートは、ファクトテーブルと呼ばれる最大のシートに一致するキーフィールドを介して接続されています。 ファクトテーブルが5,000万レコードであり、実際にはスプレッドシートに収まらないため、データマートテーブルに格納されているとします。 このスタースキーマデザインでは、ほとんどのテーブルに5〜10個のテーブルがあり、スターの腕の部分の小さなテーブルはディメンションテーブルと呼ばれます。 

スノーフレークスキーマ
ディメンションは、重要な情報が記載された小さなテーブルです。 ファクトテーブルは、データの大部分(おそらく数十億件のレコード)が格納される場所であり、顧客テーブルに結合して実際の顧客名と住所のフィールドを取得できます。 バリエーションであるスノーフレークスキーマには、キーフィールドによってリンクされた複数のファクトテーブルがあります。 各ファクトテーブルには、4つまたは5つのディメンションテーブルしかありません。テーブルと関係のセットの図はスノーフレークに似ていますが、それでもデータマートです。 

データマートとデータウェアハウスはどのように異なりますか?

データマートとデータウェアハウスの違いは、データベースのサイズではなく、スキーマの複雑さによって分離されたサブジェクト領域と統合に関するものです。 そのため、すべてのデータがウェアハウス内にあるため、データマートよりもデータウェアハウスの方が100倍洗練された質問をすることができます。

データウェアハウスには多くの「パズルのピース」があり、すべての統合テーブルはサブジェクト領域にグループ化されています。 データウェアハウスは巨大である必要はありません。わずか5テラバイトのストレージにすることができます。 または、数百テラバイトのレコードが含まれる場合もあります。 別の方法は、3つの巨大なテーブルをデータマートに保存することです。

データの読み込み
データ統合のためのツール、データを保持するためのデータベース、データを分析するためのツールも不足していません。 少量のデータをレポートまたはダッシュボードのビジネスインテリジェンス(BI)ツールに移動することは、労力を必要としません。 実際のコストは、データの移動と変換にあります。

データの移動
統合ステップは、労力と計算処理の点で集中的ですが、他の手段では、ビジネスユーザーに壊れた、不完全な、または不正確なデータが提供されます。これにより、ユーザーは再びスプレッドシートを使用するようになります。 そのため、データウェアハウスのデータは価値があり、データマートの急増にはリスクが伴います。

Teradataデータマートソリューション

Teradata Vantageは、パーベイシブデータインテリジェンスのためのプラットフォームです。 そのクラウドフレンドリーなアーキテクチャは、企業のデータがどこに存在するかに関係なく、100%利用できるように設計されています。 Teradataサービスチームは、企業が保有するデータから必要な回答を得ることができるように支援することに精通しています。

Cloud Analytics - AWS Amazon Web Services

Teradata VantageでAWSインフラストラクチャを使用する

Cloud Analytics - Microsoft Azure Microsoft Azure

AzureリソースをTeradata Vantageと組み合わせる

無駄なボトルネックや複雑さから脱却し、分析をクラウドに移行する