概要
統合データウェアハウス(IDW)によるイノベーション
組織の単一の情報源であることに加えて、統合データウェアハウス (IDW) が重要な理由をご紹介します。
今日のデジタル環境では、人、製品、モノからの情報が急速に流れ込んでくるため、データウェアハウスの重要な課題は、多種多様なデータを取り込み、組み合わせ、分析することです。これが統合データウェアハウス (IDW) の目的です。IDWは、詳細データと概要データを一元的に管理し、複数の主題や部門の領域を効果的に統合して、企業内の機能領域を360度見渡せるようにします。
データを統合する2つの方法
データを統合するシステムを構築する際、システムアーキテクトは、一般的に、データウェアハウス設計の先駆者であるWilliam Inmon(ウィリアム・インモン)氏とRalph Kimball(ラルフ・キンボール)氏が開発した2つの手法のうちのどちらかを採用することがほとんどです。
- Inmonまたは「トップダウン」アプローチでは 、顧客、製品、ベンダーなど、ビジネスを運営する対象領域とエンティティを特定します。主要なエンティティごとに詳細な論理モデルを作成し、すべてのデータを前もって統合して定義します。このモデルでは、データの読み込みはそれほど複雑ではありませんが、クエリの構造化は難しくなります。
- Kimballまたは「ボトムアップ」アプローチでは 、データウェアハウスが答えを求めている主要なビジネスプロセスと質問を特定し、これらのニーズを満たすためにデータマートを作成します。データはステージング領域に読み込まれますが、Inmonモデルのようにエンティティに緊密に結合されているわけではありません。
Inmonアプローチの主な強みは、データウェアハウスが単一の真実の情報源となり、すべてのデータが統合され、標準化される場所として機能することです。Kimballアプローチでは、クエリが作成される前にデータが完全に統合されていないため、このような一元的な標準化が行われません。しかし、Kimballアプローチでは、データウェアハウスを迅速に構築し、ビジネスアプリケーションに効果的に適用することができます。
テラデータでは「トップダウン」のアプローチを提唱しています。 この方法では、ユーザーは常にクエリの自由度を持ちます。ユーザーはいつでも、どんなデータに対しても質問をすることができます。データウェアハウスでは、そのデザイン上、根本的な問題の原因を理解するにあたり、次の質問に進むために、掘り下げて調べる必要があります。Kimballアプローチでは、重要な質問に答えられるようにするために、ユーザーは一旦戻って再設計する必要があり、結果的に特定の答えにたどり着くまでの時間が長くなってしまう可能性があります。
統合データウェアハウス (IDW) が重要な理由
多様なソースからの膨大な量のデータを広くアクセス可能な方法で統合することで、企業は次のことが可能になります。
部門を超えて情報を共有
別々のデータソースが一箇所に集まることで、企業内に存在するデータサイロを減らし、データの一貫性を確保することができます。
複数の視点を取り入れながら、ビジネスに重要な答えを迅速かつ正確に提供
意思決定者が適切な戦略的選択を行えるように、もっとも困難なビジネス上の質問に対する答えを効率的に得ることができます。
真実の単一バージョンを表示
組織内のすべてのユーザーが同じ情報に基づいて、ビジネスの状態に関する結論を導き出すことができます。このように誰もがアクセスできるようにすることで、より多くの市民データサイエンティストが付加価値を生み出すことができるため、IT部門への負担が軽減されます。
これらの機能により、データへのアクセス性に関する組織の文化を大きく変えることができます。適切に設計されたIDWは、ユーザーのデータへのアクセスを制限してイノベーションを妨げるのではなく、ユーザーのニーズに合った適切なフォーマットで安全にデータを利用できるようにします。これにより、分析を迅速かつ機敏に行えるようになり、ビジネスユーザーとデータサイエンティストが共に、ビジネスにとってもっとも重要な答えを導き出すことができます。
統合データウェアハウス (IDW) の進化
データウェアハウスのアイデアは1960年代から1970年代にかけて具体化しましたが、画期的だったのは1988年、 Barry Devlin(バリー・デブリン)氏とPaul Murphy(ポール・マーフィー)氏 が「企業内の様々な情報システム活動をまとめる」ことができる「企業データの統合ウェアハウス」の必要性について書いたことでした。
何十年もの間、コンピューターサイエンティストたちは、このような大規模なプラットフォームを構築するために最適な方法を懸命に研究してきました。1991年に発表された統合パブリックユースマイクロデータシリーズ(IPUMS)では、抽出、変換、格納(ETL)という手法を用いて、多様なソースからのデータを1つのシステムに統合し、データウェアハウスの有効性を実証しました。
しかし、インターネットの普及、スマートフォンの登場、クラウドコンピューティングの台頭などにより、データが爆発的に増加したため、常に更新されなければならないデータセットにETLを適用することは困難になりました。そこで登場したのが、データハブやデータレイクと呼ばれるアプローチで、緊密に結合されたリレーショナルデータプロセスを必要とせず、非構造化データをプールすることができます。
テラデータの視点
40年以上にわたり、テラデータはIDWの設計と開発の最前線に立ってきました。そして今日、テラデータは、Teradata Vantageにベストプラクティスを適用しながら、この分野での革新を続けています。
Teradata Vantageは、データの100%を活用していつでもどこでも何でも分析することができる、最先端のハイブリッド・クラウド・データ・アナリティクス・ソフトウェアです。IDWのパワーと独創性にクラウドの柔軟性と拡張性を兼ね備えたTeradata Vantageは、業界最高レベルのパフォーマンスを大規模に実現するために構築され、価格設定されています。現行のシステムとの統合も容易で、ユーザーのニーズや進化するテクノロジーを問わず、柔軟性とコントロールを提供します。