概要
データガバナンスについて問うべき5つの質問
より多くのデータ処理が端に押し出されています。アジャイルイノベーションを推進するために知っておくべきことをご紹介します。
世界のつながりが増すにつれて、より多くのデータ処理が端に押し出されています。 Gartner社によると、2022 年までに、企業で生成されるデータの半分以上が、データセンターやクラウドの外部で作成、処理されるようになるとのことです。これはCOVID-19(新型コロナウイルス感染症)の発生以前に行われた予測であり、COVID-19の発生後は、ますますオフィス外でのリモート作業やモニタリングが加速しています。
データが多くの場所で生成され、プライバシーに関する規制がより厳しくなる中、データ保護と幅広いアクセスの両方のバランスを維持することはより複雑になっています。しかし、このように多様に普及しているすべてのテクノロジーに供給されるデータの完全性とセキュリティが確保されてこそ、イノベーションが進むのです。たとえば、最近、人工知能(AI)への投資が減少しているのは、これらのアルゴリズムに供給されるデータが信頼されていないためだと指摘する人もいます。優れたガバナンスは、AIやその他の高度なイノベーションに対する信頼を高めるための可視性と品質を提供します。
アジャイルなインフラをサポートするためにデータガバナンスのフレームワークを構築する場合、データを保護するだけでなく、アジャイルなイノベーションとコラボレーションのための文化を確立するために、適切な質問をする必要があります。ここでは、当社シニアアカウントエグゼクティブのMike Dampier(マイク・ダンピア)によって定義された、もっとも重要な質問をいくつかご紹介します。
1. 誰がデータをデプロイするのか
歴史的に見ても、データ保護とガバナンスは、技術者がビジネスユーザーに「自分たちの」データに責任を持つように促すことにより、意思決定者にとっては難しい話題でした。今日、このような議論はさらに複雑になっています。ビジネスチームは、複数のプラットフォーム上のデータを使ったイノベーションを求められており、IT部門とビジネス部門がデータのデプロイと管理の責任を共同で分担するようになっています。
しかし、IT部門とビジネス部門によってデプロイされるデータは、その系統や情報源、ライフサイクルが大きく異なる可能性があります。テラデータでは、アプリケーションソース、信頼できるデータ、トランザクションデータ、マスターデータなどのエンタープライズ データは、引き続きIT部門が所有し、デプロイすることをお勧めします。このデータを、外部のパブリックドメインデータ (天気予報) や購入したデータ (人口統計、心理統計) などの他のソースと統合するのは、ビジネスチームの仕事です(サンドボックス、レイク、その他の環境)。
誰がこれらのデータタイプを使用しているのか、どのくらいの頻度でアクセスしているのかを知ることは非常に重要です。Teradata Vantageは、このようなニーズを念頭に置いて開発されており、ユーザーのログインセッションやクエリを簡単に監視することができます。他のプラットフォームでは、この可視性を得るためには、完全に自動化されたものもあれば、ほとんどが手動で行われるものもあるなど、さまざまな監視方法を開発してデプロイする必要があります。
2. 誰が何を管理するか
この質問は難しい場合があります。もしデータを取り込んだグループがデータを管理すべきだと考えるなら、それは部分的には正しいでしょう。企業データに関連するビジネス関係のメタデータだけでなく、データの質の観点からのデータガバナンスのすべては、依然として企業が所有しています。しかし現在では、データを取り込む際のビジネスコンテキスト(ビジネスおよび技術的なメタデータ)のガバナンスも企業が所有し、必要に応じてエンタープライズデータと統合できるようになっています。
3. データをどこにデプロイするか
この質問をすると、活発な議論が展開されることでしょう。もしクラウドベンダーを探している場合には、こんな言葉を何度も耳にしたことがあるでしょうー「すべてのデータは当社で管理します」。テラデータでは、オンプレミスであれクラウドであれ、データの一部をデータレイクにデプロイすることをお勧めします。ただし、データの一部はサンドボックス、ラボ、データマートにも置いておくべきです。さらに、クリーンで精査された信頼できるデータは、データウェアハウスに置くべきです。
もっとも重要なことは、物理的な予測と仮想的な予測を可能にする高速ファブリックを介して、プラットフォームが相互に接続されていることです。IT部門は、このインフラをサポートするための適切なデータガバナンス フレームワークを設定する責任があります。集中管理されたスケーラブルなデータ仮想化テクノロジーを導入することで、複雑なデータ同期プロセスを構築することなく、実行時にデータを共有することができます。これは、特定の分析ユースケースでは実用的なビジネス価値があり、分析エコシステム内の標準機能として導入されるべきです。
4. データの定義に全員が同意しているか
ビジネスユーザーは、自分が必要とするデータがどこにあるのか、そしてそのデータが何を意味するのかを把握する必要があります。Jeff Burk(ジェフ・バーク)氏がDatanamiで述べているように、「利用可能なビジネスデータの量、種類、範囲は急激に増加しており、データを見つけ、理解し、信頼することがますます困難になってきている」ことがあります。バーク氏は、IT部門とビジネス部門が同じ言語で会話できるようなシステムを構築することを推奨しています。たとえば、管理データカタログは、データをビジネス用語に変換し、さまざまなデータセットを接続、関連付けることができます。
5. データガバナンスに専念している人材はいるか
政府機能と同様に、適切な技術やプロセスを設定しても、優れたリーダーシップが保証されているわけではありません。ガバナンスが実際に機能するかどうかを決めるのは、人材です。データガバナンスのフレームワークの一部として設定されたツールやプロセスは、人々がそれらを最新の状態に保つことで初めて機能します。
IT部門とビジネス部門の間のコミュニケーションは、あらゆる段階で重要です。IT部門がエンタープライズデータへの安全なアクセスとセルフサービスの分析を設定するとき、何が機能し、何が機能していないかについて率直に説明するのはビジネス部門の仕事です。ビジネス部門は、プロセスが構築された後、プロセスを管理するためのリソースとしてIT部門に頼ることができます。IT部門は、実用的で、自分でプロビジョニングでき、費用対効果の高い分析エコシステムを構築するために、新たなガバナンスの役割を担うことになるでしょう。
クラス最高のデータガバナンスを構築するために、これらの質問を検討する価値はあるでしょう。優れたガバナンスの成果は、データの保護と整合性にとどまらず、ビジネスの価値を高め、より多くの情報に基づいた戦略的意思決定を行い、より機敏で協力的な文化を生み出すことにつながります。