概要
市場ではビッグデータ技術が拡大していますが、多くの企業は正しい答えを見つけるのに苦労しています。では、何から始めればよいのでしょうか?統合された、低コストでスケーラブルなビッグデータ環境を構築するためには何が必要なのかをご紹介します。
ビッグデータをどのように機能させるのかという疑問を抱く企業にとって考慮すべき重要な要素について、私たちは考えを共有しています。
概要
市場ではビッグデータ技術が拡大していますが、多くの企業は正しい答えを見つけるのに苦労しています。では、何から始めればよいのでしょうか?統合された、低コストでスケーラブルなビッグデータ環境を構築するためには何が必要なのかをご紹介します。
ビッグデータに本格的に取り組み、ビジネスケースを定義し、「サイエンスプロジェクト」の段階を超えて成熟する準備ができている企業でも、「ビッグデータをどのように活用するか」という困難な問題に直面しています。
誇大宣伝と、ビッグデータテクノロジーの選択肢やベンダーが錯綜しているため、正しい答えを見つけることが必要以上に難しくなっています。目標は、低コストで複雑さの少ない、基盤となる ビッグデータ環境 を設計、構築することです。それは、安定性、高度な統合性、拡張性を備え、組織全体を真のデータとアナリティクス中心に導くことができるのです。
データ・アナリティクス・セントリシティとは、ビッグデータと ビッグデータアナリティクスのパワーを、それを必要とする組織のすべての部分で利用できる状態を指します。基盤となるインフラ、データストリーム、ユーザーツールセットを利用することで、価値のあるインサイトを発見し、より良い意思決定を行い、実際のビジネス上の問題を解決することができます。それがビッグデータのあるべき姿なのです。
どこから手をつけたらいいのか悩んでいませんか?ビッグデータをエンジンに例えてみましょう。パフォーマンスを向上させるには、適切なコンポーネントをシームレスに、安定的に、継続的に組み立てることが必要です。これらのコンポーネントには、次のものがあります。
このレベルでは、ビッグデータ資産を最大限に活用して、実際にビジネス価値を生み出すことが求められます。そのためには戦略的なビッグデータの設計と、現在のデータストリームやリポジトリを調査するだけでなく、特定のビジネス目標や長期的な市場トレンドを考慮した、考え抜かれたビッグデータアーキテクチャ が必要です。言い換えれば、ビッグデータを活用するための唯一のテンプレートは存在しないということです。ここではCOTSについて話しているのではありません。
ビッグデータの重要性が今後さらに高まることを考えると、これらのインフラは将来のオペレーションの基盤となるものと考えられます。そのため、確かに設備投資には多額の費用がかかるかもしれません。しかし、多くの先進的な企業やビッグデータをいち早く導入した企業は、適切なビッグデータ環境を設計することで、実際にはコスト削減につながるという、意外な、そしてやや直観に反する結論に達しています。また、驚くべきことといえば、このコスト削減効果は驚くほど大きく、比較的早く達成できるということです。
ここで重要なのは、柔軟なフレームワークを導入することで、ビッグデータテクノロジーやプログラムが企業の複数の部分をサポートし、ビジネス全体のオペレーションを改善できるということです。そうでなければ、先進的で野心的なビッグデータプロジェクトであっても、迷走した投資になってしまう危険性があります。 Gartner 社は、ビッグデータプロジェクトの90%が企業全体で活用または複製されると推定しています。 明日のビッグデータの勝者は、その10%の中に入っていて、小さく考えるのをとっくにやめているのです。
Hadoopは、あらゆる種類のデータの保存を可能にするファイルシステムで、これまではデータのほとんどは使えるようにするのが難しく、コストもかかるため、廃棄されていたものがほとんどです。ビッグデータやHadoopの価値は、実際に役立ち可能性のあるデータをその場でモデリングし、既存のビッグデータや分析環境と統合することで、ビジネス上のインサイトを豊かにすることにあります。
再利用性の低さは、ほとんどの場合、統合性の低さに起因しています。実際、ビッグデータを成功させるための方程式の中で、統合はもっとも重要な要件かもしれません。
Forrester Research社は、ビッグデータの価値の80%は統合によってもたらされると述べています。 もっとも価値の高いビッグデータは、適切なユーザーが容易にアクセスでき、堅牢で明確に定義されたビジネスルールとガバナンス構造が必要であるというのが、大局的な考え方です。レガシーなトランザクションデータやロングテールの顧客履歴など、より深いデータセットは、信頼性の高いストレージと堅牢なデータ管理があれば、データサイエンティストやデータエクスプローラーが、必要に応じでレビューやモデリングを行うことができます。
ビッグデータの統合は、大きく考えることでもあります。この場合の「大きく」とは、全体的に、包括的に、多次元的に、という意味です。点と点をつなぎ、データの島々に橋をかけ、機能的なサイロを相互に接続しなければなりません(完全に破壊されていない限り)。
高度に統合されていること。うまく設計されたエコシステム。統一されたアーキテクチャ。データとアナリティクスの中心性。これらのリストは、ビッグデータプログラムを機能させるために、必ずしもすべてのコンポーネントや技術的な詳細を必要とするものではありません。しかし、これらはビッグデータプログラムを効果的に機能させるための違いを生み出す要素であることには間違いありません。