概要
ハイテクブームの最盛期には、ビッグデータコンピューティングの機会はデータサイエンティストの夢のように思われていました。しかし、不十分なツールと複雑なシステムにより、ビッグデータはすぐにITの悪夢となりました。テラデータは、規模に応じて継続的に答えを提供するソリューションで業界に参入しました。
ビッグデータの起源と、それをビジネスに最大限に活用する方法についてご紹介します。
概要
ハイテクブームの最盛期には、ビッグデータコンピューティングの機会はデータサイエンティストの夢のように思われていました。しかし、不十分なツールと複雑なシステムにより、ビッグデータはすぐにITの悪夢となりました。テラデータは、規模に応じて継続的に答えを提供するソリューションで業界に参入しました。
「ビッグデータ」という言葉が最初に登場したのは、インターネットの普及とデータ処理、ストレージ能力の向上に伴い、ハイテクブームが到来した頃でした。 コンピューターサイエンティストたちは、「検索エンジンが私たちの情報へのアクセス方法を一変させたように、他の形態のビッグデータコンピューティングは、企業、科学研究者、医療従事者、そして国防や諜報活動を一変させる可能性があり、今後もそうなるだろう。ビッグデータコンピューティングは、おそらく過去10年間のコンピューティングにおける最大のイノベーションである。」と述べています。
ビッグデータは、企業のすべてのデータをかつてない規模で収集し、保存できることが期待されていました。企業は、これまで捨てていたデータを保存することで、顧客の行動をよりよく理解し、市場や環境の結果を予測したりすることができます。 アナリストたちは、 ビッグデータが総売上高で500億ドル以上を生み出すと予測していました。
しかし、大量のデータをバッチ処理したり、ETL (抽出、変換、格納)を実行したりするためにApache Hadoopなどのプラットフォームを導入したところ、問題が発生しました。 Hadoopのようなツールは、日々の業務に必要な従来のアナリティクスを十分にサポートしていませんでした。このストレージと管理のギャップを埋め、リアルタイム、地理的空間、その他アナリティクスのユースケースに対応するアジャイルなプラットフォームを提供するSQLデータベースやオブジェクトストレージのプロバイダーは現れませんでした。ある専門家が書いているように、「Hadoopはデータウェアハウスを真に置き換えるほど高速にはならなかった」のです。
もう一つの課題は、モバイルやモノのインターネット(IoT)の台頭により、企業はより多様なデータソースをサポートしなければならなくなりました。すぐにビッグデータは当然の結果となり、ビジネスリーダーたちは、クラウド間やソース間を超えたデータの文脈や状況を理解するために、アナリティクスやプラットフォームに柔軟性を求めるようになりました。IT部門のリーダーは、大量のデータを収集、保存するとともに、データ分析、統合、複製をより機敏かつ迅速に行うことができるアプリケーション、プラットフォーム、クラウドインフラベンダーを探していました。
ビッグデータ処理に対する需要に応えることは、デラデータ創業の重要な理念でした。実際、テラデータの社名は、テラバイトのデータを管理する能力に由来しています。(現在では何ペタバイトものデータ管理ができるようになりました。)当時は、大量のデータを保存、分析するには、当時のハードウェアでは限界がありました。テラデータは、エンタープライズ・アナリティクスを可能にする大規模なデータを効率的に管理するためにTeradata Databaseを開発し、技術的な問題を解決するとともに、リレーションシップ・モデルでデータを統合することの威力を実証しました。
今日、データウェアハウスでは1日に数千万回のクエリが実行され、ミッションクリティカルな業務を支えているため、多くの企業がビッグデータの保護に力を入れています。企業は、データサイエンティストやビジネスアナリストがシームレスにレポートを実行したりインサイトを得たりすることができるように、アクセスを制限することがよくあります。そのため、ユーザーは自分のツールを使って独自の回避策を作り、アナリティクスのサイロ化を招いてしまうことが多いのです。
ビッグデータ分析を統合するために、Teradata Vantageはデータ環境内で分析エンジンの種類を拡張し、さまざまなユースケースでの使用を可能にします。機能を常に複製するのではなく、Vantageはそれらを論理的に中心となるアーキテクチャにまとめ、必要に応じて呼び出すことができます。テラデータは、SQL分析エンジンだけでなく、機械学習エンジンやグラフエンジンを含むように拡張しました。あらゆるタイプのプログラマーが、必要なエンジンや機能を参照できるようになり、時間とデータの移動を最小限に抑え、一貫性とパフォーマンスを向上させることができます。
また、Vantageは、エンジンへのより多様なデータセットへのアクセスを可能にし、データストレージ環境間の必要な接続性を提供しています。これにより、多くのグループによって繰り返し使用され、構造や厳格なガバナンスを必要とするデータから、構造が不明または可変で、限られたユーザーがアクセスするために迅速に保存する必要があるデータまで、さまざまなデータニーズに対応します。
最後に、データサイエンスにおいてユーザーが使えるツールを限定することの弊害を理解しているため、プログラマーが任意のツールを使用できるように、ツールと言語を抽象化しました。これにより、より多くのユーザーがアナリティクスにアクセスできるようになり、より多くのインサイトをより早く、より低コストで得ることができます。
ビッグデータは何十年もの間、デジタルテクノロジーにおいて重要な役割を果たしてきました。しかし、ビッグデータの魅力はその大きさだけではありません。ビッグデータの力は、より多くの人が正しい答えをより早く見つけられるようにする能力にあります。テラデータは創業当初から、ビッグデータ技術の統合に取り組んできました。それは、ビジネスへの理解を深め、実用的な洞察を得るための鍵となることを知っていたからです。今日、私たちはVantageで伝統を引き継いでおり、ビッグデータ分析を統合することで、企業がより早く答えを見つけ、ビジネスの成功に向けてアジリティを維持できるようにしています。