概要
2020年に同時実行性を最適化するための3つの必須事項
企業が大規模な同時実行データ処理を実現する上で影響を与える3つの要因をご紹介します。
同時実行とは
ユーザーが同時にデータにアクセスしたり、データを操作したり、データに変更を加えたりすることを「同時実行」または同時実行データ処理といいます。従来のデータウェアハウスやクラウドベースのデータウェアハウスを使用している企業にとって、複数のソースからのデータを統合し、リアルタイムにビジネスインテリジェンスを得るためには、この機能が不可欠です。
しかし、ユーザー数やクエリ数を増やす必要がある企業にとって、これらの環境を効果的に管理することは困難です。テラデータのシニア・テクノロジストであるRob Armstrong(ロブ・アームストロング)はこれを「百万件の問題」と呼んでいます。10人のユーザーが10個の行やテーブルを含む10個のクエリを実行している場合、管理は難しくないかもしれませんが、数千人または数百万人にスケールアップすると、人間が管理するのが不可能な環境になります。
部門単位のポイントソリューションから、大規模なオペレーションと実稼働システムに移行するには、同時実行性をきめ細かく調整する必要があります。このレベルの同時実行性を効果的に実行するには、次の3つの重要な要素が必要です。
1. 個々のクエリの最適化
最適化されたクエリを作成するために必要なルールやツールのすべてをユーザーが理解できるとは限らないため、複雑なデータの関係や意図を理解して活用できるプログラムが必要です。
2. 多様なワークロードの管理
すべてのクエリが同じ重要性を持つわけではありません。効果的なワークロード管理では、厳しいサービスレベルを満たす必要のあるWebアクセスクエリと、ランタイムをあまり気にする必要のない長時間稼働のクエリを区別します。
3. システム全体の監視
環境全体を単一のシステムとして円滑に稼働させるためには、メッセージトラフィックの監視、エラー復旧、スペースの管理、継続性の確保、フェールオーバーの削減などが必要です。
同時実行が重要な理由
今日のデジタル化された世界では、様々な業界の企業は、人、製品、機械から生成される絶え間ないデータの流れを、毎秒ごとに効果的に管理、分析しなければなりません。このような大量の情報からインテリジェンスを得るためには、企業は、安全で、オープンで、アクセス可能なリアルタイムのデータレポジトリを作成し、企業全体のユーザーが利用できるようにする必要があります。様々な役割を担う人々がそれぞれの専門性や視点を持ってデータを活用することで、企業全体でイノベーションを起こすことができ、それによってより早く答えを導き出すことができます。
このレベルのコラボレーションをサポートするには、同時実行性が不可欠です。あらゆるユーザーのデータセットに対するクエリが、他のユーザーのクエリに影響を与え、遅延時間が長くなったり、データの整合性が損なわれたりする可能性があるとしたら、組織全体のユーザーは、分析インフラの正確性と信頼性を信用できなくなります。場合によっては、企業内の個人やチームが、遅いプロセスを回避するために独自のデータマートを作成することもあります。その結果、部門やチームごとに独自のバージョンのデータセットが存在するという環境が生まれてしまう可能性があります。
同時実行により、誰もが他のユーザーに悪影響を与えることなく、同じリアルタイムデータを使って作業することができます。これにより、イノベーションを滞りなく進めることができ、ユーザーは、使用されているデータが正確であることを完全に確信することができます。
テラデータの同時実行性に対する考え方
テラデータでは、今日の競争の激しいビジネス環境で生き残り、成功するためには、企業はすべてのデータを常時管理し、重要な分析を活用できる能力があることが必要だと考えています。同時実行性は、最高のアナリティクス機能とエンジンを大規模に提供する、統合されたアナリティクス環境の重要な一部です。
Teradata Vantage は、「百万の同時実行問題」という問題を解決し、お客様のビジネスをインサイトから生産性へと移行させ、収益を向上させます。最先端のハイブリッドクラウドデータ分析ソフトウェアであるVantageは、データを100%活用し、いつでもどこでも、何でも分析することができます。Vantageは分析ワークロードに最適な最適化プログラムを備えたTeradataデータベースに基づいて構築され、世界クラスのワークロード管理機能を備え、マルチシステムエコシステムを簡素化し自動化するための一連のツールを提供します。