AI および HPC データセンター
フォールトトレラントソリューション
内蔵メモリ
DCには長年使用してきたアベイラビリティ・レベルのセットがありますが、世に出回っているほとんどのテクノロジーは非常に幅広いAL3カテゴリに分類されるため、そのレベルは少し広いようです。
そのため、Stratus 何十年にもわたって、信頼性の高いコンピューティングインフラストラクチャのリーダーであり続けてきました。ただし、多くのテクノロジー用語と同様に、高可用性 (HA) の定義は非常に広いです。昨年、高く評価されているあるアナリスト企業による調査では、調査対象者の大多数は、高可用性とは災害復旧計画を立てることを意味すると考えているとのことでした。また、さまざまなコンピューティングプラットフォームの歴史を持つ人々と話すと、定義が変わることもわかりました(つまり、メインフレームと開発/運用では、この見方が大きく異なります)。IDCには、長年使用してきた一連の可用性レベルがありますが、世に出回っているほとんどのテクノロジーは非常に幅広いAL3カテゴリに分類されるため、少し幅が広いようです。
では、高可用性とは何でしょうか。エンドユーザーへの影響別にまとめた定義は次のとおりです。
無防備 — これはかなりわかりやすいでしょう。これは、アプリケーション、ハイパーバイザー、インフラストラクチャのいずれにも特別な信頼性機能が実装されていないワークロードです。下がれば下がります。
バックアップ — これは、別のノードまたはデータセンターに定期的にコピー (またはスナップショット) されるワークロードです。これは優れたコンプライアンス対策であり、回復に役立ちます(数時間以上かかる場合)
ディザスタリカバリ — これは、重大な障害(人為的ミスや天候によるデータセンターの重大な障害など)が発生した場合に、より迅速に復旧できるように自動化された、より堅牢なバックアップ形式です。
自動化された高可用性 — これは仮想化された世界では非常に一般的です。障害が発生すると、ワークロードの新しいインスタンスが新しいノードまたはデータセンターに再デプロイされます。これの一般的な実装は、VMware の HA 機能です。この機能によるインフラストラクチャへの影響は最小限ですが、ユーザーの中断がかなり大きく、処理中のデータはすべて失われます。これは、ウェブサーバーのような負荷分散されたスケールアウトアプリケーションに適したソリューションです。
インスタント高可用性 — ベアメタルの世界ではクラスタ、仮想環境では冗長インスタンスと複製されたストレージの世界です。サービスの中断は最小限です (場合によっては 1 秒未満になることもあります)。ただし、機内のデータやトランザクションはすべて失われます。アプリケーションがステートレスだが負荷分散されていない場合、これは優れたソリューションです。
フォールトトレランス — これは、かつてメインフレームとミニコンピューターの世界でしか知られていなかった機能です。しかし、Stratus、市販のオペレーティングシステムやハイパーバイザーにこのレベルの保護を提供するハードウェア、ソフトウェア、クラウドソリューションを、より低い保護レベルに匹敵する価格で製造しています。フォールトトレランスとは、処理中のデータとアプリケーションの状態も共有するワークロードの完全な冗長性です。つまり、障害が発生した場合でも、継続的かつ中断のない運用が可能です。
マルチサイトフォールトトレランス — これは、ワークロードが得ることができる最高レベルの保護です。フォールトトレランスを提供するため、状態やデータが失われることはありませんが、冗長ワークロードは異なるサイトでホストされます。当然、このタイプのソリューションにはネットワークコストが高くなりますが、最高レベルのソリューションで十分な場合は、これが最適です。
これにより、得られるあらゆる種類の保護の謎を解くのに役立つことを願っています。必要なものを評価する際には、具体的に何が保護されているかだけでなく、リカバリ時間とインフラストラクチャのコスト(主に処理とネットワーク)も考慮してください。
Stratus 空き状況について詳しく知りたいですか?下のリンクをクリックしてください!
Penguinのチームは、高性能で可用性の高いHPCおよびAI エンタープライズソリューションの設計、構築、導入、管理を行い、お客様が画期的なイノベーションを実現できるよう支援しています。
今すぐお問い合わせいただき、インフラストラクチャソリューションプロジェクトのニーズについてご相談ください。