AI および HPC データセンター
フォールトトレラントソリューション
内蔵メモリ
組織と、そのアクセシビリティに依存する顧客をどのように保護していますか?アベイラビリティ・ソリューション・ベンダーと提携する場合、どのシステムがリカバリ時間が最も短いのかを判断することが重要です。または、サーバーがダウンしたときに、顧客が車がクラッシュしたことに気付かないようにするシステムを用意するのが一番です。
サーバーの停止は必ず起こり、それは私たち全員にも起こります。そうではないと信じることは、エアバッグのない車を運転することと同じです。なぜなら、メーカーは車が決して衝突しないと約束したからです。
2017 年、信頼できるアマゾンウェブサービス (AWS) は 4 時間の停電 これは、バックエンドプロバイダーとしてAWSを使用するすべてのビジネスに影響を与えました。4時間というのは、これほど巨大なシステムを復元するにはそれほど長い時間ではないように思えるかもしれません。しかし、24時間365日サイトにアクセスしているNetflixのようなAWSのお客様にとって、この4時間は非常に高額な4時間でした。
では、組織と、そのアクセシビリティに依存している顧客をどのように保護するのでしょうか。アベイラビリティ・ソリューション・ベンダーと提携する場合、どのシステムがリカバリ時間が最も短いのかを判断することが重要です。または、サーバーがダウンしたときに、顧客が車がクラッシュしたことに気付かないようにするシステムを用意するのが一番です。
ダウンタイム防止バイヤーズガイド では、ダウンタイムを防ぐために検討すべき 6 つの質問 (サーバー障害を含む) について説明します。このガイドでは、「サーバーに障害が発生した場合、アプリケーションを通常の処理動作に戻すにはどのようなプロセスが必要で、どれくらいの時間がかかりますか?」などの質問をすることを推奨しています。このガイドでは、特定のシステムで予想されるさまざまなレベルのダウンタイムについても比較しています。
「スタンドアロンサーバーを使用している場合、定期的にシステムをバックアップしていれば、バックアップからアプリケーションとデータを復元するには高度な人的操作が必要なため、復旧時間は数分から数日に及ぶ可能性があります。
高可用性クラスターでは、サーバーが停止すると処理が中断され、可用性が回復した後のファイルの整合性の確認、データベースのロールバック、トランザクションログの再生にかかる時間に応じて、復旧に数分から数時間かかる場合があります。初期の計画段階でクラスターのサイズが正しく設定されていれば、障害のあるサーバーが稼働していないときにアプリケーションのパフォーマンスが低下することはないはずです。ただし、通常の処理が再開されたら、ジャーナルファイルを使用して一部のトランザクションを再実行する必要がある場合があります。
フォールトトレラントソリューションは、コンポーネントを完全に複製して単一障害点を排除することで、ダウンタイムをプロアクティブに防止します。一部のプラットフォームは、複製されたコンポーネントを自動的に管理し、すべての処理をロックステップで実行します。
複製されたコンポーネントは同じ命令を同時に実行するため、コンポーネントに障害が発生しても処理が中断されることはありません。つまり、スタンドアロンサーバーや高可用性クラスターとは異なり、フォールトトレラントソリューションは問題が解決されている間も機能し続けます。」
全体をダウンロード ダウンタイム防止バイヤーズガイド そして、ダウンタイムを防ぐために尋ねるべき残りの5つの質問を見つけてください。
Penguinのチームは、高性能で可用性の高いHPCおよびAI エンタープライズソリューションの設計、構築、導入、管理を行い、お客様が画期的なイノベーションを実現できるよう支援しています。
今すぐお問い合わせいただき、インフラストラクチャソリューションプロジェクトのニーズについてご相談ください。