4大規模なミス企業が処理停止を行う

LogicMonitor意見投稿

停止について話すのが好きな人はいません。 彼らは従業員として経験するのは恐ろしく、顧客の信頼と将来の収益に大きな打撃を与えます。 しかし、それらは起こります。 eBayやMicrosoftなど、これまでにないほど多くの技術リソースを持っている上場テクノロジーの大国でさえ、停電の餌食になります。 そして彼らがそうするとき、彼らは彼らの株主と経営陣の悔しさのために、ビジネスのために閉鎖されます。

それはそれほど問題ではありません かどうか あなたの会社では停止が発生しますが いつ。 それらを生き残るための秘訣は、それらをうまく処理し、他人の過ちから学ぶことです。 常に完璧な人は誰もいません(私の現在の雇用主は、 LogicMonitor、含まれています)しかし、私はこれらの間違いについて話すことによって、私たち全員が将来それらを回避するために必要なハードワークを始めることができることを願っています。


4つの重大な間違い企業が処理停止を行う:

    1. 実証済みの停止対応計画がないこれはおなじみのように聞こえますか?停止が発生します。 カスタマーサポートからTechOpsチームに大量の電子メールが送信されます。 幹部はXNUMX分ごとに更新を要求し始めます。 技術チームのメンバーは全員、別々の監視ツールを実行して、どのデータを浚渫できるかを確認します。多くの場合、問題の一部しか表示されません。 グループがお互いに指を向けると、大規模な混乱が発生し、システム管理者は、更新を要求する上司からのテキストに応答するか、トラブルシューティングを続行して可能な修正を適用するかがわかりません。 マーケティング(「ソーシャルメディアでごちゃごちゃになっています!大量のメールを送信し、何が起こっているのかを人々に伝えるブログ投稿を行う必要があります!」)と法定責任(「責任を認めないでください!」)が参加して、公開された応答。 猫は犬と交尾を始め、世界は爆発します。

      OK、その最後の部分は起こらないかもしれません。 しかし、残りの部分がおなじみのように聞こえる場合、あなたの会社は間違い#1を犯している可能性があります。

      停止を処理するための整形式のプロセスでは、問題の解決に責任を持つのは誰か、エスカレーションパスにいるのは誰か、問題についてのコミュニケーションに責任があるのは誰かを定義する必要があります。 これには、停止の背後にある根本原因を分析し、システムに冗長性を構築することから、将来停止が再発する前に問題をキャッチして解決できるように監視設定を変更することまで、さまざまなギャップに対処するための事後プロセスが含まれます。

    2. 影響を受ける顧客との停止に関するコミュニケーションの欠如あなたの会社をオンラインに戻そうとする熱気の中で、「暗くなる」のは簡単です。 残念ながら、顧客とのコミュニケーションを怠ると、サポートコールの洪水、保留時間の延長、顧客エクスペリエンスの低下など、多くの悪影響が生じることが多く、会社が応答しない、信頼できない、または制御できないという認識が生じる可能性があります。多くの場合、顧客対応グループとTechOpsチームの間のコミュニケーションラインが不十分または欠落していることにあります。 顧客に問題を通知するためのシステム(ブログ、フォーラム、大量の電子メール、RSSフィードなど)がないことは大きな問題になる可能性があります。 または、顧客が問題に気付かない可能性があり(顧客が気付く)、損傷が何らかの形で最小限に抑えられる(コミュニケーションの欠如は悪化するだけである)という誤った考えに基づいて、企業が停止について連絡しない場合。ヒント:定義済みであることを確認してください。停止中および停止後の責任が明確に割り当てられたコミュニケーションプロセス。 関係者全員がそれに精通していることを確認してください。 停止中はアクセスできない可能性があるため、会社のWebサイトに保存するだけではいけません。
    3. 非難ゲームをプレイする
      パートナーやベンダーを非難することは、企業が停止に対応する際に採用することがある戦術です。 顧客が会社が最終的に下した決定に対する責任を放棄するものと見なしているため、成功することはめったにありません。 (誰がそのベンダーまたはパートナーに依存することを選択しましたか?あなたはそうしました。)責任を負わないことによって、会社はまた、群衆を喜ばせる可能性が低い問題の再発を防ぐための措置を講じていません。 より広い責任を負い、関係するベンダーのレビューを開始する、冗長性を設定する、または問題の原因となった可能性のあるプロセスをレビューすることは、すべてより良い選択肢です。
    4. そもそも彼らが停電していることを知らない。停止について聞くための最悪の方法は、顧客にあなたに言わせることです(またはおそらくあなたの上司にあなたに言わせることです)。 監視対象のデータセンターに監視インフラストラクチャを配置することは、監視もオフラインであるため、アラートを受け取らない停止を発生させるための優れた方法です。 データセンターがAmazonであっても、Logglyに起こったことです 数年前の長期停止中。最善の方法:データセンター全体がダウンしているかどうかを通知するLogicMonitorなどの統合SaaSベースのプラットフォームからアラートを取得する。 監視プラットフォームは、Webサイト(合成トランザクションチェックの実行を含む)、アプリケーション、データベース、ネットワーク、サーバー、仮想化、およびクラウド(ITインフラストラクチャが格納されている場所)の完全なビューを提供する必要があります。これにより、カスタマーエクスペリエンスが向上する前に問題をプロアクティブに修正できます。以下は、すべてのLogicMonitorアカウントで無料のSiteMonitor™を使用したLogicMonitorグラフでの停止の例です。 (注:eBayは現在LogicMonitorの顧客ではありません。)

停止インシデントの管理を改善すると、会社の従業員、顧客、および株主にとってより良い結果を生み出すことができます。 簡単なことではありません。 しかし、それだけの価値はあります。 そして、それはすべて、他の人があなたの前で犯したいくつかの基本的な間違いを避けることから始まります。

このトピックについてもっと知りたいですか? 電子書籍を読む
企業が停止を処理する際の間違いトップ10とそれらすべてを回避する方法

この投稿は気に入りましたか? この投稿を共有するか、いいねしてください。 以下にコメントを入力してください。

スコット・バーネット

Scott Barnettは、LogicMonitorの従業員です。

LogicBlogを購読して、LogicMonitorの最新の開発に関する最新情報を入手し、ITエキスパートとエンジニアのワールドクラスのチーム、およびITプロフェッショナルが愛する製品。

LogicBlogの他の記事

アンペアロボット 影

お店の話をしましょう。

STARTED GET