KDDIは2022年7月29日に説明会を実施、7月2日より発生していた大規模通信障害の詳細な経緯について説明するとともに、影響を受けた利用者に対する補償の方針などについても明らかにした。
同社の代表取締役社長である高橋誠氏によると、通信障害で顧客に影響が出たのは、7月2日の1時35分から7月4日の15時までの計61時間25分に及んだとのこと。また影響を受けたユーザー数は、音声通話が約2278万人、4G・5Gのデータ通信が765万人以上に上ったそうで、他にも法人向けのIoTサービスなどに影響が及んだとしている。
では実際のところ、どのような経緯で障害が発生し、大規模化・長期化するに至ったのだろうか。通信障害発生中からKDDIはその要因について説明しているが、障害が収束し調査が進んだことを受け、高橋氏は改めて通信障害の経緯について説明している。
まず通信障害が発生したきっかけは、東京・多摩の拠点に設置されている全国中継網のルーターのメンテナンス作業を実施した際にルーターの経路の設定を誤ったことで、上りの通信は通るが、50%の確率で下りの通信が通らない状態になってしまったとのこと。なぜ設定ミスが発生したのかというと、メンテナンスの際にネットワークルーティングポリシーの変更があり、設定変更のための手順書のファイルが新旧2つあったことに起因するようだ。
そして本来であれば新しい手順書のファイルを使って設定を書き換える必要があったところが、古い手順書のファイルも選択できるようになっていたため、誤ってそちらを使って設定を書き換えてしまったとのこと。手順書の確認や承認は目視で実施されたというが、目視ではファイルの中身まで判別できなかったことから、気が付かなかったという。
そのことで大きな影響を受けたのがVoLTE交換機だ。スマートフォンなどがVoLTEによる音声通話をする際は、まずPGW(Packet data network GateWay)という設備、そしてVoLTE交換機を通じて加入者データベースに端末の位置を登録し、それから音声通話の発着信ができる仕組みとなっている。
だがルーターのトラブルで位置登録の要求が破棄されてしまい、ネットワーク内でVoLTE交換機に対し位置登録要求の再送が急増したことで、多摩の拠点にあるVoLTE交換機が輻輳を起こしてしまったという。通信が通らない時間は15分ほどだが、その間に発生したトラフィックは通常の7倍に上ったそうで、高橋氏によると「1分間くらいでVoLTE交換機が輻輳している」状態であったとのこと。かなり短時間のうちに輻輳状態に至った様子を見て取ることができる。
そして全国の他の拠点も多摩の拠点と同じ構造となっており、全国中継網を介して分散処理をしていることから、多摩の拠点での輻輳が全国の拠点にも波及。全国のVoLTE交換機が輻輳に至ったという。そしてVoLTE交換機とPGWは、位置登録の再送をする度に加入者データベースへ認証を要求する仕組みであることから、加入者データベースへ過剰な信号が流れ込み、こちらも輻輳状態に陥った。
そうしたことからKDDIでは、加入者データベースへの負荷を軽減するため通信の流量を制限したのだが、それでも輻輳は完全に回復しなかった。そこで原因を探ったところ、全国に18台あるVoLTE交換機のうち6台が異常な状態となり、過剰に信号を送出し続けていたことが判明。これらを切り離したことでようやく再送が収束し、回復へと至っている。
なぜ6台のVoLTE交換機が異常な状態に陥ったのかというと、輻輳でバックアップファイルに異常が生じたことに原因があるという。VoLTE交換機は定期的にバックアップファイルを作成するが、その際輻輳が発生したことでファイルに異常が生じてしまい、VoLTE交換機をリセットして回復を図ろうとしたところ、6台は異常のあるバックアップファイルを用いて復旧したため異常な状態となってしまったようだ。
ではなぜ、今回の通信障害がここまで大規模かつ長期的なものになったのかというと、高橋氏は「入口でトラフィックを守る設計だった」と答えている。つまり同社は外部からのアクセス集中からネットワークを守る仕組みには力を入れてきたが、ネットワークの内側で大量のトラフィックが発生し、輻輳状態になることはあまり想定しておらず、その制御や復旧をするための手段を確立できていなかったことが、対処を大きく遅らせる要因となったようだ。
また今回の通信障害に関しては、総務大臣の金子恭之氏が、利用者目線での情報発信が不十分と話し、総務省からKDDIに人員を派遣するという異例の措置が取られるなど、通信障害発生時の情報発信のあり方についても課題を残すこととなった。
高橋氏は情報発信に関する反省点として、大規模障害の際はその最中であっても「障害が起きていることと、その時点で分かっている内容を伝えた方がよいと(総務省職員から)指摘を頂いた」こと、通信が利用できない中での顧客に対する情報発信のあり方、そして「復旧」の定義が明確でなかったため、その言葉を使うタイミングを巡り顧客に混乱を与えたことなどを挙げている。
そうした課題を踏まえ、KDDIではネットワークの安定化と顧客目線の対応を強化するべく、組織横断的な体制を構築するとのこと。具体的には高橋氏を責任者とする「通信基盤強化並びにお客様対応強化対策会議」を設立、作業品質強化やお客様対応強化など4つのワーキンググループをその下に設置して、全社横断的な取り組みで再発防止策を進めるとしている。
さらにKDDIは、今回の通信障害に関する顧客への返金措置も打ち出している。その対象は1つに、約款に記されている24時間以上連続して通信サービスが利用できなかった、音声通信サービスのみを契約していた顧客への返金措置で、その対象は271万人。返金額は契約している料金プランの基本料を日割りして、利用できなかった2日分に相当する額になるという。
そしてもう1つは、全てのスマートフォンや携帯電話、そして固定電話の代替サービスとなる「ホームプラス電話」の契約者に対する“お詫び”だ。今回の通信障害ではデータ通信部分に関して大きな影響が出ていなかったことから、データ通信サービスの契約者は約款上の返金対象とはならないものの、先の音声プランの日割り平均額となる52円に、通信障害のあった3日をかけ、それにお詫びの意味をプラスして1人当たり200円を返金するとしている。
なお「povo 2.0」は月額0円なので、返金の代替措置として3日間利用できる1GBのデータトッピングを進呈するとのことだ。また一連の通信障害の責任を取る形で、高橋氏は報酬の20%を3カ月分返上、他の役員も報酬の10%を1〜3カ月自主返上するとしている。
返金額は合計で73億円、子会社であり沖縄でモバイル通信事業を展開している沖縄セルラーの分も合わせると、グループ合計で75億円になるとのこと。業績に与える影響も気になるところだが、高橋氏は「業績に影響がないとは言えないが、(落ち込みを)カバーしながら(2022年度通期の)開示目標値は変えない」としている。一方で、返金措置が24時間利用できない場合に限るという約款を変更する可能性について、高橋氏は「コメントを控える」と答えるにとどまっている。
なおKDDIは今回の説明会に合わせて、2023年3月期第1四半期決算も発表している。その売上高は前年同期比4%増の1兆3517億円、営業利益は0.8%減の2969億円と、増収減益の決算となっている。
減益は行政主導の通信料引き下げの影響が大きく、マルチブランド通信ARPU収入は292億円の減となっている。それに加えて楽天モバイルからのローミング収入が減少したことにより、グループMVNO収入とローミング収入の合計もマイナスに転じているようだ。
また「au」「UQ mobile」「povo」のマルチブランドID数も3093万と、前四半期と比べ減少している。だがこれは2022年3月末で3Gのサービスを終了したことで、約25万の解約が出たためだという。
ちなみに通信障害による足元の影響として、高橋氏は解約は大きく伸びていないとする一方、新規顧客の獲得には影響が出ていると答えている。楽天モバイルが月額0円で利用できる仕組みを廃止したことからpovo 2.0の契約が大きく伸びていたが、こちらも通信障害の影響以降、契約自体は増えているが「一時期の勢いよりはすこし落ちている」(高橋氏)とのことだ。
一方で注力領域と位置付けるビジネスセグメントや金融事業は売上および利益ともに好調で、全社は企業のデジタル化推進を主とした「NEXTコア事業」の売上が前年同期比18%増の870億円と、2桁成長を継続。また後者も、住宅ローン手数料の会計処理を変更した影響もあって大幅増益に至っているそうで、「au PAYカード」の契約数など主要な指標も順調に伸びているとのことだ。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス