タグ

failureに関するiqmのブックマーク (44)

  • エアラインリザベーション | BIPROGY技報 | BIPROGY株式会社

    2013年12月発行 Vol.33 No.3 通巻118号エアラインリザベーション 技報118号は、全日空輸株式会社 (ANA) が30年以上にわたりメインフレーム上で使用してきた国内線旅客システム「able-D」を、米国ユニシス社のオープンエアラインパッケージ「AirCore」をベースに再構築したプロジェクトについてまとめています。 大手航空会社の基幹システムである旅客システムは、停止できない社会基盤でもあり、今回のオープンシステムへの移行は、世界的に前例のないものでした。特集号では、それを実現した大規模システム開発プロジェクトマネジメントへの取り組み、オープン技術によるアーキテクチャ設計、インフラシステム、外部システム接続、フレームワークや業務ソリューション開発の概要、テスト戦略、移行計画などを紹介しています。 オープン国内線旅客システム開発の考慮点金子 時生 2013年2月に全日

    エアラインリザベーション | BIPROGY技報 | BIPROGY株式会社
    iqm
    iqm 2016/04/12
  • 「スマホ時代の考え方に変わり切れていなかった」 続発したKDDIのLTE通信障害、原因と対策は

    「スマホ時代の考え方に変わり切れていなかった」 続発したKDDIのLTE通信障害、原因と対策は(1/2 ページ) 「ご迷惑、ご心配おかけし、改めてお詫び申し上げます」――KDDIの田中孝司社長は6月10日、4G LTEの通信障害が相次いだ問題について謝罪会見を開いた。障害は、「MME」(Mobility Management Entity)と呼ばれるLTE基地局制御装置のバグが起因となって発生。同社は総額300億円の設備投資を追加で行うなどしてバグやミスが起きても障害につながらない体制を整え、再発防止に努める。 障害の起因となった2つのバグ 障害が発生したのは、4月27日、5月29日、30日。東京都、神奈川県、山梨県の一部のユーザー(それぞれ60万人前後)で、LTEデータ通信ができないか、利用できないか、利用しづらくなったほか、29日には音声通話がしづらい障害も発生した。 障害の影響時間と

    「スマホ時代の考え方に変わり切れていなかった」 続発したKDDIのLTE通信障害、原因と対策は
    iqm
    iqm 2013/06/11
  • Eメールリアルタイム送受信システムの通信障害について | 2013年 | KDDI株式会社

    2013年4月16日から19日、au携帯電話サービスでEメールのリアルタイム送受信を設定している一部のお客さまにおいて、Eメールがご利用いただけない、または、しづらい状況が発生しました。 対象となりましたお客さまは、4月19日2:54より通常どおりサービスをご利用いただける状況となっております。 お客さまに多大なご迷惑をお掛けしましたことを深くお詫び申し上げます。 今回の障害の内容と対策は、別紙のとおりです。 当社は、今回の障害発生を真摯に受け止めて電気通信事業者として深く反省し、再発防止の徹底に努めてまいります。 別紙: Eメールリアルタイム送受信システムの障害について (2.1MB) なお、障害にともない、「メールが表示されない」あるいは「連絡先が表示されない」場合は、再同期を行うことで表示されます。 以下の再同期方法をご確認ください。 メールが表示できない場合はこちら 連絡先が表示

  • 「平常時の14倍に耐える構成に再設計」、KDDIが年末年始の障害の原因と対策を公表

    KDDIは2013年1月16日、2012年12月31日と2013年1月2日に起こった「4G LTEサービス」の通信障害、および1月1日に起こったau ID認証決済システムの障害について、障害発生の経緯と対策について、説明会を開いた。 4G LTEの通信障害は、まず12月31日の午前0時から午前4時23分にかけて4時間23分の間、データ通信できない、または利用しづらい状況になった(関連記事)。影響は全国の最大約180万人に及んだ。 今回の説明によると、原因はLTEの信号中継装置と信号制御装置の間の認証応答のタイムアウト値に不整合があったことにあるという(写真1)。 KDDIの4G LTEでデータ通信を利用する場合、月間7Gバイト以上などデータ通信の総量に応じた速度制限をかける。これをカウントする「利用通信量制御認証」を行うために、LTE端末は信号中継系の装置を介して「加入者プロファイルサーバ

    「平常時の14倍に耐える構成に再設計」、KDDIが年末年始の障害の原因と対策を公表
  • 年末年始に繋がらない、auが障害発生の状況を説明

    iqm
    iqm 2013/01/17
    「現在は1分単位でトラフィックを監視しているが、もっと細かく1秒ぐらいの間隔で見ていかなければならない」正気か?
  • KDDIが通信障害の原因と対策発表--年末年始に3回相次ぎ「再発防止努める」

    KDDIは1月16日、大晦日から年明けに相次いで発生した一連の通信障害に関する説明会を開き、各障害の原因と今後の対策を説明した。 会見に出席したKDDI 新規事業統括部 新規ビジネス推進部長の雨宮俊武氏は「この度はお客様にご迷惑をおかけしまして申し訳ございませんでした。電気通信事業者として深く反省し、今後このようなことのないよう再発防止に努めていきます」と謝罪した。 2012年12月31日のLTE障害 まず、2012年12月31日の午前0時~4時23分まで、iPhone 5などLTE対応端末を利用する一部のユーザーが、データ通信サービスを利用できない、または利用しづらくなる障害が発生した。対象地域は全国で、最大180万人に影響が及んだ。 障害の原因は、LTE端末から瞬間的なアクセス集中が発生したことで、通信量制御の認証をする設備「加入者プロファイルサーバ」がバッファオーバーフローを起こ

    KDDIが通信障害の原因と対策発表--年末年始に3回相次ぎ「再発防止努める」
    iqm
    iqm 2013/01/17
    国内最大のLTE網をいきなり運用してるから色々苦労してるんだろーなー。31日の障害以外は報告義務が無さそうに見えるがはて?
  • https://jp.techcrunch.com/2012/12/27/20121227botched-software-update-to-networking-gear-caused-one-of-githubs-all-time-worst-outages/

    https://jp.techcrunch.com/2012/12/27/20121227botched-software-update-to-networking-gear-caused-one-of-githubs-all-time-worst-outages/
    iqm
    iqm 2012/12/28
    L2障害時のfailover設計ミスかな
  • https://www.soumu.go.jp/main_content/000174336.pdf

    iqm
    iqm 2012/09/04
    障害の発生内容/原因がかなり面白い。sbmの元社員による不正プログラム投入とか刑事事件ものだろ...
  • 東証システム障害の原因はL3スイッチのバグ、金融庁が業務改善命令

    金融庁は2012年8月24日、同月7日に東京証券取引所が引き起こしたシステム障害(関連記事)に対して業務改善命令を出した。これを受けて同日夕方、東証は会見を開き、原因はレイヤー3スイッチのソフトウエアのバグであることを明らかにした。東証は9月中にソフトの更新などの対処を終える予定だ。 同スイッチは二重化しており、来、障害が発生した際は、番系から待機系に切り替わる。しかしスイッチ内部の障害を検知するソフトウエアにバグがあり、障害が起こった番系がシャットダウンせず、切り替わった待機系側と合わせて番系が二つ並行稼働する異常な状態となった。スイッチのメーカーはアラクサラネットワークスである。 金融庁は東証が2月に続き半年間で2回障害を発生させたことを重くみており、社外の専門家による検証を受けることを命じた。「今年2月の東証によるシステム総点検が十分ではなかった」(金融庁)という。対応策の進

    東証システム障害の原因はL3スイッチのバグ、金融庁が業務改善命令
    iqm
    iqm 2012/08/27
    わあい alaxala
  • 「誤ファイル適用」「信号管理テーブル枯渇」、ドコモが二つの通信障害の原因と対策を説明

    NTTドコモは2012年8月7日、7月25日と8月2日に発生した通信障害に関する記者会見を開催した。 会見の冒頭、同社の岩崎文夫代表取締役副社長(写真1)は、「昨年6月以降発生した一連の通信障害によって年1月に総務省から行政指導を受け、再発防止策に務める中、今回の障害を起こしてしまった。ご迷惑をおかけしたことを深くお詫び申し上げる」と頭を下げた。その上で両日に発生した通信障害について、その原因と対策について説明した。 spモード各種設定の障害は、更新時の誤ったファイル適用による運用ミス 7月25日に発生した障害は、「spモード」の各種設定に関するトラブルである(関連記事)。同日の午前1時41分~午前9時14分の間、メールや無線LANなどの設定情報を変更できる各種設定の画面にアクセスできない、もしくは他のユーザーの設定情報が表示されるという事象が起きた。 障害は、spモード各種設定用サーバ

    「誤ファイル適用」「信号管理テーブル枯渇」、ドコモが二つの通信障害の原因と対策を説明
    iqm
    iqm 2012/08/22
  • NTTドコモのspモードにまたトラブル、他人のメアドなど設定を閲覧、変更可能に

    NTTドコモは2012年7月25日、スマートフォン向けのサービス「spモード」にトラブルが発生し、設定画面で他人のメールアドレスなどを閲覧、変更できる状態になったと発表した。 トラブルが発生したのは、25日午前1時41分から9時14分まで。この間、spモードの各種設定を閲覧、変更するサイトにアクセスすると、一部のユーザーで他人のspモードメールアドレス、Wi-Fi設定、公衆無線LAN設定などを閲覧、変更できる状態になったという。加えて、数字4桁のパスワードを変更することもできた。閲覧、変更できたのは設定情報のみで、メールの中身など他の情報の漏洩はないという。 NTTドコモは9時14分にサイトへのアクセスを停止。トラブルの原因を取り除いた後、13時37分にサイトを復旧させた。 同社によれば、トラブル発生中に実際にパスワードを変更したユーザーが約600人、メールアドレスを変更したユーザーが約4

    NTTドコモのspモードにまたトラブル、他人のメアドなど設定を閲覧、変更可能に
    iqm
    iqm 2012/07/26
    やっぱ、電話番号でユーザ認証してIPアドレスに落とすアーキテクチャおかしいんじゃね?
  • 東証、システム障害の原因は「人為ミス」、診断レポートを“解読”できず

    東京証券取引所は2月16日、2月2日に発生した大規模システム障害について、「(東証の)職員が主体的にシステムの状態を確認せず、問題なしと判断した」ことが原因だったと発表した。東証のシステム子会社である東証システムサービス(TSS)の担当者と、保守ベンダーである富士通のSEが診断レポートを誤認し、東証の職員が経営陣に適切な報告を怠っていたことが、対応の遅れにつながったことも明らかにした(関連記事)。 障害を起こしたのは取引関係者に相場情報を配信する「情報配信システム」。サーバー3台を1セットとし、8セットで構成する。東証はサーバーを三重化しており、1台のサーバーに障害が発生した場合、残り2台に自動的に切り替えて処理を継続する。東証は切り替えに成功したと考えていたが、実際には失敗しており、同日午前中の一部銘柄の取引停止につながった。 経緯はこうだ。 午前1時27分、1台のサーバー(ノードA)で

    東証、システム障害の原因は「人為ミス」、診断レポートを“解読”できず
    iqm
    iqm 2012/02/16
    診断システムのレポートの出し方としての不具合と、担当者教育レベルという二重の不具合にみえる。
  • [続報]東証のシステム障害、原因はハードウエア故障後の切り替えミス

    東京証券取引所は2012年2月2日、東証のシステム障害で計300銘柄以上が売買できなくなったトラブルについて記者会見を開いた(関連記事1、2、3、4)。株式取引システム「arrowhead」のうち、株価情報を証券会社などに配信する「情報配信システム」でハードウエアが故障。その後、バックアップ系への移行が正常に行えなかったのが原因という。 東証の鈴木義伯専務取締役(写真)は、「投資家や取引参加者にご迷惑をかけ、お詫びする」と謝罪した。 障害が発生したのは、2日の午前1時27分のことである。情報配信システムを構成する8セットのサーバー群のうち1セットに故障が発生した。 この1セットは、富士通製のPRIMEQUESTサーバー3台で構成されており、通常は3台がそれぞれ銘柄を分担して株価情報などを配信する。 このうち1台が故障した場合には、数秒で自動的に他の2台へ業務を引き継ぐことができる。常に3台

    [続報]東証のシステム障害、原因はハードウエア故障後の切り替えミス
  • 報道発表資料 : 【お詫び】2012年1月25日のFOMAの音声・パケット通信サービスがご利用しづらい状況について | お知らせ | NTTドコモ

    お客様の設定により、お客様情報が「非表示」となっております。お客様情報を表示するにはdアカウントでログインしてください。 お客様情報表示についてへ お客様情報表示についてへ 2012年1月25日(水)8時26分から13時08分までの間、東京都の一部地域においてFOMAの音声・パケット通信サービスがご利用しづらい状況が発生しました。 お客様には、大変ご迷惑とご心配をおかけしましたことを、深くお詫び申し上げます。 今回の事象の内容と原因および対策は、以下のとおりです。 1.事象の内容 (1)発生期間 : 2012年1月25日(水) 8時26分〜13時08分 (2)発生事象 : FOMAの音声・パケット通信サービスがご利用しづらい状況 (3)事象の原因となった設備 : パケット交換機 (4)影響地域及び影響人数 影響地域 : 東京都(葛飾区・江戸川区・江東区・港区・新宿区・千代田区・中央区・品川

    iqm
    iqm 2012/01/26
  • 【続報】ドコモの通信障害、パケット交換機の更新がきっかけ - ニュース:ITpro

    2012年1月25日午前中に発生したNTTドコモの通信障害は、25日未明から新型パケット交換機の格運用を始めたことがきっかけだった(関連記事:ドコモの東京エリア通信障害が復旧、最大約250万人に影響)。 NTTドコモは、スマートフォンの利用者増に伴う通信インフラ増強のため、1月20日から最新型パケット交換機の試験運用を始めたという。5日間にわたって安定的に運用できたことから、25日未明から収容エリアを拡大、格運用に移った。 障害が発生したのは、同日の8時26分。格運用を始めたばかりのパケット交換機の動作が不安定になり、処理能力が低下した。 さらにその30分後、午前9時すぎにJR山手線でトラブルが発生したのを機に、乗客が一斉に通信を始めるなどしてトラフィックが急増。パケット交換機の処理容量を超え、自動的に通信規制がかかった。 NTTドコモは午前11時ごろにパケット交換機を元の構成に戻し

    【続報】ドコモの通信障害、パケット交換機の更新がきっかけ - ニュース:ITpro
    iqm
    iqm 2012/01/26
  • [続報]spモード障害、なぜ処理能力オーバーで「メールアドレスの置き換え」が起きたのか

    2011年12月20日に発生したNTTドコモのspモード障害(関連記事)。一部のサーバーが処理能力不足に陥ったことが、なぜ「自分のメールアドレスが他人のものに置き換わる」という通信の秘密にかかわる事故に発展したのか。大きな理由の1つは、メールアドレスが端末固有のIDでなく、端末に振り出されたIPアドレスとひも付いていた点にある。 Android OS端末がいったん3G網に接続したら、3G網から切断しない限り、端末のIPアドレスは変わらない。端末を再起動したり、あるいは3G網からWiFi網に切り替えたりしない限り、IPアドレスが再度割り振られることはない。家庭の固定網に接続したパソコンに近い仕様といえる。 この仕組みによって、Android OSにおけるIPアドレスは、一時的には端末を識別するIDとして使える。NTTドコモのspモードシステムの場合、3G網に接続して電話番号とIPアドレスをひ

    [続報]spモード障害、なぜ処理能力オーバーで「メールアドレスの置き換え」が起きたのか
    iqm
    iqm 2011/12/26
    「spモードシステムはIP網の中で動いており、パケットのIPアドレスとユーザーをひも付けるのは自然の発想だった」
  • ドコモのspモード、障害の原因は中継ルーターの故障

    2011年8月16日に発生したNTTドコモのspモードのトラブルの原因は、FOMAのコアネットワークを構成する中継ルーターの故障だとわかった。 トラブルが起こったのは、FOMA網でパケット通信を担うSGSN/GGSNと呼ばれるゲートウエイ装置と、MAPS(Multi-Access Platform System)というシステムの間にある中継ルーターMAPSはFOMAを含め様々なアクセス回線から、インターネットや企業システムへの接続を実現するためのプラットフォームで、spモードの契約管理機能やメール対応機能などが含まれる。 中継ルーター自体は単純にパケット転送を行うもので、冗長化されていた。ハードウエア障害が起こった後、冗長構成になっていた機器への切り替えはすぐに行われたという。ところが機器の切り替えをきっかけに、それまで接続していたセッションが切断されて新規接続(再接続)になったユーザー

    ドコモのspモード、障害の原因は中継ルーターの故障
    iqm
    iqm 2011/08/22
  • 報道発表資料 : 2011年6月6日に発生したネットワーク障害の発生経緯および対策などについて | お知らせ | NTTドコモ

    2011年6月6日(月曜)午前8時27分から同日午後9時36分までの間、関東甲信越地域でご契約された一部のお客様など1 において音声通信およびパケット通信がつながりにくい状況となり、多くのお客様にご不便をおかけしましたことを深くお詫び申し上げます。 今回のネットワーク障害の対象設備、発生経緯と原因および対策は、以下のとおりです。 1 ご契約後、MNPを利用して他の事業者へポートアウトされたお客様、およびドコモのネットワークを利用したMVNO事業者のお客様を含みます。 2011年6月6日に発生したネットワーク障害の発生経緯および対策などの概要 ネットワーク障害の原因となった対象設備 サービス制御装置 発生経緯と原因 ネットワーク障害発生時の状況(6月6日午前8時27分〜午前8時37分) 今回のネットワーク障害は、サービス制御装置の一部パッケージ(ハードウェア)が故障したことをきっかけに、通常

    iqm
    iqm 2011/06/14
  • ソフトバンク、関西のネットワーク障害はソフトウェアが原因

    iqm
    iqm 2011/05/30
  • Web&モバイルマーケティングEXPO 3日目 / WebARENA CLOUD9 のお話 | 水無月ばけらのえび日記

    公開: 2011年5月15日2時10分頃 NTTPCコミュニケーションズのWebARENA CLOUD9 (web.arena.ne.jp)というサービスで5月8日から障害が続いていて、復旧予定が未定になっているという話が出ています。セキュリティホールmemoを見ていたら、こんなお話が。 NTTPC コミュニケーションズは、5/13 まで開催されている第2回クラウド コンピューティングEXPO春に出展しているから、そこで状況を聞いてみるのも一興かと。 以上、セキュリティホールmemo より 都合の良いことに、私は今日もEXPOに行くお仕事があり、NTTPCコミュニケーションズのブースで話を聞いておきたい別件もありました。というわけで、仕事の隙を見て行ってみることに。 ブースには共用レンタルサーバやVPSのパンフレットはあったものの、問題の「CLOUD9」については何も展示されていませんでし

    iqm
    iqm 2011/05/16