ネットワークトラブル事例に見る教訓と対策 (4114199)
□このページをPDFダウンロードする□簡易見積書をPDFダウンロードする
ネットワークトラブル事例に見る教訓と対策~IPネットのシステム監視技術とトラブルシューティング
システム監視技術とそのトラブル対策について 効果的な対応を取れるよう、各種管理しきい値・対応策・プランの立て方を事例を交えて紹介します。自らトラブルシューティングにあたる方はもちろん、業者に対して適切な対応を指示する方のために有益な情報をご提供します。
日時 |
2015年3月17日(火) 10:00-17:00 |
カテゴリー |
IT基盤構築・維持・管理 IS導入(構築)・IS保守専門スキル |
講師 |
上山勝也 氏 (株式会社上山システムラボラトリー 代表取締役 ) 民間企業のユーザー部門を経験後、豊田工業大学工学部制御情報工学科を首席で卒業。民間企業の情報システム部、(株)オープンシステム研究所、伊藤忠テクノサイエンス(株)を経て独立。現在は(株)上山システムラボラトリー代表取締役として、LANやイントラネットシステムの設計・運用・教育などのコンサルティング活動を展開。「無駄な出費をしないために、今あるシステムを有効に使っていく、システムの更新をするにしても将来にわたって無駄のない設計や改善を行う。そしてそれを支える要員の育成をしていく。お客様といっしょにシステムを適切に発展させる。」のが基本的なスタンス。
<主な資格>オンライン情報処理技術者、ネットワークスペシャリスト、システム監査技術者
|
参加費 |
JUAS会員/ITC:33,000円 一般:42,000円(1名様あたり 消費税込み、テキスト込み)【受講権利枚数1枚】 |
会場 |
一般社団法人日本情報システム・ユーザー協会(ユニゾ堀留町二丁目ビル2階) |
対象 |
情報システム部門のネットワーク管理の担当者、アウトソーシングしている場合の管理担当者
<受講前提>
・LAN・WANの基礎知識がある方
・LAN・WANの運用管理等の業務に取り組まれ、さらにスキルアップを目指す方 中級 |
開催形式 |
講義 |
定員 |
30名 |
取得ポイント |
※ITC実践力ポイント対象のセミナーです。(2時間1ポイント) |
ITCA認定番号 |
ITCC-CPJU9047
|
ITCA認定時間 |
6
|
|
主な内容
近年、IT技術の進展に伴い、ネットワーク関連のハードウェアやソフトウェアが充実し、ユーザー数も増え、その利用内容も高度なものとなってきています。それに伴いネットワークが停止したときの影響は以前にも増して重大なものとなっていることは周知のとおりです。最近では単に「停止しない」というだけでなく、「快適に使用できる」というネットワーク品質や、「安心して使用できる」というセキュリティ確保も重要な管理項目となり、SLA要件を満足させることが管理者の責任にさえなることがあります。
一方でマルチベンダ化やネットワーク活用の多様化のスピードに社内および客先の管理体制が追いつかなくなってきている状況も発生しております。今後の景気拡大により、設備増強・改変が予想される中、人員はこれまでのままでの対応が要求される場面が増加することが予想されます。
このような中、トラブルシューティングの早期化と、正常化のための有効なアクションプランの提示、トラブルそのものの低減などのため、技術者のスキルアップとツールの導入が以前にも増して求められてきています。
本セミナーでは、そのような要求に応えるシステム監視技術とそのトラブル対策について効果的な対応を取れるよう、各種管理しきい値、対応策、プランの立て方を事例を交えて紹介させていただきます。 自らトラブルシューティングにあたる方はもちろん、業者に対して適切な対応を指示する方のために 有益な情報をご提供させていただきます。
<<内容>>
※内容は変更する場合がございます。
プロローグ トラブル発生事例(過去どのようなトラブルが発生したか?)
・工場内LANが定期的に通信できない状態が発生。
・特定のL2スイッチ(カスケード型)において、ファイル転送が極端に遅くなり、完了しないトラブルが多発。
・データセンター内のLANのパフォーマンスが定期的に悪化し、二重系システムが両方共に稼動するトラブルが多発。
・センターL3スイッチとフロア側L3スイッチの間でのパフォーマンスが悪く、機器をアップグレードするものの遅延が解決しない問題が発生。
・STP(Spanning Tree Protocol) にて構築しているLANであるにもかかわらず、ところどころ通信できなかったり、できたりする部分が発生して、安定させるためにセンタースイッチを含めて、スイッチの電源入れ直しで対処した。
・EIGRPで設計した広域Ethernet-WAN(負荷分散パスあり、約90拠点)において、一拠点の障害により、障害がWAN全体に伝播し、ルート情報が収束しない状態が発生。
・L3スイッチの二重系システムを構成し、ハローパケットをフロア側に設置したL2スイッチを経由して交換していたが、両方がアクティブになる障害が発生。
・L3スイッチのリダンダントを構成したが、特定のポートだけが切替わり、装置全体が切替わらなかった。
・データセンター内のL3スイッチ間や、L2スイッチとサーバー間のGiga(光)ポートのパフォーマンスが著しく劣化する症状が多発。
・ローカルのL2スイッチにおいてパフォーマンスが悪いとの苦情を受け、調査したところLateCollisionが発生していたが、値はわずかであるため放置していたところ、さらに遅延増大を引き起こした。
・サーバーへのレスポンスが悪いとネットワークが疑われたが、ネットワークを調査しても解決策が見つからず、アプリケーション担当・ユーザー部門からクレームが寄せられた。
・サーバーレスポンス改善のために、ロードバランサーやサーバーCPUの多重化を行ったが、効果が発揮できない問題が発生した。
(上記問題の原因と対策について用語の説明も交えながら解説させていただきます)
1.ネットワーク運用管理の基本
・ネットワーク管理エネルギー増大の法則について
・ネットワーク管理5項目
・代表的な管理ツールの紹介(役割の違いも説明)
・SNMとPMIBについて
2.主要な管理項目
・障害管理と性能管理
・構成管理(その他、参考として機密管理と課金管理も説明)
3.日常管理と緊急事態への備え
・日常なにを管理するか
・ネットワークバルナビリティとは
・障害時の対応
・コンティンジェンシープランニングとは
4.ネットワーク管理ツールから得られる情報の理解と対応策
・トラフィック量
・マルチキャスト・ブロードキャストパケット
・コリジョン
・RUNTエラー
・GIANTエラー
・ジャバーエラー
・フラグメントエラー
・CRCアライメントエラー
・WANにおけるマルチキャスト・ブロードキャストについて
・WANのトラフィック量について
・パケットドロップ
・リンクダウン
5.トラブル発生についての対応策(対応方法と防御策を事例をベースに説明)
~トラブル発生の原因と対策(プロローグで提示した事例の原因と対策を説明)
・LANループ発生
・WAN帯域負荷分散の不具合
・ロードバランシングのセッション維持問題
・IP電話不具合
・無線LAN電波問題
・無線IP電話問題
・無線LANに対する脅威について
・WAN遅延
・LAN遅延
6.誤りやすい改善方法への対応(その対策、適切なの?)
・WAN帯域増量
・エラー対応のための機器交換
・パフォーマンス向上ための上位機種への交換
7.解決を長引かせる調査方法への警鐘
・質の高いサービス・マンパワーを引き出すためのポイント
・問題が発生したときのためにとるべき方策
・どのようなチェック・タイミングで改善を行うか
8.トラブル対策と今後の管理手法
・リアクティブ管理について
・プロアクティブ管理について
・プロアクティブ管理を進めるための必要条件とは