ネットワークエンジニアを続けていると、同じような場面を何度か経験することがあります。そんな「よくある出来事」をシチューエンション別に『ネットワークエンジニアの業界あるある』としてまとめました。
「ネットワークエンジニア」についての説明は、下記を参照してください。
ネットワークエンジニアが、SES会社を選ぶ際のポイントは下記を参照してください。
通常業務編
通信要件が出てこない(≒納期に余裕がない)
ネットワークエンジニアにとって、「通信要件」は何よりも大切です。しかし、アプリの仕様が決まり、サーバーの設計要件が固まった後に、ネットワークの通信要件が決まることが多いです。
そのため、ネットワークの通信要件が決まる頃には、プロジェクト全体の納期に余裕がなくなっていることが多いです。結果として、ネットワークエンジニアの仕事は、周りから急かされるうえに、ミスが許されないという『二重のプレッシャー』がかかりがちです。
何かあると、真っ先にネットワークが疑われる
システムでトラブルが発生した際は、真っ先にネットワークが疑われます。調査した結果、アプリやサーバーに問題があることが多いです。何も作業をしていないのに、急に通信ができなくなることは滅多にありません。
ネットワークは、つながって当たり前(と思われている…)
ネットワークは、いつでもつながって当たり前だと思われています。いかに止まらないネットワークを作るかは、ネットワークエンジニアにとって、腕の見せ所です。しかし、機器の故障等は少なからず発生します。そんな時、結構責められます。
管理表が信用できない!?
長年運用されてきたネットワークでは、種々の管理表の更新が追いついていないことが多いです。(管理表が存在していれば、まだ良い方かもしれませんが…)
管理表を信用して作業すると、痛い目に合うことがあります。
こんな時は、管理表の管理表(の管理表!?)を作って、整理するとことから始めましょう!
構成図が信用できない!?
管理表と同様に構成図もカオスなっていることが多いです。接続関係が誤っていたり、そもそも機器が載っていなかったりします。
新しく入った現場では、ネットワーク機器のコンフィグ・ステータスをかき集め、構成図と睨めっこが続きます。
埒が明かないようなら、現地調査を行い、一から作り直しましょう!
様々な関係者との間で板挟みに…
ネットワークエンジニアは、調整業務も多く、板挟みになりがちです。
例えば、「アプリ担当⇔サーバー担当」、「ユーザー⇔キャリア」、「顧客⇔社員」などの間に立って、”うまくやる”必要があります。
「調整業務」は、どんなスキルよりも大切で難しいかもしれません。
障害編(謎トラブル発生)
ループ配線
ネットワークエンジニアにとっては信じられないことが多々起こります。
「余っているケーブルを挿してみた」「ハブ同士を接続してみた」等、色々な『〇〇してみたシリーズ』が発生します。
機器障害同様に何の前触れもなく発生し、ネットワークエンジニアを悪夢に陥れます。
フロア掃除の人がルーターの電源を抜く
小さな拠点やオフィスでは、ルーター等のネットワーク機器が、フロア内に置かれていることもあります。
フロア掃除の人が、掃除機のコンセントが足りなくて、「ちょっと、このコンセント抜いちゃお!(戻しておけば良いでしょ)」という事象が発生します。
これが、WANルーターの場合、拠点のネットワーク機器全滅のアラートが鳴り、冷や汗ものです。『抜いちゃダメ!絶対!』というテプラを貼っておきましょう。
障害が重なる(そうだ、お祓いに行こう!)
なぜか障害が連続して発生する時があります。しかも、機器障害等の突発障害が頻発します。(人為ミスでのトラブルを併発しないように、普段よりも注意が必要です。)
こんな時は、障害対応の最優先事項として、とりあえず神社にお祓いに行きましょう。
データセンター作業編
年越しをデータセンターで迎える
年末年始にシステムを止めて、大規模なメンテナンスを実施することがあります。(最近は少なくなりましたね。)
データセンターという社会から隔離された場所で、いつの間にか年を越した時は、「これが、ネットワークエンジニアだ!」と実感できるでしょう。
データセンターの床下に物を落とす
データセンターの床は通気と冷却のために、格子状になっている箇所があります。ここに物を落とすと、取るのは大変です。(場合によっては、潔く諦めます。)
ボールペン、タグ、ネジ等、小さいものはよく落ちています。大事なものを落とさないように気をつけましょう。
ケージナットが付けられない、外せない…
ラックにネットワーク機器を設置するときに必要な「ケージナット」は、素手だと取り付けるのが大変です。すぐ近くに機器が設置済みだったり、ケーブルが密集していたりすると、さらに大変になります。
小さいので、ラックの中に落とすと行方不明になる場合もあります。怪我をする可能性もあるので、専用工具を利用するのがベターです。
ラック内のケーブルが乱雑
ラック内のケーブルが乱雑になっている光景はよく目にします。「これ、どうやって機器交換するんだろう…」というような、絶望的な状況もあります。
配線の流れやケーブルの色を統一させ、整然としたケーブル配線を目指しましょう。すでに乱雑になっている場合は、手遅れの場合があるので、更改案件に期待しましょう。
右の写真は、あくまでイメージです。(ラック内ケーブルの擬人化)
ターミナル作業編
ter len 0 の打ち忘れ( –More– !? )
障害対応時等で急いでいるときに、 “ter len 0” の打ち忘れで「–More–」が表示されると、自分が悪いのにイラっとします。何度も繰り返すと、周りから「センス無いなー」と思われるので注意しましょう。
なお、Cisco機器へのTelnet接続の場合、 “ter len 0” の後にウインドウサイズを変更すると、 “ter len 0” がリセットされるので注意が必要です。(Teratermの場合です。SSH接続は大丈夫です。)
ter moi の打ち忘れ(ログがコンソールに表示されない…)
TelnetやSSHでリモート接続している場合、 “terminal monitor” を打たないとログがコンソールに表示されません。
ケーブル接続作業をリモートで確認中に、「あれ、リンクアップが表示されない??」となって、現地作業員を疑わないように気をつけましょう。
Ping/Tracerouteが止められない
Cisco機器で実行したPingやTracerouteを途中で止めたい時は、「ctrl+c」では止められません。Windowsの場合は、「ctrl + shift + 6 を同時押し」です。
ネットワークエンジニアであれば、スマートに止められるようにしておきましょう。
絶対NG作業編
これは、「あるある」ですが、絶対にやってはいけないオペレーションです。(実際にやってしまうと、笑えません…)
アクセスリスト全体を消しちゃう(一行だけ消したかった…)
アクセスリストを一行削除しようとして、コンフィグの一行に “no” をつけて消そうとすると、アクセスリスト全体が消えてしまいます。
Ciscoの仕様ですが、この罠にハマる人は多いです。下記のようにシーケンス番号を指定して削除しましょう。
Router#show ip access-lists
Standard IP access list 1
10 permit 1.1.1.1
20 permit 2.2.2.2
30 permit 3.3.3.3
Router#conf t
Router(config)#ip access-list standard 1
Router(config-std-nacl)#no 20
トランクのVLAN設定を上書きしちゃう(VLAN追加したかった…)
トランクポートにVLANを追加しようとして、 “add” を忘れるパターンです。
“add” を忘れると、これまで設定されていたVLANが上書きされて、通信できなくなります。場合によっては、既存通信が全てNGとなり、大規模なトラブルにつながります。
下記の構文でVLANを追加しましょう。
switchport trunk allowed vlan add [VLAN-ID]
“monitor session”の”source”と”destination”を逆に設定
パケットキャプチャを実施する際に設定する ”monitor session” の設定です。 “source” と “destination” を誤って設定すると、通信ができなくなります。
本番環境で実施する場合、最大限の注意を払う必要があります。
服装編
データセンター作業時はラフな格好
ネットワークエンジニアは、普段はビジネスカジュアルで勤務することが多いです。データセンターでの作業の時は、さらにラフな格好をすることもあります。
場所や会社によりますが、ジーパンとパーカーで作業する人もいます。データセンターは、マシン冷却のため冷房が効いているので、寒さ対策は忘れないようにしましょう。
休日出勤時に私服のセンスがバレる
休日出勤の時は、私服で勤務することが多いです。
私服のセンスがバレてしまうので気をつけましょう。
←こんなTシャツを着ていたら、「どんだけネットワークが好きなんだ…」って思われちゃいます。
私生活編
ネットワーク絡みのニュースが気になる
ネットワーク絡みの障害がニュースでやっていると、障害の原因を推測したります。障害原因の詳細をニュースや会見で話すことはないため、推測し放題ですが、真因はわからないままのことが多いです。
なかなか難しいかもしれないですが、同じようなトラブルを発生させないために、もう少し詳細な障害原因を発表して欲しいものです。
とりあえずPingとTracerouteを打つ
Webブラウジングをしていて、接続できなかったりしたら、とりあえずpingとtracerouteを実施します。
何かが分かるというわけではないのですが、とりあえず打ちます。
とりあえずキャプチャする(Wireshark!)
ネットワークエンジニアはキャプチャが大好きです。特にWireshark!
でも、仕事でのキャプチャ取得と解析はちょっと大変なので、気軽にお願いされると困る時もあります。