コンピュータ環境 (2004/06)

最初の書き込みへ

基本の環境はこちら

2004年05月の環境
2004年07月の環境
戻る


時系列・環境の変遷


 

2004/06/30 (Wednesday)
Compaqの すごい SCSI

 起動しなくなった Compaq つうか HP のサーバを復旧させていました。

 これ、4月にこうにうしたとき、外部ディスクアレイを接続する関係で、AHA39160 もいっしょに調達して、納品の後そのままいきなりふたを開いて内部にあった SCSI ボード(起動用のハード・ディスクに接続されていました)を AHA39160 と交換して起動して OS をインストールしたのでした。
 それが、諸般の事情でディスクアレーを別のサーバに接続することにして、AHA39160 ごと取り外し、納品時の SCSI ボードにもどしたら起動しなくなったのです。

 つうか、電源投入すると、一見まともに IPL が進んで、ミ田2000のロゴを表示した直後に青画面。

 OS を再インストールしようと ミ田2000サーバ CD で起動すると、ドライバを読込んだ後で「HDD ないで」

 BIOS にはいってみると、SCSI コントローラは認識しているのですが HDD は見えなくて。
 Compaq の BIOS は見えるところが少ないし。

 しかたない、サポートに電話しました。
 事情を説明し、機体番号を連絡すると、
BIOS で SCSI コントローラは見えますかね
ハイ、それは見えてますが、その先のハード・ディスクは見えないような
では起動シーケンスのメッセージでハード・ディスクを認識しているでしょうか
どぉれ…SCSI コントローラを認識した…ドライブを検索中…ID0 - Compaq - BD********** と表示しました
はい、それは 35 GB ハード・ディスクですね、認識してますね。そういう状況ですと、SCSI コントローラのドライバをインストールしてないですね、ミ田2000のインストール時に F6 キーで追加のドライバを入れられますね、そのタイミングでインストールしてください
了解、それでドライバはどこにありますか、ダウンロードできますか
url はこちらです…

 みたいなやりとりでドライバを落としてハード・ディスクに解凍し、ディスケットに複写したものを準備してミ田2000さっくり再インストールということになりました。

 考えてみると、インストール時に延々と読込んでいる SCSI ドライバの中には確かに AHA***** の文字がくり返し表示されます。
 だからこうにう時のインストールはうまくいったのであって、もしあの時、SCSI ボードを交換せずにインストールしようとしたらこのエラーはその時に発生していたんだなあと思いますた。

今日のトリビア

 SCSI ハード・ディスクを起動ドライブにすると、SCSI ボードを交換した時に窓の再インストールが必要になる。

2004/06/29 (Tuesday)
しうまつの すごい 障害

 しうまつは大騒ぎでした。

 家族の使用している Einhanser(?) こと、Grace が突然起動しなくなったと。

 電源投入しても、BIOS にはいれない。これは一体何なんだ、と。
 ありえるのは熱暴走かな、最近暑いし、と、ほこりのたまっているところなどないか点検させますが異常なし。
 では M/B を交換してみよう、と ex. Morgan le Fay の EPOX + Dulon 1.1 GHz に交換しますが、やはりだめ。最初、ちょっとイイ感じだったのだがすぐに同じ症状になったといいます。

 この時点で他のほとんどの可能性を捨てて電源交換することにしました。
 日記をさかのぼればどっかに書いてあるはずですが、山○電器で 5 K くらいで調達したものです。今思えば安かった。本当に安かった。400 W ですから。
 ヨドバシカメラに行ってみたら、400 W なんて軒並み 10 K 越えています。ポイントついている分割高とはいえ、これはいかにも高い。
 しかたない、350 W を 8K でゲットして来ました。

 電源交換したが、EPOX + Dulon 1.1 GHz でやはりだめです。
 そこで、さらに M/B を交換。これは、Grace の2代目の M/B で、ex. Morgan le Fay のものと同じ。
 やっと正常作動しました。

 推測ですが、電源がどっか逝って異常電圧が M/B を破壊したのではないでしょうか。
 それで、交換した2枚目の M/B も後を逐ったと。
 電源交換して正常復帰し、3枚目の M/B で正常作動した。そんなところか、と。

 それにしても、ex. Morgan le Fay の M/B 巻き添えを食ったのは痛かった。そのうちネットで叩き売ろうとか画策していたのに。

 現在は、Dulon 1.1 GHz で稼働中です。おそらく、CPU とメモリは大丈夫と思うので、M/B さえ調達できればまた Athlon 2100+ が使えると思います。

 まあ、安い電源酷使して朝から晩まで運転させっぱなしだったのが敗因かと。

2004/06/30へ

2004/06/26 (Saturday)
NetVaultの すごい 妨害

 実はこれ29日に書いていますがいろいろと事情がその、ごにょごにょ…

 結果から書きますと、VPNのハードが問題のようです。
 いろいろな組み合わせで実験しましたが、VPNがUSの本社と通信可能状態にあると、バックアップは例外なく失敗することが分かりました。

 中の人がどんなことをやっているのかは想像するしかありませんが、VPN越しにPDC読みに行って、そこでなにか恐ろしいことが起きているのではないかと。

 さて対策ですが。

 他に何も思いつかなかったので以下のようにしてみました。

  • ファイル・サーバの第2NICに、192.168.3.222の固定IPを付与する
  • バックアップサーバのhostsに、↑IPを記述して再起動する

 これでVPNの機能を使えるようにして試験して無事終了しました。

 まああれだ、hostsは、DNSとか試してだめだったときに最後に参照するやつだから、多分大丈夫だろうとは思っていたのですが、いざ何の問題もなく実行するとあらためてうれしかったです。

 これで、ファイル・システムのバックアップは基本的に問題ないということなので、次の段階は現在 4.3 GB のバックアップ対象を一気に 43 GB くらいにして、大容量での動作検証にはいります。

2004/06/29へ

2004/06/24 (Thursday)
NetVaultの すごい 試験

 15日のところで書いた件は、あれから延々と試験をくり返しています。

 つまり一筋縄ではいかんちうことやね。
 最初、ファイルサーバ1台とSQL-Server2台のデータ、さらにLotus NOTESのデータを計120GBばっかりバックアップサーバのハード・ディスクにため込んで、一気にテープに書きこもう、とかしていたわけですよ

  • バックアップサーバのハード・ディスク容量が足らん
  • SQL-ServerのバックアップがABEND
  • ファイルサーバのバックアップがABEND

と、これでは何一つうまくいっていないではないか状態。

 対策としては、Lotus NOTESは脱落(現状のままでローカル接続のテープ装置にバックアップ)。
 SQL-Serverは、試験していた方の環境が半壊状態(システム・ストアド・プロシージャが存在していない、とか)なので、とりあえず試験中断。
 ファイルサーバはネットワーク障害の疑いがあり、実証試験。

 というわけで、名前解決にシパーイしているのではないかと、VPN経由の本社との通信、ファイアウォール経由でのインターネットとの通信を全部切断して試験しました。
 結果、正常終了ということで、少なくともイントラネット環境ではネットワーク越しのバックアップができることは確認。

 次の段階は、VPN・ファイアウォール・ルータのどの組み合わせでエラーが発生するかを調査し、原因を究明するというもの。
 使用期間終了まで後4週間、間に合うのか乞うご期待((木玄火暴))

2004/06/26へ

2004/06/21 (Monday)
ミ田2000の すごい 認証

 カレイドスターをまた見たい(ボソッ)

 さて土曜日に友人のところで聞いた話ですが。

 ハード・ディスクを新品に交換したらミ田2000がインストールできなくなった。

 どういうことかといいますと。
 IBM のノートで、容量がきつきつになったので、大容量の純正品を調達したのだそうです。そして、もとのと交換して一からインストールしようとした。
 プロダクトID を入力すると、値が不正だ、というメッセージを表示してそこから先に進めない、というのです。
 もちろん、CD は真正の商品で、封印も初めて破ったもの。

 試しに、ミ田XPとフリーBSDをインストールしてみたそうです。
 両方とも正常にインストールできたということ。

 試しに、手持ちのミ田2000の ID を全部試した(ディーラな人なので)が、ことごとくエラーを返された。

 IBM の友人に相談したら「そんな話し、聞いたこともねえ」と笑い飛ばされた。
 修理に出そうと思うだけど、どうよ。

 というわけなので、どーせハード・ディスク交換で終わるだろうから、そのかわりにナニが原因でそうなったのかはきっちり説明してもらったらいいとか言っておきました。

 もう、ハード・ディスクのどこかに何か情報が残っているとしか思えないのですが、彼はツールを使って全部のシリンダの内容を確認したというし、もうわけ分かりません。

2004/06/24へ

2004/06/17 (Thursday)
メーラ (NC4.7)

 帰宅して Natharie のメーラを起動すると、いきなりエラーダンプをはいて即死。

 ?と再起動しても同じ。

 急ぎのメールがあったので、こんなこともあろうかと取得しておいたフリー・メールから発信して寝ました。

 翌日帰宅して Natharie のメーラを起動すると、やはりエラーダンプをはいて即死。

 しかたない、NC4.7 をさっくり削除、念の為に再起動して再インストールしました。

 まあこれで回復したわけですがあれは一体何だったのだろう…


2004/06/21へ

2004/06/15 (Tuesday)
netvalultのお手並み拝見

 Backupexec があまりに悲惨なので、別のそうとを試してみることにしました。

 Backupexec は、バックアップしたい端末のハード・ディスクにバックアップを作るときにはそこそこうまくいきましたが、ネットワーク越しにバックアップ・サーバーのハード・ディスクにバックアップを作ろうとすると、verify で失敗してしまいます。さらにひどいときにはログも残さずにジョブが消滅してしまいます。
 ローカルのハード・ディスクに作ったバックアップをネットワーク越しにバックアップ・サーバーのテープ装置に保管するのはうまくいきますが、これでは日中のネットワーク・トラフィックが増大して面白くありません。

 Veritas に電話して聞いてみたところ、そういうときにはバックアップ対象のファイル・サイズを小さくするとうまくいくことが多いという。今回、3ギガバイトで失敗するのでそれ以下にしてくれと。
 でも、SQLサーバーのデータベースは、いっこで6ギガバイトあるんですよと言ってふたりで頭抱えました。

 というわけで、BackBone の、netvault の試食版を落として来ました。

 インストールする前に、技術の人と電話で話しをして、まあぶっちゃけた話し、Backupexec ではだめとも〜風なんですわ、その点 netvault はどうよ、と聞いたわけです。netvault なら大丈夫との太鼓判をもらいましたので、明日の朝の定例バックアップは BackupExec 経由ローカルのテープ装置ではなく、netvault 経由ネットワーク越しハード・ディスク内仮想ドライブにしてみました。

 驚きの結果はCMの後…じゃねえか(^-^)\バキッ☆

2004/06/17へ

2004/06/11 (Friday)
バックアップログラムでトラブル

 もう悪魔に魅入られているみたいですが。

 バックアップそうとで、ネットワーク越しにバックアップサーバのハード・ディスクにパックアップさせようとしているのですがこれがうまくいかなくて。

 めずらしく現在進行形の報告です(ぉ

 これまで、3台のサーバのデータをそれぞれのサーバについているテープ・パックアップ装置を使ってバックアップしていました。
 しかし、一番古いファイルサーバを新しくしたときに、ファイルサーバのデータをバックアップサーバのハード・ディスクにいったんバックアップして、あらためてバックアップサーバのテープ装置を使ってバックアップしようということになりまして。
 二番目に古いアプリケーションサーバが、一番古いファイルサーバ同様青息吐息なもので。なにしろ、CPU 300 MHz、最大搭載メモリ 512 MB というビンテージ物です。スロット余っているので 640 MB にしてみたら起動しませんでしたし。
 それで、この次このサーバのデータをレストアするとしたらそれは本体のハードウェアがぶっ壊れてアプリが動かなくなるときだろう、そういうマシンに乗せている、他の機器と互換性のない (8mm) テープにデータをバックアップするのはいかがなものか、というわけで、ネットワーク越しにバックアップサーバのハードディスクにバックアップさせることにしてこの半月テストをくり返しているわけです。

 そう。くり返しているのですよ。

 うまくいかないから。

 Verify で失敗しやがるから((木玄火暴))

 スピードは格段に早いんです、テープに取るより。
 だいたい3分の2くらいの時間で終了します。
 でもデータを照合すると合わない、合わない、合わない、と。

 ネットワーク環境が悪いのか、バックアップサーバのハードディスクが悪いのか、バックアップそうとの設定が悪いのか、いろいろと試しているところです。

 サーバのローカルディスクにバックアップするとうまくいきます。
 サーバのローカルディスクからバックアップサーバのテープ装置にネットワーク越しにバックアップしてもうまくいくようです。
 ネットワーク越しだと、データの転送レートが低いといいみたいです。
 というわけで、バックアップサーバの NIC を、1000 Base TX から 100 Base TX に交換してみました。

 明日、結果を検証して対策を立てます。

2004/06/15へ

2004/06/02 (Wednesday)
ファイル鯖のあきれた仕様

 仕事先の話しですが。

 バックアップ鯖に 1000 Base-T のボードを挿して、高速にデータのやりとりをできるようにしたわけです。
 当然ながら HUB も、1000 Base-T 対応の8ポートを調達して。
 別鯖用に NIC も調達して。
 準備万端整って。

 で、時間の合間を作って各鯖からバックアップ鯖にデータをバックアップするテストをくり返しているのですが。

 一番古いファイル鯖のデータは一番新しいファイル鯖に移すから考えなくていい、と。
 二番目に古い SQL 鯖のデータは、テストの結果テープ装置に書き込む半分以下の時間でバックアップ鯖のハードディスクに書けることが判明。これなら何かトラブル呼び込むかもしれない危険を冒して 1000 Base-T の NIC と交換する必要ないんじゃないか、と。
 比較的新しい、Lotus NOTES 鯖のデータはしうまつに試験して処理時間を確認、必要があれば 1000 Base-T の NIC と交換するかも。

 で、一番新しいファイル鯖です。

 1000 Base-T の HUB に、バックアップ鯖一台しかつないでない(当然カスケードしてますが)のではかわいそう、と、ファイル鯖のケーブルをつなぎこんでみました。

 ランプが点かないよ、1000 Base の速度が出てないよ。
 ファイル鯖を再起動しました。
 結果、変らず。
 設定窓を開いて点検しました。
 トラブルはなし、というご宣託。

 たまらずメイカーのサポートに電話しました。
1000 Base-T 対応の HUB につないだのに、速度が 100 bps しか出ないのです。
型番を教えてください。
*********
調べてみます…ああ…古い型ですね…NICの速度は…10/100チャンチャン

 見積りでは10/100/1000対応型だったのです。
 納品の二日前になって営業から連絡がありました。在庫処分品を見つけた。もう少し安くできるがどうするか、と。喜んで乗りましたよ、その話し。

 こんなオチがついてくるとは。

 後ろにまわって空きスロットがないか見てみましたが、さすがに 1U、AHA39160 だけでいっぱいです。

 安物買いの銭失いとはこの事だと身にしみました。

 問題はこれをどうしたものか、ですが。

2004/06/11へ

最初に戻る
戻る