- このページの使い方
- 全員でトラブル症状とその対処法を共有するページです。
- 観測中にトラブルが生じた場合に、その対処法を記述してください。
- 観測ログのcopy and pasteでokです。
- 変更履歴
- 29-Aug-09 - T.Tosaki & Y.Tamura - created.
- 12-Apr-10 - BH - modified
- 11-Apr-11 - YO & YT - added FAQ.
- 19-Apr-11 - YS - added FAQ.
- 19-Apr-11 - YS - added Link.
その他トラブル対応等が載っているHPのリンク等†
http://aste-www.mtk.nao.ac.jp/asteobs/rmt/rmt01.html
記入例†
- 2009/08/03 06:58 UT aspmon上のweather timeが停止している (UT05:42頃停止)。
下記の手順で対処。
- aste-v1cのCOSMOSの再起動。
asteobs@aste-v1c % sudo /cosmos3/aste/nro/sbin/cos3_cntl restart
しばらくすると、restart実行画面に以下のメッセージが繰り返されながら表示された。
accept : socket =5accept : socket =5
cnnect aste-mtla:22
fork :11867
fork :11867
client loop end : precv(2)
killng pid+ 11662
WARNING shm_cadac:Error in cadad_read_data():skip okと表示される。
- aste-1cにおけるastnrodの再起動 (by YT) --> 約5分後weather timeが復帰した。
root@aste-1c # /cosmos3/aste/nro/rc3.d/S99astnrod stop
root@aste-1c # /cosmos3/aste/nro/rc3.d/S99astnrod start
トラブル内容とその対処法†
2009/09/02 04:55 UT 通信トラブル†
- 現象
"E018:Connection refused to server process" とpop-up windowが出で、priorityが??と表示された。
数分待つとcos3launcher.tclのpriorityがMTKになったが
Antenna main、Antenna Console、Antenna Offset、Subref Offsetのパネルではpriorityは取れていない。
- 下記の手順で対処。
-とりあえず風が強いのでantenna consoleのpriorityを取得してSTBYへ
-他のpriorityも取得
-autopとQLOOKの起動
-ALL PROGにして再び観測開始
※QLOOKの表示エラーもトラブルシューティングにて対応。
- reference)
トラブルシューティング
2009/09/02 22:51 weather time on Asp. Mon. disrupted†
- set the antenna control to STBY.
- restart COSMOS on aste-v1c, and wait for ~ 5 min. --> doesn't work!
asteobs@aste-v1c % sudo /cosmos3/aste/nro/sbin/cos3_cntl restart
- restart astnrod on aste-1c, and wait for ~5 min. --> the weather time is now recovered!
root@aste-1c # /cosmos3/aste/nro/rc3.d/S99astnrod stop
root@aste-1c # /cosmos3/aste/nro/rc3.d/S99astnrod start
2009/09/02 23:08-23:12 UT ASPIRIN has NOT worked.†
- obstable: aste09/sbrf09/jpsbc3.list
- batch for subref position measurements
- note:
- restart COSMOS.
- set the antenna control to STBY.
- restart COSMOS on aste-v1c, and wait for ~ 5 min. --> doesn't work!
asteobs@aste-v1c % sudo /cosmos3/aste/nro/sbin/cos3_cntl restart
- restart COSMOS on aste-1s.
asteobs@aste-1s% /opt/sudo/bin/sudo /cosmos3/aste/nro/sbin/cos3_cntl restart all
- Okay, aspirin now comes back!! move on to pointing...
2009/09/03 23:47 UT QLOOKトラブル†
2010/04/12 04:20 UT aste-c1c トラブル†
- 遠隔でのaste-c1cの電源on/off
- ターミナル二つ用意
- tslinuxにログイン
- 6番aste-c1cを選択
- コンソールでokプロンプトが出ていないのを確認
- okプロンプトやaste-c1c login:と出ている場合は以下は必要無し
- もうひとつのターミナルでaste-3cとかに入る
- 以下を実行
/cosmos3/aste/nro/sbin/tap_sw lantap0 1 off
/cosmos3/aste/nro/sbin/tap_sw lantap0 1 on
- 実行すると電源が入るので、tslinuxの画面で起動しているかどうか確認する
- 起動するとaste-c1c console login:になるので、これで起動したことになる
2010/04 COSMOS GUIで指示書が表示されない†
- 現象
COSMOS GUIのListボタンを押しても、本来あるはずの指示書が表示されない。
- 対処
- COSMOS GUIのプライオリティを解除し、ウィンドウを閉じる(右上の×ボタン)
- ランチャーから再度立ち上げる
2010/05/10 ``ERR CONT(911) Internal error (Semaphore)''†
- COSMOS restart や DASBOX restart では改善せず
- 対処
- aste-2c reboot
- 共有メモリのアクセスが出来なくなっていたことが原因
2010/09/28 It cannot get "time", even though I restarted cosmos@aste-1s†
- 現象
- doesn't get the time in Antenna Console
- doesn't get the aspirin time
- doesn't get the weather info in Environment Monitor
- even though I restarted cosmos@aste-mt2, it never go well..
- 対処
- aste-mt2 reboot itself ( ask administrators! )
2010/10/05 iOPT が bus error で動かない場合†
2010/10/14 Connection trouble to aste-2c†
- 対処
- aste-2c reboot (以下手順)
- aste-3c へログイン
- aste-3c からコンソールにログイン
> ssh 192.168.11.9 -l asteobs
- 「3」を選んで「halt」でaste-2cにログイン(※pwについては、誰かに聞く)
Serial Console Server Connection Menu for your Master Terminal Server
1 aste-1s 2 aste-1c 3 aste-2c 4 aste-3c
5 aste-v1c 6 aste-c1c 7 aste-r1c 8 ttyS8
Type 'q' to quit, a valid option[1-8], or anything else to refresh :
- aste-2cをreboot
- aste-1s cosmos restart (以下手順)
2011/04/08 ERR trk0002e trk_00 Can't read TIME/EPH file !†
- 原因
- time.dat or eph.dat か両方ともに更新されていない
- TIMEファイル(UT1とUT0のずれを書いたファイル): /cosmos3/aste/etc/time.dat
- EPHEMERISファイル: /cosmos3/aste/etc/eph.dat
- 対処
- tail time.dat などでそのファイルの有効期限を確認する
- 調査結果を aste-comp へ連絡して更新してもらう
2011/04/14 MATLABのライセンスサーバが落ちる (aste-mx2)†
2011/04/18 サンペドロ-山頂間の通信トラブル by Y.S.†
- 症状
- NROから観測時(または観測前)にアンテナコンソールの表示がすべてゼロになったり、env.モニター等が表示されなくなる。この際、ランチャーのステータスはIDLEと!!!をいったりきたりしている。
- pingはネットワーク疎通を確認したいホストに対してIPパケットを発行し、そのパケットが正しく届いて返答が行われるかを確認するためのコマンド
2011/04/18 サンペドロ-山頂間の通信トラブル回復後のcosmosの復帰 by Y.S.†
- 症状
- 上記、サンペドロー山頂間の通信が回復しても(つまり、サンペドロから山頂マシンにsshで入れる状態になった)、NROでのアンテナコンソール等の表示が回復しない。
- 対処方法
- cosmosの再起動。それでもだめなら、cosmosの通信の再起動。
2011/4/18 コスモスの再起動をいくら行ってもcosmosが復帰しない@NRO by Y.S.†
- 2011年度シーズンはこの現象が頻発する可能性あり
- 症状
- 山頂までにssh等で入れて通信が復帰していることを確認後、cosmosの再起動をかけても、アンテナコンソール、envモニター等の情報が更新されない。また、さらに、調べてみると三鷹(aste-mt2)までは通常通り復帰している。
- 具体的に症状を確認する方法(もっと簡単or賢い方法をあれば、修正お願いします)
- 原因
- 三鷹ではCOSMOSが正常だけど、三鷹での共有メモリの情報がせき止められて、下流の野辺山に必要な情報が行かなくなっていた。
- 基本的に上流を再起動したら、下流も再起動していった方がよい。具体的には山頂→サンペドロ→三鷹→野辺山の順番で。
2011/4/19 autopが起動中にも関わらず、結果が反映されない。†
- 症状
- autopを起動し、subref測定を連続波で行ったところ、5"以上のoffsetがあるにも関わらず、offsetが入らずautopの結果が反映されない。autopを実行した端末上にはoffsetを計算した結果が表示されているので、autopはちゃんと働いている模様。また、anntena offsetのwindowを見ても、ddAz, ssELは全く入らなかった。
- 対処方法
- NROのcosmosおよび通信を再起動して改善されず、山頂の全マシンのリブートをaste-1s上で行ったが改善されなかった。この後、下流のcosmosの再起動をする必要があったかも。なにはともあれ、次の日の測定では通常通り、autopは働いていた。回復した理由は今のところ不明である。
- とりあえず、手動でoffsetを入れることで測定を続けた。
2011/4/19 サブレフ測定のデータ解析時のアンテナログファイルの破損†
- 症状
- サブレフ測定のデータ解析(subred_redux)を行なっていたところ、アンテナログファイル(real*****)が壊れていたため、解析時アンテナログファイルをうまく読み込む事が出来ず、解析プログラムが落ちた。
- アンテナログファイルの中身を見ると通常は数字の羅列だが、今回は@マークの羅列になっていた。
また、おそらく、データファイルの重さも正常なデータと比べて軽くなっていると思われる。
- 対処方法
- 3、4カ所を経由してaste-1cからアンテナログファイルをコピーしているので、どこでアンテナログファイルが破損しているかをチェックし、生き残っているところから、再度コピーして解析を行なう事で無事解析が通った。
2011/4/21 point_reduxを実行すると指示していないファイルを読み込みにいってしまう。†
- 症状
- stx5cc8.startのテーブルで観測をしたデータを解析しているにも関わらず、ijpx5b8.startのファイルがないとおこられる。
2011.4.22 Cosmos Manager GUIにてobs tableがないとおこられる。†
- 症状
- テーブルを選んで観測を実行すると、COSMOS MANAGER GUIでobs tableがないと怒られる。
- 対処方法
- ローカルで立ち上げているCOSMOS,アンテナコンソール等(ランチャー含む)を全て落として、ランチャーを立ち上げ直す事で復帰した。
2011.4.30 START TUNINGするとERR IF_CNTL (1) Error 0 (255)が出る by Y.W.†
- 症状
- START TUNINGを実行すると、'ERR IF_CNTL (1) Error 0 (255)'とCOSMOSに表示されて停止する。COSMOSのログには赤いエラーで、
110430070458 RXT: 161 217 ERR TF_CNTL (1)
と表示され、aste-3c上で
[aste-3c]$ tail -f /log/3/mess
というコマンドで、/log/3/messというログを見ると、
Apr 30 05:23:40 aste-3c astrxtd: swbox_ctl_eo 1 1
Apr 30 05:23:40 aste-3c astrxtd: swbox_ctl_eo(-1): argument name error:Error 0
Apr 30 05:23:40 aste-3c astrxtd: sp_sub_start(error) :: swbox_ctl_eo 1 1:swbox_ctl_eo(-1): argument name error: Error 0 (255)
Apr 30 05:23:40 aste-3c astrxtd: script: stop : 1
Apr 30 05:23:40 aste-3c astrxtd: error in startup script
というエラーが出ている。
- 原因
- 上のログを見ると、'swbox_ctl_eo'というコマンドで、USBとLSBを同時にEOの1番に入れようとしているために起きている。
- RXTスクリプトのバグらしい([aste-unyo 8055])。
- 対処方法
- 既に対処済みなのでもうこのエラーは出ないと期待される