-このページの使い方 --''全員でトラブル症状とその対処法を共有するページです。'' --''観測中にトラブルが生じた場合に、その対処法を記述してください''。 --''観測ログのcopy and pasteでokです''。 --''左の検索フォームやブラウザの検索機能でエラーメッセージなどの検索を行うと便利です''。 -変更履歴 --29-Aug-09 - TT & YT - created. --12-Apr-10 - BH - modified --11-Apr-11 - YO & YT - added FAQ. --19-Apr-11 - YS - added FAQ. --19-Apr-11 - YS - added Link. --19-May-16 - YT - refreshed for Linux-COSMOS (moved old info to [[Troubleshoot/Troubleshoot2009-2014]]). ---- - FAQ --[[COSMOSリスタートのショートカット>UsefulShortcuts]] --[[ASPIRINリスタートのショートカット>UsefulShortcuts]] --[[WeatherTime/Envmonリスタートのショートカット>UsefulShortcuts]] --[[通信エラーに関するもの>Troubleshoot/cosmos3_connection_error]] --[[2015年以前のトラブルシュートを見たい。(search in Troubleshooting made in 2009-2014 with old Solaris system )>Troubleshoot/Troubleshoot2009-2014]] --[[他に過去の事例を探す当てはないのか?(search in aste-unyo ML archive)>aste-unyo_archive:FrontPage]] -目次 #contents ---- //**その他トラブル対応等が載っているHPのリンク等 //http://aste-www.mtk.nao.ac.jp/asteobs/rmt/rmt01.html **記入例 [#mbfc9109] - 時刻(UTC)、タイトル、報告者、症状、(もしわかれば)障害の原因、行った対処方法について記述してください。 - その他、[[2015年以前の事例>Troubleshoot/Troubleshoot2009-2014]] も参考にしてください。 *** 2009/08/03 06:58 (UTC) aspmon上のweather timeが停止 [#lc9dbecd] - 報告者:田村 - 症状 -- &color(red,white){aspmon上のweather timeが停止している (UT05:42頃停止)。}; - 対処方法 ++aste-v1cのCOSMOSの再起動。 asteobs@aste-v1c % sudo /cosmos3/aste/nro/sbin/cos3_cntl restart しばらくすると、restart実行画面に以下のメッセージが繰り返されながら表示された。 // accept : socket =5accept : socket =5 cnnect aste-mtla:22 fork :11867 fork :11867 client loop end : precv(2) killng pid+ 11662 WARNING shm_cadac:Error in cadad_read_data():skip okと表示される。 ++aste-1cにおけるastnrodの再起動 (by YT) --> 約5分後weather timeが復帰した。 root@aste-1c # /cosmos3/aste/nro/rc3.d/S99astnrod stop root@aste-1c # /cosmos3/aste/nro/rc3.d/S99astnrod start // ----------- 以下、テンプレートとしてご利用ください。 -------------- // //*** 2016/5/19 XX:XX (UTC) (日時とタイトル) //- 報告者:(報告者名) //- 症状 //-- (詳細な症状をここに記載) //- 原因 //-- (もしわかれば症状の原因をここに記載) //- 対処方法 //++(手順1・使用したコマンドを含めた具体的な対処方法をここに記載) //++(手順2・使用したコマンドを含めた具体的な対処方法をここに記載) //- 参考 //-- (参考にしたページやMLの番号などを記載) **トラブル内容とその対処法 [#v23139cb] // ----------- 以下にトラブル内容とその対処法をメモしてください。 -------------- // *** 2016/5/20 03:00 UTC 頃 - COSMOS トラブル [#z2a03623] - 症状 -- 観測開始前に、三鷹COSMOSの山頂への通信が切断されていた。 -- cos3launcher がハングしており、cos3launcher を起動したターミナルで以下のエラーメッセージが延々と流れていた。 (on aste-mt1 window where cos3launcher was called) getshm: Communication error. getshm: Communication error. getshm: Communication error. : -- 山頂/三鷹 COSMOS 再起動後にも、気象モニタ・aspirin が動作していなかった。 - 原因: -- 三鷹-山頂の通信、山頂 COSMOS の障害 - 対処 + COSMOS (ASTE) のリスタート asteobs@aste-mx1$ ssh -t aste-1c "sudo /cosmos3/naoj/sbin/cos3_cntl restart all" + COSMOS (MTK) のリスタート asteobs@aste-mx1$ ssh -t aste-mt1 "sudo /cosmos3/naoj/sbin/cos3_cntl restart" + weather daemon リスタート asteobs@aste-mx1$ ssh aste-v1c "/opt/sudo/bin/sudo /cosmos3/naoj/rc3.d/S99astnaojd stop; nohup /opt/sudo/bin/sudo /cosmos3/naoj/rc3.d/S99astnaojd start" + Aspirin リスタート。リスタートのコマンド実行、5分待機、治らなければ再度コマンド実行を、治るまで繰り返し粘る。 asteobs@aste-mx1$ ssh -t aste-1c "sudo /cosmos3/naoj/rc3.d/S99astnaojd stop; nohup sudo /cosmos3/naoj/rc3.d/S99astnaojd start" + aspirin blue スタート。 asteobs@aste-mx1$ssh aste-1c "/cosmos3/naoj/bin/windsw on" *** 2016/5/23 07:00 UTC 頃 - COSMOS lissajous scanトラブル [#df84949e] - 症状 -- lissajous scanの指示書(mars_azel_lissajous_240_v****)を流すと、観測開始から1分後くらいでerrorが出て観測が停止する。 -- その際、ERR calculation error of lissajous scan というメッセージがCOSMOSに表示される。 -- 現時点で原因・対処法は不明。数字の大きい指示書ほど成功率が低い(v1800は5回以上挑戦して全敗) -- また、これによって異常終了が起こると、そのときのprocessがzombieとなる。 -- そのまま次の観測を実行すると、process checkではpidが二行に渡って表示され、NGが出る。 -- そのため、zombieとなったprocessをkillしてやる必要がある。 *** 2016/5/31 01:00 UTC 頃 - 副鏡トラブル / subref trouble [#sf526961] - 報告者:梅畑、竹腰、河野、田村 - 症状: --still_az180_el60_t600.start -- アンテナコンソールで、副鏡の制御 [MAN]->[PROG] の切り替えができない。 -- しかし、主鏡 (az, el) については制御可能。時計も動いていたため、三鷹-山頂間の通信障害ではない。 -- antgsub1 への telnet 通信は可能な状態。 - 対処 -- 山頂 COSMOS restart -> 三鷹 COSMOS restart (see [[UsefulShortcuts]]) - 参考 -- 副鏡制御 PC へのログイン方法。今回は、ログインが可能な状態であり、CSTU コマンドにより、正常なレスポンス (DSA0010008000000) を得ることができた。 asteobs@aste-1c $ telnet antgsub1 50001 Trying 192.168.2.2... Connected to antgsub1. Escape character is '^]'. CSTU DSA0010008000000 -- %%telnet ログインも不可能な場合は、過去の troubleshoot (http://www2.nao.ac.jp/~aste-www/obslog_wiki/pukiwiki/index.php?Troubleshoot%2FTroubleshoot2009-2014#g0dee5c9) を参照。%% -- (2016-06-02 鎌﨑) 以下の情報を取得した後、山頂COSMOS3の再起動を試して下さい。再起動で復旧しない場合、(副鏡動作が必要な)観測・測定は中止し、現地関係者に障害調査を依頼して下さい。 - アンテナコンソールのスクリーンショット - subrefmon(asteobs@{aste-1c,aste-mt1,aste-at1}:/home/cosmos3/naoj/bin/subrefmon.py)のスクリーンショット &br; antgsub1を再起動した場合、副鏡の原点出しが必要になります。現在の手順では、この作業に山頂での副鏡状態の確認が必要となります。よって、lantapによるantgsub1再起動により副鏡動作が復活してもその原点出しを行う事ができないので、使用可能状態にまで復旧させる事はできません。 *** 2016/5/31 01:30 UTC 頃 - アンテナ制御トラブル [#c84c3459] - 症状: -- 観測指示書を開始しても、望遠鏡が駆動しない。 -- 指示書:still_az180_el60_t600.start, skydip_az180_el60_mp10_v900.start -- アンテナ LC が "NO RESPONSE" 状態。 - 対処 -- 山頂 COSMOS restart -> 三鷹 COSMOS restart (see [[UsefulShortcuts]])