#topicpath
-----
#contents

* 2011/10/25(JST) shooting subref trouble? [#m3798bdc]
- reported by T. Sakai
- T.Oshima, T.Tsukagoshi, T. Minamidani, T.Sakai, S. Takahashi, J. Maekawa

** 現象 [#id077ee3]
- [aste-unyo 8692]
-副鏡をPROGにすることができず、telnet antgsub1で入れない状況です。(アンテナ本体は動かせます)
-telnet antgsub1 50001では入れてステータスも見れるのですが、サーボはOFFになっていて、ONに出来ない状況です。(ちなみにステータスはDSA0000000000000です)

** telnet で副鏡PC(antgsub1)に入れない問題 [#h6d8f1a9]
- telnet で副鏡PC(antgsub1)に入っているプロセスがあったので kill した
~==> 副鏡PC との通信(telnet)は可能になった。

** 副鏡のサーボアンプが servo ON にならない問題 [#w23f615b]
- cosmos を stop all した上で副鏡PC上で servo on すると on になった。
~ (基本的に副鏡PC上での操作時は、副鏡のプロセス pcvs を止めておく必要がある)
- そこで、cosmos を start all する
-- しかし、アンテナコンソールで副鏡が PROG にならない。
-- 他にも、
--- chopper 振り角に 0.094 と出たり、
--- 副鏡の位置が以下のように、ゼロから大きくずれたまま
 -> poscur
 jnt:(364.293 358.705 360.369 359.266 357.245 366.222 )
 pos:(-15.1022 3.6740 0.8926 0.1642 1.2908 0.5598 )
 value = 2 = 0x2
 -> enccur
 jack:(1457174 1434819 1441476 1437064 1428981 1464887 )
 chop:(-29 -1 -2 155 116 0 )
 value = 2 = 0x2

- 副鏡のstatus 確認(CSTU)
-- servo off になっていた
-- cosmos start all するとサーボアンプが勝手に servo off になることが判明。
- サーボアンプの不具合かを切り分けるため、
-- telnet antgsub1 50001 で servo on(CSON) して30分以上放置。
-- しかし、勝手に servo off されることはなかった。
-- また、副鏡PCへの telnet も問題なく、antgsub1(VxWorks) でも通信タスクが見られている。
-- 従って、サーボアンプや副鏡PCとの通信の不具合ということは考えにくい。
-- ==> つまり、残るは cosmos 起動時に何らかの理由で servo off になる。

- 次の容疑者は、aste-2c
-- 最近不具合があった 
-- 主鏡や副鏡の制御のための pcvm(mainref), pcvs(subref) の親プロセスの pcv が走っている
-- dmesg を見ると以下の様に色々なポートの通信がこけている(具体的になにかはわからないが。。)
 aste-2c sshd[?????]: error: connect_to aste-2c port 9402: failed.
 port は、9103, 9303, 9401, 9402, 9412, 9421
-- ==> cosmos stop all し aste-2c を reboot してみる

- telnet antgsub1 50001 で servo on (CSON)
 DSA000080C000000 -> servo on できる
- cosmos start all
- 副鏡との通信部分(pcvs)のみを off にして CSTU
 DSA0000000000000 -> servo off になっていた。。
- telnet antgsub1 50001 で servo on (CSON)
 DSA000080C000000 -> servo on できた
- 副鏡との通信部分(pcvs)を on に戻した
-- ==> アンテナコンソールで PROG にできた!
- pcvs off にして CSTU
 DSA000080C000000 -> servo on のまま!
- エンコーダー値の確認
-- 全て(pos,chop)がゼロ(基準位置)に戻っている
 -> poscur
 jnt:(361.546 361.546 361.546 361.546 361.546 361.546 )
 pos:(-0.0003 0.0000 0.0001 0.0000 0.0000 0.0000 )
 value = 2 = 0x2
 -> enccur
 jack:(1446184 1446183 1446184 1446184 1446183 1446184 )
 chop:(0 0 0 0 0 0 )
 value = 2 = 0x2

- あとは、pcvs on に戻して観測可能な状態になった。



** 前川さんに伺った制御の流れ [#z462b1c3]
mainref, subref のシグナルの流れは、
+ aste-1c が mainref, subref と通信し、shared memory に格納
+ aste-1c の shared memory を aste-2c に渡す
+ aste-2c が全 shared memory を集約し、各サイトに配信
+ また、aste-2c の shared memory を参照して各制御はなされる
+ あと、aste-2c を reboot すると、aste-2c との通信を確立し直すので、
実質 aste-1c と aste-2c 間の通信を再起動したに等しいことになる。

** 原因はなんだったのか? [#ac62efb3]
- 結論は pcvs の中身を見てみないと断定はできないが、
-- telnet antgsub1 の通信は問題なくできている
-- ==> aste-1c or aste-2c の share memory 周り(通信、メモリ、HDD?)の線に絞られる
-- しかも、aste-2c の reboot だけでは改善せず、その後の pcvs off/on で直ったことから
-- ==> aste-1c と aste-2c の shared memory の通信が濃厚と考えられる

- aste-1c or aste-2c のどちら側が原因にせよ、
-- shared memory に不適切な値(例えば範囲外??)が格納されれば、副鏡サーボアンプを servo off し得る仕様なのか??

- 他に疑われたが無実だったこと
-- aste-2c が 内蔵HDDで起動しているので一見正常に見えるが実はまともに動いていない?(過去に同様の例があった)
-- ==> ssh login で key が合わないのでパスワードを聞かれるはず。しかし聞かれなかった。

** A/I [#o2dea4ce]
+ いずれにせよ挙動の怪しい aste-2c はバックアップを取っておく(塚越さん)
+ aste-1c のログを調査(前川さん)
+ cosmos stop all すると、副鏡位置は STD(基準位置)に戻るはずだったような気がするが戻っていないのはなぜ?(前川さん)


Front page   Edit Diff History Attach Copy Rename Reload   New Page list Search Recent changes   Help   RSS of recent changes