それは、今年の7月頃からであった。それまでは、ほとんど問題がなかったapp serverのLinux PCが時々ダウンするようになった。頻度は、2日から2週間ほどの間で。
おなじころ変えたものとしては、Debian Jessi -> Linux Mint 18と 2.5" HDDx2のRAID1から、SSD+2.5"HDDに変えたことくらいである。
 症状としては、ブチンと落ちて自動再起動がかかる。kernellog,syslogには、墜落寸前の記録らしきものは残っていない。

 当初は、SSD(Sandisk SSD+)が第一被疑者になったが、わからない。そもそも、SSDの寿命対策で、/var,/tmp,/homeは、HDDにおいているので、書き込みは非常に少ないはずだし。

 だが、先日、目の前で、ブチッと切れて再起動がかかった時、これは、電源の問題そうな、とひらめいた。ブチッと切れた時は、boincが走っていて、CPUとGPUを計算に使っている状態。
 電源は、ATXの250Wのものだが、たぶんこれで、+12V,+5V,+3.3V,-12Vのどれかが、不足しているんだろうと思う。

CPUはi7-3770S、GPUはNvidia GT730で、どちらかというと省電力タイプだが、最近、boincの方で、GPUを積極活用するプロジェクトがでたのか、アイドル時は、GPUもフルに使われるようになったみたいだ。そのため、時々、マージンがなくなって、電圧低下で落ちるのだろうと思う。

 あるいは、SSDへの書き込み発生時に、マージンがなくなるのか。
 そこで、やむなくATX電源を新調することにした。電源なんかは、中古で買ってもお得感がないし、国内配送料を考慮するとYオークションで、中古の選択はない。そうなると、amazonかebayだが、ebayは安いのだが、80 Plus規格にミートするものは、amazon.co.jpに負ける。よって、amazonで、80Plus適合の恵安の550Wを発注した。

 ともあれ、最近の電源は効率がいいので、600Wの電源と250Wの電源を200Wの負荷で使用しても、消費電力は、あんまり変わらない。だから、容量をけちった電源をいれても、電気代の節約は、微々たるもので、経年変化による出力劣化を考慮すると、250WのATX電源なんてのは、避けるべきだろう。

PS
 ということで、電源を大容量のものに変えたのだが、交換後の深夜の2時にクラッシュはおきた。となると、電源の問題ではないということになる。
 そこで、次の容疑者は、熱じゃないかということになったのだが、Conkyの表示や、ファンの回転音を聞いているかぎり、冷却の問題ではなさそうな。
 それで、BOINCとNVidiaのドライバーの問題らしいとわかった。BOINCのNvidia GPUを使うタスクを止めているが、半日を越えても、落ちないから。さらに調査すると、Nvidiaのドライバーの問題らしい。で、いろいろ、ドライバー更新が本家ではあるようだが、。。。。

 となると、無駄に、電源の更新に資金を投じてしまったことになる。まぁ、より静音であるのが救いではあるが。昔のドライバーでは、こういう問題はなかったのであるが。