ZFSのL2ARCについての考察
@mayn_lum いや、データの意味はないことはわかってますよ。突然壊れたときにちゃんと異常系処理が作られているのかの疑念を持ってるだけです。
2010-05-26 23:23:33@mayn_lum 少なくてもAHCIのディスクが刺さると、OS毎刺さることは確認済なので、OpenSolarisでAHCIにL2ARC用のSSDはつけない方が良いです。
2010-05-26 23:24:20@mayn_lum いくつかのSSDが破損時に一切のアクセスを受け付けなくなることを確認していて、かつ、これがAHCIのSATAポートに繋がったL2ARCのSSDであるなら、そこが障害ポイントになります。
2010-05-26 23:25:15@kohju そうなんですか?>L2ARCの障害。まだL2ARCが逝ったのって経験ないんですがそれは怖いですね。寿命でSSDが死んだとかポートが死んだとか関係なくですか?
2010-05-26 23:38:53@tokuhy この障害時の再起動が必須になる様な機能が、果たしてDASにいるのかどうか?仮想サーバの収容などをしたら、全滅ですからね。
2010-05-26 23:41:47@tokuhy ちなみに、テストしたのはノートパソコンですから、サーバじゃないんですけどね。SATAはAHCIのものはどうも異常系が貧弱なので、間違ってもマザーボードのポートがあいてるからと言って、そこにL2ARCやZIL向けのSSDをつけない方が良いかと思ってます。僕は。
2010-05-26 23:42:50@tokuhy この類の運用のフォールトケースは滅多に出会えるものじゃないので、SDDの破壊がそろそろ来そうだな〜と思ったときに、敢えてノートにL2ARCとして付けていたのですよ。
2010-05-26 23:43:49@kohju 再現率100%なんですか?ZFSの一般的な説明だとL2ARC壊れても大丈夫ってことになってると思いますがSASでの話ってことなんでしょうか。うちなんて正に仮想サーバ動かしてるんですがw SATAではないですが。
2010-05-26 23:48:20@tokuhy そこがわからないから怖いのですよ。データ的な紛失はなさそうですよ。ただrpoolのL2ARCがはいってるディスクをがちょんと抜いたらどうなるかとか。。。
2010-05-26 23:50:17@tokuhy 2度目のチャレンジできなかったのでw再起動したら、SSDがしんでたから。何事もなくSSDが認識せず、L2ARCがいなくなります。そこはOK.
2010-05-26 23:54:14@kohju でもAHCI以外でもそれが発生するようだとSunのストレージも怪しくなりますよね、OpenSolarisベースだと。大丈夫だってことはSATA限定の話なのかなーとか思っちゃいますが。
2010-05-26 23:57:27@kohju 以前Sunの方がエンタープライズレベルでの検証や性能データはされるがコンシューマレベルでは追いついてないみたいなことを言われてたのを思い出しました。そういう部分に当てはまる問題なのでしょうか
2010-05-26 23:59:11@kohju @tokuhy エンタープライズ系のストレージをやっていた人に以前きいたのですが、エンタープライズ系は冗長化されているのが前提なのでちょっとでも障害が発生した場合には、リトライするよりあきらめて上位のレイヤで対応するのが正しい対応方法です。
2010-05-27 00:12:11@kohju @tokuhy ところが民生用は冗長化されていないのであきらめたらデータが消えてしまうという性なので、リトライを繰り返えすようになっています。なのでリトライで帰ってこなくなってしまうと刺さってしまうのです。
2010-05-27 00:13:58@mayn_lum と、おもうんですがね。上の層で諦めて片方のことはあきらめようという処理が入ってれば、そのまま続行出来るじゃないですか。
2010-05-27 00:21:18