ZFSのL2ARCについての考察

ZFSでL2ARCについての議論と実際の運用視点からの考察。 SATAのAHCIでの挙動の怪しさなど、情報としてあまりでていない部分があったので有意義なものだと思います。 ZFSのintent log(ZIL)についての考察 http://togetter.com/li/24240 続きを読む
8
TAKI, Yasushi (瀧 康史) @kohju

@mayn_lum いや、データの意味はないことはわかってますよ。突然壊れたときにちゃんと異常系処理が作られているのかの疑念を持ってるだけです。

2010-05-26 23:23:33
TAKI, Yasushi (瀧 康史) @kohju

@mayn_lum 少なくてもAHCIのディスクが刺さると、OS毎刺さることは確認済なので、OpenSolarisでAHCIにL2ARC用のSSDはつけない方が良いです。

2010-05-26 23:24:20
TAKI, Yasushi (瀧 康史) @kohju

@mayn_lum いくつかのSSDが破損時に一切のアクセスを受け付けなくなることを確認していて、かつ、これがAHCIのSATAポートに繋がったL2ARCのSSDであるなら、そこが障害ポイントになります。

2010-05-26 23:25:15
Fumiaki Tokuyama @tokuhy

@kohju そうなんですか?>L2ARCの障害。まだL2ARCが逝ったのって経験ないんですがそれは怖いですね。寿命でSSDが死んだとかポートが死んだとか関係なくですか?

2010-05-26 23:38:53
TAKI, Yasushi (瀧 康史) @kohju

@tokuhy 寿命でSSDが死ぬときの話ですよ。

2010-05-26 23:40:41
TAKI, Yasushi (瀧 康史) @kohju

@tokuhy L2ARCで使っていたSSDが寿命で死ぬ→システム全体がハングアップ です。

2010-05-26 23:41:08
TAKI, Yasushi (瀧 康史) @kohju

@tokuhy この障害時の再起動が必須になる様な機能が、果たしてDASにいるのかどうか?仮想サーバの収容などをしたら、全滅ですからね。

2010-05-26 23:41:47
TAKI, Yasushi (瀧 康史) @kohju

@tokuhy ちなみに、テストしたのはノートパソコンですから、サーバじゃないんですけどね。SATAはAHCIのものはどうも異常系が貧弱なので、間違ってもマザーボードのポートがあいてるからと言って、そこにL2ARCやZIL向けのSSDをつけない方が良いかと思ってます。僕は。

2010-05-26 23:42:50
TAKI, Yasushi (瀧 康史) @kohju

@tokuhy この類の運用のフォールトケースは滅多に出会えるものじゃないので、SDDの破壊がそろそろ来そうだな〜と思ったときに、敢えてノートにL2ARCとして付けていたのですよ。

2010-05-26 23:43:49
Fumiaki Tokuyama @tokuhy

@kohju 再現率100%なんですか?ZFSの一般的な説明だとL2ARC壊れても大丈夫ってことになってると思いますがSASでの話ってことなんでしょうか。うちなんて正に仮想サーバ動かしてるんですがw SATAではないですが。

2010-05-26 23:48:20
TAKI, Yasushi (瀧 康史) @kohju

@tokuhy そこがわからないから怖いのですよ。データ的な紛失はなさそうですよ。ただrpoolのL2ARCがはいってるディスクをがちょんと抜いたらどうなるかとか。。。

2010-05-26 23:50:17
TAKI, Yasushi (瀧 康史) @kohju

@tokuhy AHCI周りはなんか弱そうなんですけど、尻尾はつかめないんですよね。

2010-05-26 23:50:32
TAKI, Yasushi (瀧 康史) @kohju

@tokuhy 2度目のチャレンジできなかったのでw再起動したら、SSDがしんでたから。何事もなくSSDが認識せず、L2ARCがいなくなります。そこはOK.

2010-05-26 23:54:14
TAKI, Yasushi (瀧 康史) @kohju

@tokuhy こー言う話をBlogにまとめておくべきかなあ。

2010-05-26 23:54:24
Fumiaki Tokuyama @tokuhy

@kohju でもAHCI以外でもそれが発生するようだとSunのストレージも怪しくなりますよね、OpenSolarisベースだと。大丈夫だってことはSATA限定の話なのかなーとか思っちゃいますが。

2010-05-26 23:57:27
Fumiaki Tokuyama @tokuhy

@kohju 以前Sunの方がエンタープライズレベルでの検証や性能データはされるがコンシューマレベルでは追いついてないみたいなことを言われてたのを思い出しました。そういう部分に当てはまる問題なのでしょうか

2010-05-26 23:59:11
らむ @mayn_lum

@kohju @tokuhy 民生用はあきらめないのが肝心、エンタープライズ系は粘らないでさっさとあきらめるのが肝心なのです。

2010-05-27 00:01:40
らむ @mayn_lum

@kohju @tokuhy エンタープライズ系のストレージをやっていた人に以前きいたのですが、エンタープライズ系は冗長化されているのが前提なのでちょっとでも障害が発生した場合には、リトライするよりあきらめて上位のレイヤで対応するのが正しい対応方法です。

2010-05-27 00:12:11
らむ @mayn_lum

@kohju @tokuhy ところが民生用は冗長化されていないのであきらめたらデータが消えてしまうという性なので、リトライを繰り返えすようになっています。なのでリトライで帰ってこなくなってしまうと刺さってしまうのです。

2010-05-27 00:13:58
らむ @mayn_lum

@kohju なので自宅のPCにつけているHDDもエンタープライズ用をつかって最低でもRAID1

2010-05-27 00:18:14
TAKI, Yasushi (瀧 康史) @kohju

@mayn_lum そう。そこで、L2ARCをミラーにしたら、どうなるかなーってはなしになるのです。

2010-05-27 00:19:38
らむ @mayn_lum

@kohju でもL2ARCに使っているデバイスが民生用ならリトライしてさっさとあきらめないので結局駄目。

2010-05-27 00:20:33
TAKI, Yasushi (瀧 康史) @kohju

@mayn_lum と、おもうんですがね。上の層で諦めて片方のことはあきらめようという処理が入ってれば、そのまま続行出来るじゃないですか。

2010-05-27 00:21:18