コンピュータの最近のブログ記事

最近管理しているシステムで、DBのストレージがシステムボトルネックになっています。

大体、一日1~5億トランザクション、インサートが5000万行くらい発生するので、主にストレージのランダム書込がボトルネックになっている様子です。

現在はRAIDも使わず単純にHDDを単体でぶら下げているだけなので、200IOPS(IO per Second)程度しかありません。DBのInsertやUpdateはランダム書込なので、IOPSが低いと使い物になりません。

IOPSをあげるための選択肢は3つあります。

  1. より高速なHDD使い、かつ多重化(RAID)を組む
  2. 半導体ディスク(DRAM)を利用する
  3. 半導体ディスク(FLASH)を利用する

それぞれ、メリットデメリットがあります。

メディアIOPSG当たり価格信頼性
HDD RAID1,000 IOPS1000円高い
DRAM SSD2~400,000 IOPS10万円高い
Flash SSD RAIDRead 100,000
Write 10,000
3~5000円低い

選択肢1ですが、SATA HDD 1500回転の製品を使って、5~8台程度のRAIDを組んでもさほどIOPSは向上しません。(RAIDコントローラがバッテリー持っていて、Writeもキャッシュするようなストレージシステムは対象外です)

DRAM SSDは、高性能なんですが、さすがに高すぎます。いくら、1000倍の性能でても、お値段も1000倍です。また、上限サイズも限られ上位製品でも64~128GByteです。テラ単位のストレージを調達するのは現状ではかなり難しくなります。

そこで、Flash SSDでRAIDを組むという選択肢なのですが、昨年くらいまではランダム書込の性能がSATAと比べて優位性があまりなく、選択外だったのですが、ここにきて一気に性能があがってきました。

インテルの新製品X-25EですとRandom 4KB Writesで最大3,300 IOPSというスペックになっています。既存のHDDの15倍です。

SSD×8台のRAID 0デモ開始、リード860MB/s

これをみるとランダム書込で38MByteでています。9,500IOPSです。HDDのRAIDと比べて一桁良いパフォーマンスをだしています。(まあ、実際にはRAID1+0でくむ必要があるので、もう少し性能おちるでしょうが・・・) 価格性能比でみると前者2つの選択肢を圧倒します。

Flash SSDが書き込み回数寿命が短いだけでなく、過渡期の技術なので実績がほとんどありません。また、SSDを12~16台くらいつんだeSATAのエンクロージャーなど製品としてでてないので、自分で組まないといけません。となると、信頼性にどうしても疑問が残ります

あと1年くらいすれば、環境もこなれてきてサーバストレージにFlash SSDを導入する選択も自然になると予測しますが、今年度はFlash SSDのサーバへの導入は控えるべきです。

システムの本格的なリプレイスが計画にあり、それまでのつなぎにどうしてもストレージ性能を2~5倍にする必要がある場合に限り、延命のためのシステム投資としてFlash SSD RAIDを1年だけ使うというのはありかとおもいます。

 

 

 

 

 

 

仕事で検索をしようとしたらGoogleが開かない!

ルータが落ちたのかとおもって調べてみると、他のサイトは普通に接続できるのに、Googleだけがまったくなしのつぶてです。検索だけでなく、Gmailも、Google Analysisも、AdSenseもすべて動作していない・・・。

世界中にサーバを分散させているGoogleのシステムがいっせいにおちるわけはないので、DNSをnslookupで問い合わせてみると、案の定返答がない。

GoogleのDNSが落とされたようです・・・。

しかし、Google使えなくなると一気に不便になります。他の人のHP開いても、Google AnalysisやAdSenseが入っていると例外なくデータ取得のリクエストがまわりっぱまなし。

過去にもGoogleのDNSサーバが障害でおちたこともあるようですが、今日のはどうもGoogleのせいではないっぽい。

DNS関係をつかったDDos攻撃がおこっているようです。

 

 

しかし、ここまでGoogleにドップリなのも困ったもんだな。

デフラグ楽しいです。

     [゚д゚]
     /[_]ヽ 
      | |
 ■■□■■□◇_◇□□□

Gigazineさんの記事UltraDefragの紹介がありました。
Windows95の頃はボーっとデフラグの様子をみたものです。当時はHDDが500メガ程度でしたらので、しばらく待っていると完了していたのですが、昨今では500ギガが当たり前の時代です(僕のパソコンも1テラつんでいます)。とてもデフラグをまっているわけにはいきません。

そもそもデフラグって必要なんでしょうか?

初心者向けの解説本には、「デフラグさんが、分割したファイルを連結してくれます」なんて書いてあります。HDDは普通4kbyteのセクタと呼ばれる小さな箱が並べられていて、そこにデータをいれておくわけです。データファイルは4kbyte以上あるものがほとんどなので、複数の箱に入れられるのですが、これが連続した箱に入るのと飛び飛びの箱に入る場合では、データを取り出したり、書き込んだりするときの速度が違う・・・というお話です。

OSのファイルシステムドライバからみると、上記の理屈で良いのですが、物理的なHDDの挙動を考えると、多くのパソコンでデフラグなんて気休めです

連続してないセクタの読み込みのためにはHDDのヘッド(読み取り用の針)を移動させる必要があり、パフォーマンスペナルティ(針の移動時間、針の定位固定までのディスクの回転時間)が発生します。しかし、この針移動のペナルティは、データファイルが一定以上のサイズであればトラックの移動を行うので連続したファイルでも発生しています。HDDメーカの制御技術者は、このヘッドの定位の速度を上げるために血のにじむ様な努力をしています。

たとえば手元にあるHDDではシリンダ数が16383、トラックあたりのセクタ数が63なんて表示されていますが、これは論理ジオメトリで、本当のシリンダ数やセクタ数ではありません。

HGST(旧IBM)のHDDのデータシート(PDF)をみてみましょう。

そりゃ、ディスクの内側と外側で、円周違うんだから、セクタ数かわりますよね。

この資料をみると、最低の1シリンダあたりのセクタ数でも250ギガモデルでは2520個、つまり約12MByte程度です。ディスクヘッドは複数あっても、並列にデータの読み出しはできないので、ヘッドの移動無く読み込めるデータファイルは現状では十数MByteくらいです。

用途にもよりますが、メガ単位のファイルは2、3個に分割されていたところで、読み込みパフォーマンスのペナルティは気にするところではないと思います。むしろ、パフォーマンスに影響があるのは数キロ程度の小さいファイルがプログラムの読み出し実行順序に並んでいるほうがパフォーマンスに効いてきます。

下手なデフラグソフトを使うと、せっかくWindowsが最適配置してあるDLL群のアロケーションを壊します。結果としてデフラグをしたほうが遅くなるということもありえます。

 

それでも、こんな風に赤い線が混じっていると、全部青くしたくなるのが人情です。

そんな人たち(含む私)はデフラグ潔癖症候群に陥っているのだとおもいます。

そんな方はWikipediaでも読んで、HDDへの愛を深めてください。

Let's Note 9時間

| | コメント(0)

Let's Noteのレビュー


【Let'snote R3ベンチマークテスト】


 Let'snote R3dynabook SS SX/210LNLWLaVie J LJ700/7E
CPU超低電圧版Pentium M 1.10GHz超低電圧版Pentium M 1GHz超低電圧版Pentium M 1GHz
ビデオチップIntel 855GME内蔵コアIntel 855GM内蔵コアMOBILITY RADEON 7500
MobileMark2002
Performance rating134130132
Battery life rating425218178
SYSmark 2002
Internet Content Creation138127127
Office Productivity121108110
3DMark2001 SE
1,024×768ドット32bitカラー(3Dmarks)1,8501,7244,095
Quake III Arena
640×480ドット32bitカラー93.890.3154.8
800×600ドット32bitカラー70.155117.6
1,024×768ドット32bitカラー44.644.478.3

Let'snote R3におけるMoblieMark2002のPerfomance ratingは134で、このクラスのモバイルノートPCとしては標準的なスコアだが、バッテリ駆動時間を表すBattery life ratingは425と、dynabook SSやLaVie Jの2~3倍ものスコアを記録している。425ということは実に7時間5分であり、これまでの常識を破る長時間駆動を実現している。

もはや、バッテリーと重量以外のパフォーマンスはあまり重要ではないことがはっきりわかる。
ではなぜ他社はPanasonicと同じ商品戦略をとらないのでしょうか?
戦略要因、技術要因、企画要因の3つの理由が考えられます。

1、コンシューマ向けの主力はTVのリプレイス。もしくはコンシューマPCは利益率が悪いので、注力しない。
2、部品の組み立てだけで商品をつくっているので、Panasonicのように自社で部品開発できない。もしくはOEMに頼りすぎてOEMの技術力不足で実現できない。
3、技術職の発言力が大きく、企画部門の統率力が低い。

原因が1であれば問題ないのですが、原因が2や3にあるならばPCベンダーは反省が必要ですね。特に消費電力を抑えるためには、モジュールごとにキメの細かい調整が必要です。このあたりは家電メーカならではの強みがでています。コンデンサ一個、DCDC一個とっても、どの製品が効率がいいか熟知しているエンジニアがいるんでしょうね。

Gmailの実験で上限を1テラバイトに


デトロイトに住むRajiv VyasというGmailユーザーは、同サービスを使い始めて約1カ月になる。今回上限が引き上げられたことについて同氏は非常に驚かされたという。「これはすごい。ただし、自分はこれだけ多くのストレージをどう使っていいかはわからない」と同氏は述べ、さらに「将来的には、すべての写真を保存できるだけでなく、自分のデスクトップPCのなかにあるファイルも全部とっておけるので役に立つだろう。1テラバイトといえば、私が仕事場や自宅で使っているPC(のハードディスク)の10倍だ」と付け加えた。

1Gじゃ真似されるんで、1Tやってみちゃいましたか?
いまやHDDのコストは1GByte60円くらい。バックアップをふくめてストレージシステムを構築しても300円くらいかな。確かに他社でも簡単とは言わないけど、模倣できてしまうんだよね。
これが1Tとなると一人当たり30万円程度のコストになりかねないため、簡単には模倣できなくなります。

しかし、思惑はそれだけではないでしょう。CNetのインタビューにあるように1TByteになるど、どうつかっていいかわからない・・・つまり、1Tも使えないんだよね。最近は大量にHDDを購入する人もいるけど、そういう人はたいていCDをMP3に変換したり、テレビを保存したりしていて、わざわざG-Mailに保存するほどのものでもないし、著作権問題がきになるでしょう。
まあ、デジカメの写真くらいだったら数十GByteあれば十分・・・そういう打算がテラバイトの裏にはあるようにおもえます。
GMail

Eclipseプラグイン

| | コメント(0)

最近Eclipseユーザになってしまった。
プラグインとか、つくってみちゃおうかなんて思ってしまってる。
しかも、ちょこちょこっと簡単につくろうかと思ってるのだが・・・意外と敷居が高い。
まずは情報収集!

第8回 Eclipseプラグインを作る(1)
Eclipseプラグイン開発自分FAQ
SWTサンプル集
Developer Works
Eclipse プラグインの開発

コネタ

全部みる

このアーカイブについて

このページには、過去に書かれたブログ記事のうちコンピュータカテゴリに属しているものが含まれています。

次のカテゴリはBLOGです。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

コンピュータ: 月別アーカイブ