iperfのベンチマーク結果を更新しました。

以前掲載したWC1(SSD有)、WC1(SSD無)、WC2(SSD有)、WC2(SSD無)のiperfの結果を、宛先をNTP1にして再計測しました。その結果を過去のブログに掲載しています。

これは、iperfはVPN1に向けてベンチマーク結果を取得しているのですが、全ての数値が500Mbps前後で、e1000eと大きな差が出なかったからです。VPN1はWindows8.1Proのためかもしれません。このため、Ubuntu 14.04のNTP1サーバに向き先を変更しました。今後はNTP1をネットワーク速度計測に使用します。

Windows8、8.1へのインストールDiskからの.Net Framework 3.5のインストール補足

Windows 8 または 8.1 への .NET Framework 3.5 のインストール

MSDNに記載がありますが、補足します。

DドライブがインストールDiskの場合、以下を実行します。

DISM /Online /Enable-Feature /FeatureName:NetFx3 /All /LimitAccess /Source:d:\sources\sxs

このコマンドを実行するためには、以下の条件があるため、注意が必要です。

(1)DOSプロンプトは管理者として実行したものを使用する必要があります。

管理者のDOSプロンプトではない場合、コマンド実行に失敗します。

(2)実行するOSが64ビットの場合、実行するディレクトリは「C:\Windows\system32」である必要があります。

DISMコマンドは64ビット版と、32ビット版があり、32ビット版はC:\Windows\SysWOW64配下にあります。実行時のディレクトリやパス構成の都合で32ビット版を実行してしまった場合、以下のメッセージが表示されてインストールできません。その場合、ディレクトリをC:\Windows\system32に移動後コマンドを実行する必要があります。

32 ビット バージョンの DISM は、実行中の 64 ビットのオペレーティング システムをサービスできません。
お使いのコンピューターのアーキテクチャに合ったバージョンの DISM を使用してください。

(3)インストール後は必ずWindows Updateを行ってください。

.NET Framework3.5は多数の脆弱性がありますので、インストール後は必ずWindows Updateで最新にしてください。

 

NVIDIAが2007年に出した2014年に期待されるパフォーマンス

NVIDIAが2007年に出した2014年に期待されるパフォーマンスは、以下になります。現在2015年2月15日なので、今見直すと、興味深いです。なおNVIDIAがこの資料を発行したのは2007年ですので、8年前ということになります。

f:id:cabvm:20150215011309j:plain

CPU周波数は、シリコン半導体では4GHzだと計算を間違えてしまうため、止まってしまいましたが、他コアと周辺バスの速度向上で性能を向上しています。

メモリ周波数は3.2GHzまで来ていますが、44GHzまでは到達しませんでした。原因はシリコン半導体と同じです。

バス帯域幅は、PCI ExpressGPUの間のことを示しているのであれば、Express 3.0のバス帯域幅は数十GB/sですので、到達しませんでした。

HDDサイズは現状で一番大きいのは8TB。これはRAIDコントローラで30TB到達は可能です。映像制作の分野では到達していると考えて良いです。

ピクセルフィルレート、パーテックスレート、グラフィック浮動小数点演算(単精度でTesla K80で8.74 TFlop達成)については、Tesla K80でもここまでいっていませんので到達しませんでした。

グラフィックス帯域幅は現在最新のTesla K80で数百GB/s。これも到達しませんでした。

フレームバッファサイズ(VRAM)は32GBの予想でしたが、最新のTesla K80で24GB。これは惜しいです。

帯域幅の速度が思ったように向上しなかったのはNVIDIAもわかっていて、NVLinkといGPU同士、CPUとGPUをインターコネクトで接続するバス規格をIBMと共同で作成して、速度向上を実現しようとしています。

GPUはHPC分野の技術を取り入れながら、発展していくのでしょうか。今後も目が話せません。

参考記事


[GTC 2014]Maxwellの次に来る次世代GPU「Pascal」。「NVLink」と3次元メモリがその“次世代性能”を切り開く - 4Gamer.net

IPv6無効化、SNP無効化の手順

うちで使用しているIPv6無効化とSNP無効化の手順。

(1)下記の文字部分をコピーしてメモ帳に貼り付け「ipv6disable.reg」で保存(ipv6disableの部分は半角英数なら何でもOK)。その後「管理者で実行」したコマンドプロンプト上で「reg import ipv6disable.reg」を実行して反映します。UACが有効になっている場合、普通にコマンドプロンプトを実行しても変更が反映されないので注意が必要です。

------------------------------------------------------

Windows Registry Editor Version 5.00

[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\services\TCPIP6\Parameters]
"DisabledComponents"=dword:ffffffff

------------------------------------------------------

(2)下記のremからpauseまでをメモ帳にコピー&ペーストでdisabled.batという名前(disabledの部分は半角英数なら何でもOK)にして保存。その後「管理者で実行」したコマンドプロンプト上で実行します。UACが有効になっている場合に普通にコマンドプロンプトを実行しても、変更が反映されないので注意が必要です。

------------------------------------------------------

rem ipv6 disabled

netsh interface ipv6 isatap set state disabled
netsh interface ipv6 6to4 set state disabled
netsh interface teredo set state disabled
netsh interface ipv6 show interface
rem snp disabled
netsh int tcp set global rss=disabled
netsh int tcp set global chimney=disabled
netsh int tcp set global netdma=disabled
netsh int tcp show global
netsh int tcp  show chimneystats
netsh int ipv4 show int

pause

------------------------------------------------------

(3)[コントロールパネル]→[ネットワークと共有センター]→[アダプターの設定の変更]で見えてるネットワークカードの設定を右クリックして「インターネット・プロトコルバージョン6(TCP/IPv6)」のチェックをOFFにします。この操作は、見えてるネットワークカード全てに対して行ってください。無線LANBluetoothもです。

(4)再起動してください。

 

以前のTechnetでは、Windows Server 2008 R2Windows7では、手順(2)のみを行ったらOKと書いていた時期がありましたが、今は(2)の手順だけでは不十分ですので注意してください。例えば、ipconfigコマンドでIPv6アドレスが見えている場合、対策は不十分です。

あと、IPv6を完全に無効にせず、IPv4を優先して、IPv4通信ができなかった場合 IPv6通信を行う設定が出回っていますが、家庭用でフレッツ・スクエアへの通信を行う場合は有効ですが、社内環境では推奨しません。デュアルスタック環境自体、性能が低下しますし、IPv6環境が社内にない場合は意味がありません。

 

参考情報

連載 IPv6 入門 - 第三回 IPv6 の無効化方法 - Ask the Network & AD Support Team - Site Home - TechNet Blogs

How to disable IPv6 or its components in Windows

新旧ESXi上のWindows8.1性能比較まとめ(e1000e、SSDキャッシュ50GB有無、View Storage Accelerator有無)

Windowsエクスペリエンスインデックス比較。あまり違いは見当たらないがSSD無しのほうが性能が良かった。

 

f:id:cabvm:20150201201110p:plain

CrystalDiskMark比較。旧ESXi(Core i7 920 2.67GHz)だと大きな違いですが、新ESXi(Core i7  3930K  3.2GHz)だと大きな違いは無し。

f:id:cabvm:20150201201119p:plain

CrystalMark 2004R3比較。CPUとメモリで大きな違いが出たが、HDDは違いが出ず(3/25追記)。

f:id:cabvm:20150325010204p:plain

super pi比較。

f:id:cabvm:20150201201131p:plain

iometer比較。iometerではSSD有りのほうが良い結果が出た。

f:id:cabvm:20150201201147p:plain

PCMark7。旧ESXiではno SSDでは完走。GPUの性能差が素直に出た結果。

f:id:cabvm:20150201201156p:plain

ブラウザによるベンチマークpeacekeeper。こちらもGPUの性能差が素直に出ている。これはCPUをケチったらソフトウェア3D GPUの性能が連動して落ちることを示している。

f:id:cabvm:20150201201207p:plain

iperf。SSD無しのほうが性能が良かった。

f:id:cabvm:20150322024106p:plain

FFXIベンチマーク。新旧で大きな差が出ている。

f:id:cabvm:20150201201223p:plain

DQXベンチマーク。no SSDのほうが性能が良い。

f:id:cabvm:20150201201230p:plain

結論としては、やはりiometerが一番性能差を正確に表示していた。ソフトウェア3D GPUはCPUの性能差と強く関連しているという結果が出た。

新ESXiサーバのベンチマーク結果 1コア、2GBメモリ、ソフトウェア3DGPU(512MB)、e1000e、SSDホストキャッシュ無し

次はSSDキャッシュを無くした新ESXi(Core i7  3930K  3.2GHz)のWC2です。WCと同じく、SSDホストキャッシュを50GBに設定していましたが、今回削除しています。また、ストレージキャッシュであるView Storage AcceleratorをOFFにしています。

エクスペリエンスインデックス

f:id:cabvm:20150201040414j:plain

SSDキャッシュをOFFにしていますが、CPUが何故か0.1下がり、プライマリハードディスクが前回の結果(6.1)より上がっています。

Super Piを実行してみます。

f:id:cabvm:20150201040533j:plain

3355万桁の実行に10分54秒。前回より35秒遅くなっていて、旧ESXiとは逆の結果になっています。

iometer。

f:id:cabvm:20150201040725j:plain

 Totalは390.81IOPS。SSDホストキャッシュ有りより16.64低下しています。

続いてCrystalDiskMark。1000MBの結果です。

f:id:cabvm:20150201041137j:plain

2000MBの結果。

f:id:cabvm:20150201041151j:plain

4000MBの結果。

f:id:cabvm:20150201041202j:plain

旧ESXiの比較より、性能差が小さいです。一部はSSD有りのほうが性能が良い馬あります。

 次はCrystalMark。バージョンは2004R3(0.9.126.452)これは急遽ベンチマーク結果に入れることになったため、3/23に計測しています。

f:id:cabvm:20150325005349j:plain

続いてiperf。バージョンは 2.0.5-3 win32。対向はVPN1からNTP1に変更。

[ ID] Interval       Transfer     Bandwidth
[  3]  0.0-10.0 sec   901 MBytes   756 Mbits/sec

※1/25の結果から、3/19の結果に更新しました。

WC1のネットワークカードはe1000eです。

続いて3DMark7。

f:id:cabvm:20150201040913j:plain

スコアは2361です。SSDホストキャッシュ有りより3向上していますが、誤差の範囲と思われます。

続いてPeacekeeper。WebブラウザはIE11です。

f:id:cabvm:20150201041020j:plain

スコアは2233。前回より26低下していますが、誤差の範囲と思われます。

続いてドラクエX。Ver1.10。

f:id:cabvm:20150201041506j:plain

スコアは2018。約2倍向上しています。

最後にFF11。高解像度で3026。SSDホストキャッシュ有りより105低下しています。この点はDQXとは逆の結果が出ました。

SSD有りとSSD無しを比較してみます。

Windowsエクスペリエンスインデックス

f:id:cabvm:20150201050818p:plain

super pi

f:id:cabvm:20150201050830p:plain

CrystalDiskMark

f:id:cabvm:20150201050838p:plain

旧ESXiと同様に、SSDホストキャッシュ無しのほうが性能が上でしたが、大きな差は出ませんでした。

iometer

f:id:cabvm:20150201050848p:plain

旧ESXiと同じ傾向。

iperf

f:id:cabvm:20150322023906p:plain

iperfも旧ESXiと同じ傾向。

PCMark7

f:id:cabvm:20150201050906p:plain

Peacekeeper

f:id:cabvm:20150201050918p:plain

FFXI Benchmark

f:id:cabvm:20150201050930p:plain

FF11ベンチマークのみ、旧ESXiと逆の傾向を示しました。SSD有りのほうが性能が上です。

DQXベンチマーク

f:id:cabvm:20150201050939p:plain

結果から推測できることは、SSDホストキャッシュとView Storage Acceleratorを利用した場合、ホストOSのリソースを消費しますが、ホストの性能が上の場合、それほど大きな差にはならない、と考えることができそうです。集積率が低いESXiの場合、SSDキャッシュ、View Storage AcceleratorはOFFが良いようです。

旧ESXiサーバのベンチマーク結果 1コア、2GBメモリ、ソフトウェア3DGPU(512MB)、e1000e、SSDホストキャッシュ無し

次はSSDキャッシュを無くした旧ESXi(Core i7 920 2.67GHz)のWC1です。以前の計測はSSDホストキャッシュを50GBに設定していましたが、今回削除しています。また、ストレージキャッシュであるView Storage AcceleratorをOFFにしています。

f:id:cabvm:20150201021953p:plain

エクスペリエンスインデックス

f:id:cabvm:20150201022124j:plain

SSDキャッシュをOFFにしていますが、プライマリハードディスクのみ、前回の結果(5.9)より上がっています。SSDホストキャッシュをOFFにしたほうが速いと判断するのは早計です。

Super Piを実行してみます。

f:id:cabvm:20150201022646j:plain

3355万桁の実行に14分39秒。前回より52秒速いです。

続いてiometer。「Normal run all selected targets for all workers」3回実行して、一番良いデータです。前回書き忘れましたが、Maximum Disk Sizeは10,000,000Sectorsに設定しています。

f:id:cabvm:20150201023021j:plain

 Totalは292.20IOPS。SSDホストキャッシュ有りより14.54低下しています。

続いてCrystalDiskMark。1000MBの結果です。

f:id:cabvm:20150201023142j:plain

2000MBの結果。

f:id:cabvm:20150201023155j:plain

4000MBの結果。

f:id:cabvm:20150201023208j:plain

 すべての数値がSSDキャッシュ有りより上昇しています。

次はCrystalMark。バージョンは2004R3(0.9.126.452)これは急遽ベンチマーク結果に入れることになったため、3/23に計測している。

f:id:cabvm:20150325005238j:plain

続いてiperf。バージョンは 2.0.5-3 win32。対向はVPN1をやめてNTP1。

[ ID] Interval       Transfer     Bandwidth
[  3]  0.0-10.0 sec   891 MBytes   747 Mbits/sec

※1/25は523Mbpsでしたが、3/19の計測結果に更新しました。対抗はNTP1に変更。

WC1のネットワークカードはe1000eです。26Mbps低下しました。

続いて3DMark7。前回は完走しませんでしたが、今回は完走しました。

f:id:cabvm:20150201023606j:plain

スコアは1030です。

続いてPeacekeeper。WebブラウザはIE11です。

f:id:cabvm:20150201023632j:plain

スコアは1631。前回より20低下していますが、誤差の範囲と思われます。

続いてドラクエX。Ver1.10。

動作せず、すぐにスコアは694と表示。SSDホストキャッシュ有りと同じですが、計測不能と同じのため、ゼロとします。

最後にFF11。高解像度で764。SSDホストキャッシュ有りより16上昇しています。SSD有りとSSD無しを比較してみます。

Windowsエクスペリエンスインデックス

f:id:cabvm:20150201033659p:plain

super pi

f:id:cabvm:20150201033749p:plain

CrystalDiskMark

f:id:cabvm:20150201033820p:plain

no SSDでシーケンシャルと512Kのランダムアクセスが大幅に向上。

iometer

f:id:cabvm:20150201034042p:plain

iperf

f:id:cabvm:20150322023506p:plain

PCMark7

f:id:cabvm:20150201034102p:plain

Peacekeeper

f:id:cabvm:20150201034117p:plain

FFXI Benchmark

f:id:cabvm:20150201034147p:plain

DQXベンチマーク

f:id:cabvm:20150201034203p:plain

結果から推測できることは、ゲストOS1台のみの環境においては、SSDホストキャッシュは効果が無かったということです。またView Storage Acceleratorは多数のゲストOSで共有キャッシュを利用して、ストレージの負荷を下げることが目的のため、今回のような1ゲストOSしか起動していない状態では、効果は発揮されませんでした。どちらのキャッシュも多数のゲストOSが集積されて動作してこそ効果が発揮されるものです。例えばNViDIA GRIDで高機能なGPUを提供する場合(vDGA)は、ホスト1台につき2~4人の利用になり、集積率が下がります。このような場合では、SSDホストキャッシュやView Storage AcceleratorはOFFにするか、いっそのことフルフラッシュストレージにしたほうが性能向上が見込めそうです。トータルのIOPSはSSD有りのほうが性能が良いため、SSDホストキャッシュ、View Storage AcceleratorはESXiホストの負荷が高いのかもしれません。

参考資料(ゲストOS500台でView Storage Acceleratorの効果を検証)

1から学ぶ VMware on NetApp 第十三回 「特別番外編」 ネットワンシステムズ様ご提供コンテンツ VMware View on FlexPod ~ 検証から見るサイジングのポイント ~