Chiharu の日記

絵描き C/C++ プログラマーの日記です。

XMM レジスタによるメモリ アクセス 〜SSE2 (movdqa と movdqu) の特性

先日の日記の続き。
興味深い計測結果が出ていました。

確かにNehalem系CPUは、以前のCPUと比べてMOVDQUの性能が改善されています。cache lineを跨がなければMOVDQAと同じ速度が出ています。

MOVDQUの特性について

ふむ。movdqu は Core i シリーズで高速化されているようですね。確かに Core 2 でいろいろ試していたときは明らかに movdqu って movdqa に比べて遅かったような記憶が。(計測はしてなかったのですが、体感で。
でも、謎が解けたようです。ま。Core i シリーズだと、メモリのシーケンシャル アクセスをする限りにおいて movdqa も movdqu も速度差がそんなにないようで。何事も実測ですね。