龙盟编程博客 | 无障碍搜索 | 云盘搜索神器
快速搜索
主页 > 软件开发 > VC开发 >

SSE指令介绍及其C、C++应用(2)

时间:2009-12-30 15:42来源:未知 作者:admin 点击:
分享到:
还有一些其它的赋值指令,但执行起来还没有自己逐个赋值来的快,只做为一些特殊用途,如果你想了解更多的信息,可以参考MSDN - VisualC++参考 - C/C++La

  还有一些其它的赋值指令,但执行起来还没有自己逐个赋值来的快,只做为一些特殊用途,如果你想了解更多的信息,可以参考MSDN -> VisualC++参考 -> C/C++Language -> C++Language Reference -> Compiler Intrinsics -> MMX, SSE, and SSE2 Intrinsics -> Stream SIMD Extensions(SSE)章节。

  一般来讲,所有SSE指令函数都有3个部分组成,中间用下划线隔开:

 _mm_set_ps1 

  mm表示多媒体扩展指令集

  set表示此函数的含义缩写

  ps1表示该函数对结果变量的影响,由两个字母组成,第一个字母表示对结果变量的影响方式,p表示把结果做为指向一组数据的指针,每一个元素都将参与运算,S表示只将结果变量中的第一个元素参与运算;第二个字母表示参与运算的数据类型。s表示32位浮点数,d表示64位浮点数,i32表示32位定点数,i64表示64位定点数,由于SSE只支持32位浮点数的运算,所以你可能会在这些指令封装函数中找不到包含非s修饰符的,但你可以在MMX和SSE2的指令集中去认识它们。

  接下来我举一个例子来说明SSE的指令函数是如何使用的,必须要说明的是我以下的代码都是在VC7.1的平台上写的,不保证对其它如Dev-C++、Borland C++等开发平台的完全兼容。

  为了方便对比速度,我会用常归方法和SSE优化两种写法写出,并会用一个测试速度的类CTimer来进行计时。

  这个算法是对一组float值进行放大,函数ScaleValue1是使用SSE指令优化的,函数ScaleValue2则没有。我们用10000个元素的float数组数据来测试这两个算法,每个算法运算10000遍,下面是测试程序和结果:

 #include <xmmintrin.h>

#include <windows.h> 

 class CTimer

{

public:

       __forceinline CTimer( void )

       {

              QueryPerformanceFrequency( &m_Frequency );

              QueryPerformanceCounter( &m_StartCount );

       }

       __forceinline void Reset( void )

       {

              QueryPerformanceCounter( &m_StartCount );

       }

       __forceinline double End( void )

       {

精彩图集

赞助商链接