如何编写cpu时钟预取代码
这篇文章主要讲解了"如何编写cpu时钟预取代码",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"如何编写cpu时钟预取代码"吧!
测试下预取的效果,利用CPU始终查看效果。根据实验发现,预取地址在地址使用之前的十行左右代码处效果比较好!
代码如下:
#include
#define MAX_LEN 1000000
static inline void prefetchnta(void *addr) //预取部分
{
__asm__("movl %0, %%eax"::"a"(addr));
__asm__(".byte 0x0f, 0x18, 0x00");
}
inline unsigned long long GetCPUTickCount()
{
unsigned long high42 = 0;
unsigned long low32 = 0;
__asm__("RDTSC" : "=a"(low32), "=d"(high42));
unsigned long long counter = high42;
counter = (counter<<32) + low32;
return counter;
}
int main(int argc, char* argv[])
{
long long start, end;
long long array[MAX_LEN];
int i;
for(i = 0; i < MAX_LEN; i++) //让cache失效
array[i]++;
start = GetCPUTickCount();
array[0]++;
end = GetCPUTickCount();
printf("don't use prefetch time:%ld\n", end - start);
for(i = 0; i < MAX_LEN; i++)
array[i]++;
prefetchnta(array);
start = GetCPUTickCount();
array[0]++;
end = GetCPUTickCount();
printf("use prefetch time:%ld\n", end - start);
return 0;
}
感谢各位的阅读,以上就是"如何编写cpu时钟预取代码"的内容了,经过本文的学习后,相信大家对如何编写cpu时钟预取代码这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!