C++中前置操作性能一定优于后置操作?
创始人
2024-03-30 05:18:05
0

后置操作和前置操作,一个会产生临时变量,一个不会产生临时变量,其原因是:前置操作遵循的规则是change-then-use而后置操作遵循的规则是use-then-change。正因为后置操作的use-then-change原则,使得编译器在实现该操作的时候,先把之前的值进行拷贝备份,然后对值进行更改操作,最后返回之前备份的值。

以整型为例:

// ++i
i = i+1;
return i;// i++
temp = i;
i=i+1;
return temp;

同样,对于复杂类型:

// ++i
Object &operator++() {     ++value_;     return *this;   
}    
// i++    
Object operator++(int) {     Object old = *this;    ++*this;     return old;  
}  

也正是基于上述原因,我们通常会得出一个结论:前置操作比后置操作更快

那么,真的是这样么?下面将分别从内置类型和非内置类型两个方面进行分析。

内置类型

为了便于分析二者的性能,写了个测试代码,用来比较前置++和后置++的性能差异,代码如下:

pre_inc.cc

void PreInc() {for (int i = 0; i < 100000; ++i) {for (int j = 0; j < 100000; ++j) {for (int k = 0; k < 1000; ++k);}}
}
int main() {PreInc();return 0;
}  

post_inc.cc

void PostInc() {for (int i = 0; i < 100000; i++) {for (int j = 0; j < 100000; j++) {for (int k = 0; k < 1000; k++);}}
}
int main() {PostInc();return 0;
}  

编译运行之后,比较二者的运行时间,对比图如下:

耗时竟然一样😲,颠覆了之前对这块的认知。

使用下述命令生成汇编代码(使用-O0禁用优化以免结果产生偏差):

$ g++ -O0 -S pre.cc
$ g++ -O0 -S post.cc

查看上述两个汇编文件的不同点(使用vimdiff):

通过上述对比,发现前置++和后置++的汇编结果一致,这也就是说至少对于内置类型(上述代码使用的是int),前置++和后置++的性能一样。在进行搜索的时候,发现了下面这段话:

“The compiler will optimize it away” is an incredibly lazy justification for using i++ instead of ++i. Moreover, it is basically only true for built-in types, not for class types.

从上述可以看出,对于内置类型的后置++操作,编译器会进行优化,而对于非内置内存,则不会进行优化,那么到底是不是这样呢?

自定义类型

迭代器

对于C++开发人员,在遍历vector、list或者set等结构的时候,都习惯于使用迭代器即iterator进行遍历,而gcc实现中,对iterator(此处只罗列了vector相关)的定义如下:

typedef __gnu_cxx::__normal_iterator iterator;

从上述定义可以看出,iterator不是内置类型,同内置类型一样,**iterator也支持前置++和后置++**,所以,在本节中使用迭代器的前置++和后置++对容器进行遍历,以测试其性能,代码如下:

#include 
#include 
#include 
#include int main(int, char**)
{std::vector v1( 1000000 );std::vector v2( 1000000 );std::iota( v1.begin(), v1.end(), 1 );std::iota( v2.begin(), v2.end(), 2 );std::chrono::time_point t1, t2, t3;t1 = std::chrono::high_resolution_clock::now();for( auto it = v1.begin(); it != v1.end(); ++it )*it *= 2;t2 = std::chrono::high_resolution_clock::now();for( auto it = v2.begin(); it != v2.end(); it++ )*it *= 2;t3 = std::chrono::high_resolution_clock::now();std::chrono::duration d1 = t2 - t1;std::chrono::duration d2 = t3 - t2;std::cout << "pre time cost: " << std::chrono::duration_cast(d1).count() << "us" << std::endl;std::cout << "post time cost:  " << std::chrono::duration_cast(d2).count() << "us" << std::endl;return 0;
}

编译并运行:

 g++ --std=c++11 test.cc -o test; ./testpre time cost: 44008uspost time cost:  58283us

通过上述结果可以看出,对于非内置类型(或者更确切的说对于迭代器类型),前置操作的性能优于后置

上面从执行时间的角度分析了迭代器的前置操作和后置操作对性能的影响,下面是STL中对iterator的源码:

__normal_iterator&operator++() // 前置操作{++_M_current;return *this;}__normal_iteratoroperator++(int) // 后置操作{ return __normal_iterator(_M_current++); }

从上面代码可以看出,迭代器的前置和后置操作主要有以下两个区别:

  • • 返回值:前置操作返回对象的引用,后置操作返回类型为对象,

  • • 拷贝:前置操作无拷贝操作,后置操作存在一次对象拷贝

正式因为这两个原因,前置操作符就地修改对象,而后置操作符将导致创建临时对象,调用构造函数和析构函数(某些情况下编译器会做优化,此处不做讨论),导致了前置操作和后置操作的性能差异。

自定义对象

在上一节中,我们通过迭代器(前置递增和后置递增)遍历对vector进行遍历,证明了前置递增的性能优于后置递增,在本节中,将自定义一个对象,然后进行测试。

代码如下(在最开始的自定义对象中,只有整数value_而没有v_变量,这就导致测试结果很相近,所以为了更加明显的看出其差异,所以增加了vector😁):

class Object {public:Object(int value): value_(value) {v_.emplace_back(value_);}int Get() { return value_; }Object &operator++() // 前置操作{++value_;v_.emplace_back(value_);return *this;}Object operator++(int) // 后置操作{Integer tmp = *this; // 拷贝,注意此处这个拷贝行为以及临时变量++value_;v_.emplace_back(value_);return tmp; //}private:std::vector v_;int value_;
};int main() {std::chrono::time_point t1, t2, t3;t1 = std::chrono::high_resolution_clock::now();Integer i(0);for (int j = 0; j < 10000; ++j) {++i;}t2 = std::chrono::high_resolution_clock::now();Integer k(0);for (int j = 0; j < 10000; ++j) {k++;}t3 = std::chrono::high_resolution_clock::now();std::chrono::duration d1 = t2 - t1;std::chrono::duration d2 = t3 - t2;std::cout << "pre time cost: " << std::chrono::duration_cast(d1).count() << "us" << std::endl;std::cout << "post time cost:  " << std::chrono::duration_cast(d2).count() << "us" << std::endl;return 0;
}

编译并运行:

g++ --std=c++11 test.cc -o test; ./test
pre time cost: 188us
post time cost:  29625us

从上述测试结果可以进一步看出,前置++的性能优于后置++。

对于内置类型来说,前置++和后置++的性能一样,这是因为编译器会对其进行优化;而对于自定义类型的前置和后置操作,你可能会有疑问,为什么编译器不能像优化内置类型一样,优化自定义类型呢?这是因为依赖于场景。在某些场景下编译器可以进行优化(主要是拷贝部分),但是在某些情况下,编译器无法在不更改代码含义的情况下对其进行优化。所以,除非需要后置操作,否则建议使用前置操作

结语

在本文中,分别从内置类型的前后置操作和自定义类型的后置操作进行性能对比,结果发现对于内置类型,二者在性能上无差异,而对于自定义类型,前置操作的性能远优于后置操作

相关内容

热门资讯

不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...
安卓文字转语音tts没有声音 安卓文字转语音TTS没有声音的问题在应用中比较常见,通常是由于一些设置或者代码逻辑问题导致的。本文将...
AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
APK正在安装,但应用程序列表... 这个问题可能是由于以下原因导致的:应用程序安装的APK文件可能存在问题。设备上已经存在同名的应用程序...
报告实验.pdfbase.tt... 这个错误通常是由于找不到字体文件或者文件路径不正确导致的。以下是一些解决方法:确认字体文件是否存在:...