程序的翻译过程包括:预处理、编译、汇编、链接四个部分,接下来文章中将讨论在Linux下如何使用gcc编译器完成程序的翻译。
gcc使用命令格式:
gcc [选项] 要编译的文件 [选项] 生成的目标文件
以下以 test.c
文件作为示例讨论程序翻译过程,其中源代码如下图所示:
#
号开头的代码行。gcc -E test.c -o test.i
-E
的作用是让gcc在预处理结束后停止编译过程;选项 -o
是指生成目标文件(注意:-o 选项后面必须紧跟目标文件);.i
文件是经过预处理后的C原始程序,如下图所示,源程序中的注释经过预处理后被删去了,main函数中的N也被替换为了100,还有条件编译也被处理了,此外,还可以看到,除了被处理后的原代码部分,前面还有八百多行代码是头文件等展开后的结果。gcc -S test.i -o test.s
-S
的作用是让gcc在编译结束后停止翻译过程,.s
文件是编译后生成的汇编语言程序(如下图所示)。.s
文件转成目标文件。gcc -c test.s -o test.o
-c
的作用是让gcc在汇编结束后停止翻译过程,.o
文件是汇编后生成的可重定位目标二进制代码(相当于windows下程序翻译后形成的 .obj
文件)。如下图所示,这里只是把我们自己编写的代码翻译成了二进制文件,即使将文件权限修改为可执行后,这个二进制文件仍是不可被执行的,还需经过链接过程形成完整的可执行程序。gcc test.o -o test
链接过程具体做了什么呢?这里需要先了解一个概念:函数库 。
- 我们在编写程序时,常常会用到
printf
等库函数,但事实上,在预编译中包含的头文件stdio.h
中也只是有函数的声明,而没有函数的定义(实现),那printf
又是在哪里实现的?我们的程序又是如何成功使用函数的呢?
其实,系统把这些函数实现都写在名为libc.so.6
的库文件中了,在没有特别指定时,gcc会到系统默认的搜索路径/usr/lib
下查找,也就是链接到libc.so.6
库函数中去,如此就能实现对应的库函数了,而这也是链接的作用。- 我们之所以能够在Linux下进行C、C++等代码的编写和编译是因为Linux系统默认已经携带了语言级别的头文件和语言对应库,而编译器能够自动帮我们识别解释这些语言,并根据相应的库完成程序的编译链接以形成可执行程序。
函数库一般分为静态库和动态库(共享库)两种,对应的链接也分为静态链接和动态链接
libXXX.a
的形式命名,动态库通常以 libXXX.so
的形式命名;Windows下静态库通常以 .lib
为后缀,动态库通常以 .dll
为后缀。那我们要如何知道我们的可执行程序是静态链接形成的还是动态链接形成的呢?这里首先要了解一个命令:ldd 可执行文件
,通过该命令可以查看对应可执行文件所依赖的动态库。
以下通过示例来进一步了解程序的链接:
那如何实现静态链接呢?
这里使用的是云服务器,一般云服务器默认只有动态库,如果要实现静态链接,还需安装静态库,否则会报错。我们可以通过命令:
yum install glibc-static libstdc++-static -y
来安装静态库。接着通过命令:gcc test.o -o test-static -static
实现静态链接(这里为了区分动态链接形成的可执行文件,将静态链接形成的可执行文件命名位 test-static
。命令中选项 -static
表示使用静态链接和静态库)。如下图所示,可以看到静态链接形成的可执行文件的大小约有动态链接形成的可执行文件的大小的100倍,可见静态链接消耗的空间之大。
总结: 以上为了更加详细的了解程序翻译的过程,所以分四步完成程序的翻译,在实际中,如果没有特殊需要,(以test.c文件的翻译为例)可直接使用命令
gcc test.c -o test
完成程序的编译及动态链接,使用命令gcc test.c -o test -static
完成程序的编译及静态链接,其中如果不加选项-o test
生成指定的目标文件,则会默认生成名为a.out
的可执行文件。 如下图所示,无论是动态链接形成的可执行程序还是静态链接形成的可执行程序,又或是默认形成的可执行程序,最终的运行结果都是一样的。
-E
:只激活预处理,不生成文件,需要将执行结果重定向到一个输出文件中,否则默认将预处理结果输出到屏幕。-S
:编译到形成汇编语言代码就停止,不进行汇编和链接。-c
:编译到形成二进制目标代码。-o
:输出指定目标文件。-static
:对生成的二进制文件采用静态链接。-g
:生成调试信息(Debug版可执行程序)。GUN调试器可利用该信息。-shared
:尽量使用动态库,形成的可执行文件比较小,但前提需要系统有动态库。-O0
、 -O1
、 -O2
、 -O3
:编译器的优化选项的4个级别,-O0
表示没有优化,-O1
为缺省值,-O3
优化级别最高。-w
:不生成任何警告信息。-Wall
:生成所有警告信息。以上是我对Linux中gcc编译器使用的一些学习记录总结,如有错误,希望大家帮忙指正,也欢迎大家给予建议和讨论,谢谢!