GCC 简介

要了解 GCC 我觉得有必要先了解一下 GNU 项目。GNU(GNU 是 GNU`s Not Unix 的缩写) 项目是 1984 年由 Richard Stallman 发起的一个免税的慈善项目。该项目的目标非常宏大,就是开发一个完整的类 Unix 的系统,其源码能够不受限制的被修改和传播。GNU 项目已经开发出了一个包含 Unix 系统的所有主要部件的环境,但内核除外,内核是由 Linux 项目独立发展而来的。GNU 环境包括 EMACS 编辑器、GCC 编译器、GDB 调试器、汇编器、连接器、处理二进制文件的工具以及其他一些部件。

GCC 一开始叫做 GNU C Compiler。后来经过不断的发展,不仅仅是支持 C,而且还支持 C++、Objective-C、Ada 和 Go 等多种语言。因此后来 GCC 也就变成了 GNU Compiler Collection 的缩写。GCC 官网

GCC 使用格式及可选项

gcc 的使用格式为:gcc [选项][文件名][选项][文件名]

选项可以分为以下几大类:

(1)总体选项,用于控制编译的整个流程。

-c 对源文件进行编译或者汇编。

-E 对源文件进行预处理。

-S 对原文件进行编译。

-o file 输出目标文件 file。

-v 显示编译阶段的命令。

(2)语言选项,用来支持各个版本的C语言程序。

-ansi 支持符合 ANSI 标准的 C 语言。

(3)警告选择,用于控编译过程中出现的警告信息。常用的选项。

-W 屏蔽所有的警警告信息。

-wall 显示所有类型的警告信息。

-Werror 出现任何警告信息就停止编译。

(4)调试选项,用于控制调试信息。

-g 产生调试信息。

(5)优化选项,对于对目标文件进行优化。

-O1 对目标文件的性能进行优化。

-O2 进一步优化,提高目标文件的运行性能。

-O3 进一步优化,支持函数集成优化。

-OO 不进行优化。

(6)连接器选项,用于控制链接过程。

-static 使用静态链接。

-llibrary 链接 library 函数库文件。

-L dir 置顶连接器的搜索目录 dir。

-shared 生成共享文件。

(7)目录选项,用于指定编译器的文件搜索目录。

-Idir 指定头文件的搜索目录 dir。

-Ldir 指定搜索目目录 dir。

GCC 简单编译

假设有示例程序如下:

//test.c
#include <stdio.h>
int main(void)
{
printf("Hello World!\n");
return 0;
}

使用GCC编译程序的时候,编译过程分为四个阶段:

预处理 (Pre-Processing)。该阶段预处理器(cpp)根据以字符 # 开头的命令,修改原始的 C 程序。比如,test.c 文件中第一行 #include <stdio.h> 命令告诉预处理器读取系统头文件 stdio.h 的内容,并把其直接插入程序文本中。结果就会得到另一个 C 程序,通常以 .i 作为文件扩展名。

编译 (Compiling)。编译器(ccl)将文本文件 test.i 翻译成文本文件 test.s,它包含一个汇编语言程序

汇编 (Assembling)。汇编器(as)将 test.s 翻译成机器语言指令,把这些指令打包成一种叫做可重定位目标程序的格式,并把结果保存在目标文件 test.o 中,test.o 是一个二进制文件,如果直接打开看的话是乱码。

链接 (Linking)。printf 函数存在于一个名为 printf.o 的单独的预编译好了的目标文件中,而这个文件必须以某种方式合并到我们的 test.o 程序中。连接器(ld)负责处理这些合并,得到 test 文件,它是一个可执行目标文件,可以被加载到内存中,由系统执行。

一步到位编译指令

gcc test.c -o test

这条命令直接把上述四个步骤一次性执行完了。产生文件 test。

预处理

gcc -E test.c

如果直接在命令行执行这条指令,则将结果直接打印在终端界面。如果想把预处理结果保存在文件中,可以使用下面这条指令:

gcc -E test.c -o test.i

这条指令会将预处理结果存放在文件 test.i 中。

编译

可以对预处理后的文件 test.i 进行编译处理,产生汇编代码。

gcc -S test.i -o test.s

打开 test.s 文件,其内容是 test.i 的汇编代码。

执行优化:

gcc -O1 -S test.i -o test.s

汇编

gcc -c test.s -o test.o

将编译产生的汇编代码翻译成机器指令。

连接

gcc test.o -o test

如果你一步一步的执行了上述四条指令,那么现在你可以在终端执行 ./test,会打印出来 Hello World!

编译多个程序文件

如果你的项目包括多个 C 源文件,比如有两个源文件 test1.c 和 test2.c,那么可以用下面的命令来对它们进行编译:

gcc test1.c test2.c -o test

这条指令实际上是分如下三步来执行的:

gcc -c test1.c -o test1.o
gcc -c test2.c -o test2.o
gcc test1.o test2.o -o test

检错

gcc -pedantic illcode.c -o illcode

-pedantic 编译选项并不能保证被编译程序与 ANSI/ISO C 标准的完全兼容,它仅仅只能用来帮助 Linux 程序员离这个目标越来越近。或者换句话说,-pedantic 选项能够帮助程序员发现一些不符合 ANSI/ISO C 标准的代码,但不是全部,事实上只有 ANSI/ISO C 语言标准中要求进行编译器诊断的那些情况,才有可能被 GCC 发现并提出警告。

除了 -pedantic 之外,GCC 还有一些其它编译选项也能够产生有用的警告信息。这些选项大多以 -W 开头,其中最有价值的当数 -Wall 了,使用它能够使 GCC 产生尽可能多的警告信息。

gcc -Wall illcode.c -o illcode

GCC 给出的警告信息虽然从严格意义上说不能算作错误,但却很可能成为错误的栖身之所。一个优秀的 Linux 程序员应该尽量避免产生警告信息,使自己的代码始终保持标准、健壮的特性。所以将警告信息当成编码错误来对待,是一种值得赞扬的行为!所以,在编译程序时带上 -Werror 选项,那么 GCC 会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改,如下:

gcc -Werror test.c -o test

库文件连接

开发软件时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助许多函数库的支持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(so、或 lib、dll)的集合。虽然 Linux 下的大多数函数都默认将头文件放到 /usr/include/ 目录下,而库文件则放到 /usr/lib/ 目录下;Windows 所使用的库文件主要放在 Visual Stido 的目录下的 include 和 lib,以及系统文件夹下。但也有的时候,我们要用的库不再这些目录下,所以 GCC 在编译时必须用自己的办法来查找所需要的头文件和库文件。

例如我们的程序 test.c 是在 Linux 上使用 C 连接 MySQL,这个时候我们需要去 MySQL 官网下载MySQL Connectors 的 C 库,下载下来解压之后,有一个 include 文件夹,里面包含 mysql connectors 的头文件,还有一个 lib 文件夹,里面包含二进制 so 文件 libmysqlclient.so。

其中 inclulde 文件夹的路径是 /usr/dev/mysql/include,lib 文件夹是 /usr/dev/mysql/lib

编译成可执行文件

首先我们要进行编译 test.c 为目标文件,这个时候需要执行:

gcc –c –I /usr/dev/mysql/include test.c –o test.o

链接

最后我们把所有目标文件链接成可执行文件:

gcc –L /usr/dev/mysql/lib –lmysqlclient test.o –o test

Linux 下的库文件分为两大类分别是动态链接库(通常以 .so 结尾)和静态链接库(通常以 .a 结尾),二者的区别仅在于程序执行时所需的代码是在运行时动态加载的,还是在编译时静态加载的。

强制链接时使用静态链接库

默认情况下, GCC 在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链接库,如果需要的话可以在编译时加上 -static 选项,强制使用静态链接库。

/usr/dev/mysql/lib 目录下有链接时所需要的库文件 libmysqlclient.so 和 libmysqlclient.a,为了让GCC 在链接时只用到静态链接库,可以使用下面的命令:

gcc –L /usr/dev/mysql/lib –static –lmysqlclient test.o –o test

静态库链接时搜索路径顺序

  1. ld 会去找 GCC 命令中的参数 -L
  2. 再找 GCC 的环境变量 LIBRARY_PATH。
  3. 再找内定目录 /lib /usr/lib /usr/local/lib 这是当初 compile gcc 时写在程序内的。

动态链接时、执行时搜索路径顺序:

  1. 编译目标代码时指定的动态库搜索路径。
  2. 环境变量 LD_LIBRARY_PATH 指定的动态库搜索路径。
  3. 配置文件 /etc/ld.so.conf 中指定的动态库搜索路径。
  4. 默认的动态库搜索路径 /lib
  5. 默认的动态库搜索路径 /usr/lib

有关环境变量:

LIBRARY_PATH 环境变量:指定程序静态链接库文件搜索路径。

LD_LIBRARY_PATH 环境变量:指定程序动态链接库文件搜索路径。

参考

Linux GCC常用命令