首页 > Linux教程 > 正文

Linux下文件的压缩与打包详解

在Linux中,有很多的压缩命令。利用这些压缩命令,可以方便的从网络上下载大型的文件。同时,我们知道,Linux文件的扩展名是没有特殊意义的,不过,因为Linux下存在着许多压缩命令,所以为了方便记忆,会对这些命令所压缩的文件进行一些特殊的命名方式。本篇随笔将主要记录一下Linux系统常见的压缩命令。


一、压缩文件的原理


压缩技术,简而言之,我们可以将其想象成:其实文件里面有很多的"空间"存在,并不是完全填满的,而"压缩"技术就是将这些"空间"填满,从而使得整个文件占用量下降。


目前我们的操作系统数据中,都是使用字节(byte)单位来计量,不过事实上,计算机中最小的计量单位应该是位(bit),我们知道 1 byte = 8 bit。那么我们是怎么样对一些数据进行记录的呢?


例如我们只是需要记忆一个数字,即1这个数字,考虑到计算机所谓的二进制,如此一来, 1 会在最右边占据 1 个 bit ,而其他的 7 个 bits 将会自动的被填上 0 !其实在这样的例子中,那 7 个 bits 应该是 【空的】 才对!不过,为了要满足目前我们的操作系统数据的存取,所以就会将该数据转为 byte 的型态来记录。而压缩技术就是将这些没有使用到的空间"丢"出来。


文件压缩以后可以降低磁盘的使用量,减少文件的大小。不过这些"压缩过的文件"无法直接被操作系统所使用,因此,若要使用这些被压缩过的文件数据,则必须将它"还原"成未被压缩的样子,这就是"解压缩"。


二、Linux系统常见的压缩命令


在Linux的环境中,压缩文件的扩展名大多是:【*.tar, *.tar.gz, *.tgz, *.gz, *.Z, *.bz2】,为什么会有这么多种的扩展名呢?


这是因为 Linux 支持的压缩命令非常多,且不同的命令所用的压缩技术并不相同,当然彼此之间可能就无法互相压缩/解压缩文件。 所以,当你下载到某个压缩文件时,自然就需要知道该文件是由哪种压缩命令所制作出来的,这样才可以使用对应的压缩命令对其进行解压缩。 虽然 Linux 文件的属性基本上是与文件名没有绝对关系的, 但是为了帮助我们进行识别,所以适当的扩展名还是必要。目前Linux系统中一些常用的压缩文件的扩展名如下大致有以下几种:



*.Z         compress 程序压缩的文件;  //在当前的Linux主流版本中都已经默认没有支持该压缩命令了,因为gzip命令已经取代了compress命令了

*.gz        gzip 程序压缩的文件;

*.bz2       bzip2 程序压缩的文件;

*.tar       tar 程序打包的数据,并没有压缩过;

*.tar.gz    tar 程序打包的文件,其中并且经过 gzip 的压缩

*.tar.bz2   tar 程序打包的文件,其中并且经过 bzip2 的压缩


接下来我们来看一下Linux系统下常见的一些压缩命令。


1.gzip、zcat


gzip 可以说是使用最广的压缩命令了!目前 gzip 可以解压 compress, zip 与 gzip 等软件所压缩的文件。 通过gzip命令所创建的压缩文件为 *.gz 的文件名。



[root@xiaoluo ~]# gzip [-cdtv#] 文件名

[root@xiaoluo ~]# zcat 文件名.gz

选项与参数:

-c  :将压缩的数据输出到屏幕上,可通过过数据流重导向来处理;

-d  :解压缩的参数;

-t  :可以用来检验一个压缩文件的一致性,看看文件有无错误;

-v  :可以显示出原文件/压缩文件的压缩比等信息;

-#  :压缩等级(1~9),-1 最快,但是压缩比最差、-9 最慢,但是压缩比最好!默认是 -6  


实例一:将 /etc/passwd 复制到 /home 目录下,并且以gzip进行压缩

[root@xiaoluo home]# cp /etc/passwd passwd

[root@xiaoluo home]# ls -l

-rw-r--r--.  1 root    root         2679 4月  26 19:37 passwd

[root@xiaoluo home]# gzip passwd

[root@xiaoluo home]# ls -l

-rw-r--r--.  1 root    root         1066 4月  26 19:37 passwd.gz

# 此时我们会发现我们刚才复制过来的 passwd 这个文件已经变成了 passwd.gz 这个压缩文件了


实例二:将实例一的文件内容读出来

[root@xiaoluo home]# zcat passwd.gz

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

....................................此处省略N个字......................................

#此时我们可以看到 passwd.gz 解压缩之后的文件内容


实例三:将实例一的文件进行解压缩

[root@xiaoluo home]# gzip -d passwd.gz

[root@xiaoluo home]# ls -l

-rw-r--r--.  1 root    root         2679 4月  26 19:37 passwd

#此时我们可以看到,刚才的passwd.gz 文件又被解压缩成了passwd这个文件了


实例四:将实例三解压缩的passwd文件用最佳压缩包进行压缩,并保留原来的文件

[root@xiaoluo home]# gzip -c9 passwd > passwd.gz

[root@xiaoluo home]# ls -l passwd*

-rw-r--r--. 1 root root 2679 4月  26 19:37 passwd

-rw-r--r--. 1 root root 1066 4月  26 19:52 passwd.gz


注意:当你使用 gzip 进行压缩时,在默认的状态下原本的文件会被压缩成为 .gz 的文件名, 原始文件就不再存在了。所以如果要保留原来的文件,可以使用实例四的方法来进行压缩


我们知道,cat命令可以用来读取一个文本文件的内容,那么我们如果要来读取压缩文件数据内容要使用什么命令呢?就是上面实例的 zcat 命令了。


2.bzip2、bzcat


如果说gzip是为了取代compress命令,那么bzip2这个命令就是gzip的另一个升级版本



[root@xiaoluo ~]# bzip2 [-cdkzv#] 文件名

[root@xiaoluo ~]# bzcat 文件名.bz2

选项与参数:

-c  :将压缩的过程产生的数据输出到屏幕上

-d  :解压缩的参数

-k  :保留原始文件,而不会删除原始的文件

-z  :压缩的参数

-v  :可以显示出原文件/压缩文件的压缩比等信息;

-#  :与 gzip 同样的,都是在计算压缩比的参数, -9 最佳, -1 最快!


实例一:将刚才的passwd进行压缩

[root@xiaoluo home]# bzip2 -z passwd

[root@xiaoluo home]# ls -l passwd*

-rw-r--r--. 1 root root 1102 4月  26 19:37 passwd.bz2

# 此时passwd已经变成了passwd.bz2文件了


实例二:将实例一的文件进行解压缩

[root@xiaoluo home]# bzip2 -d passwd.bz2

[root@xiaoluo home]# ls -l passwd*

-rw-r--r--. 1 root root 2679 4月  26 19:37 passwd


实例三:将实例二的文件进行压缩,并保留原来的文件

[root@xiaoluo home]# bzip2 -zk passwd

[root@xiaoluo home]# ls -l passwd*

-rw-r--r--. 1 root root 2679 4月  26 19:37 passwd

-rw-r--r--. 1 root root 1102 4月  26 19:37 passwd.bz2

# -k这个参数就可以保留原文件  或者使用 bzip2 -c passwd > passwd.bz2 这个命令也可以


使用gzip,扩展名自动为.gz。使用bzip2的话,扩展名就自动变成了.bz2.同样,如果我们需要读取bzip2压缩文件的数据内容时,使用bzcat命令即可


3.tar


这个命令我们应该见得挺多的,之前在进行解压缩时,通常都是使用这个命令


上面提到的几个命令大多仅能针对单一文件来进行压缩,虽然 gzip 与 bzip2 也能够针对目录来进行压缩, 不过,这两个命令对目录的压缩指的是【将目录内的所有文件 "分别" 进行压缩】的动作! 而不像在 Windows 的系统,可以使用类似 WinRAR这一类的压缩软件来将好多数据【打包成一个文件】的样式。


这种将多个文件或目录包成一个大文件的命令功能,我们将其称为 打包命令! 那么Linux系统下有没有这样的命令呢?当然是有点,tar命令就是咱们需要的打包命令。 tar 可以将多个目录或文件打包成一个大文件,同时还可以透过 gzip/bzip2 的支持,将该文件同时进行压缩。



[root@xiaoluo ~]# tar [-j|-z] [cv] [-f 创建的文件名] filename... <==打包与压缩

[root@xiaoluo ~]# tar [-j|-z] [tv] [-f 创建的文件名]             <==查看文件名

[root@xiaoluo ~]# tar [-j|-z] [xv] [-f 创建的文件名] [-C 目录]   <==解压缩

选项与参数:

-c  :创建打包文件,可搭配 -v 来察看过程中被打包的档名(filename)

-t  :查看tarfile里的文件

-x  :解打包或解压缩的功能,可以搭配 -C (大写) 在特定目录解开

     特别留意的是, -c, -t, -x 不可同时出现在一串命令列中。

-j  :通过 bzip2 的支持进行压缩/解压缩:此时文件名最好为 *.tar.bz2

-z  :通过 gzip  的支持进行压缩/解压缩:此时文件名最好为 *.tar.gz

-v  :在压缩/解压缩的过程中,将正在处理的文件名显示出来

-f filename:-f 后面要立刻接要被处理的文件名!建议 -f 单独写一个选项

-C 目录    :这个选项用在解压缩,若要在特定目录解压缩,可以使用这个选项。


-p  :保留备份数据的原本权限与属性,常用於备份(-c)重要的配置文件

-P  :保留绝对路径,亦即允许备份数据中含有根目录存在之意;

--exclude=FILE:在压缩的过程中,不要将 FILE 打包


实例一:将这个/etc目录下的文件全部打包成 /home/etc.tar

[root@xiaoluo home]# tar -cvf etc.tar /etc     -->> 这个命令只是用来打包,不进行压缩


[root@xiaoluo home]# tar -zcvf etc.tar /etc     -->> 打包以后,使用gzip 对其进行压缩

[root@xiaoluo home]# tar -jcvf etc.tar /etc    -->> 打包以后,使用bzip2 对其进行压缩

# 特别注意,在参数 f 之后的档案档名是自己取的,我们习惯上都用 .tar 来作为标识。

# 如果加 z 参数,则以 .tar.gz 或 .tgz 来代表 gzip 压缩过的 tar file

# 如果加 j 参数,则以 .tar.bz2 来作为扩展名


实例二:查看上述etc.tar 文件里有哪些内容

[root@xiaoluo ~]# tar -ztvf etc.tar

# 由于我们使用 gzip 压缩,所以要查阅该 tarfile 内的文件时,

# 就得要加上 z 这个参数


实例三:将etc.tar 文件解压缩到当前目录下

[root@xiaoluo home]# tar -zxvf etc.tar

# 此时我们可以发现当前目录下已经有了一个etc的文件夹,里面就是我们解压缩出来的文件


实例四:如果我只是希望将 etc.tar 中的 etc/passwd 解压出来

[root@xiaoluo home]# tar -zxvf etc.tar etc/passwd

# 我可以通过 tar -ztvf 来查阅 tarfile 内的文件名,如果单只要一个文件,

# 就可以通过这个方式来完成。注意到! etc.tar.gz 内的根目录 / 不见了


实例五:备份/etc 内的所有文件,并且保存其权限

[root@xiaoluo home]# tar -zxvpf etc.tar.gz /etc/

# 这个 -p 的属性是很重要的,尤其是当您要保留原本文件的属性时


实例六:在/home 中,比2013/04/01 新的文件就进行备份

[root@xiaoluo home]# tar -N '2013/04/01' -zcvf home.tar /home


实例七:我要备份/home,/etc的所有文件,但是不要备份/home/xiaoluo 这个目录下的文件

[root@xiaoluo home]# tar --exclude /home/xiaoluo -zcvf myfile.tar.gz /home/* /etc


通过上面的一些实例,可以看到tar这个命令是一个多用途的压缩命令。我们通过tar命令可以完成备份的功能。由于tar整合过后的文件我们通常取名为 *.tar,如果在打包过程中还是用了gzip的压缩属性,则将文件取名为*.tar.gz。


上一篇:与Linux文件和目录管理相关的一些重要命令
下一篇:Centos6.3下Apache配置https证书访问

PythonTab微信公众号:

Python技术交流互助群 ( 请勿加多个群 ):

群1: 87464755

群2: 333646237

群3: 318130924

群4: 385100854