为初学者提供的 uniq 命令教程及示例
创始人
2024-03-01 22:37:20
0

如果你主要是在命令行上工作,并且每天处理大量的文本文件,那么你应该了解下 uniq 命令。该命令会帮助你轻松地从文件中找到重复的行。它不仅用于查找重复项,而且我们还可以使用它来删除重复项,显示重复项的出现次数,只显示重复的行,只显示唯一的行等。由于 uniq 命令是 GNU coreutils 包的一部分,所以它预装在大多数 Linux 发行版中,让我们不需要费心安装。来看一些实际的例子。

请注意,除非重复行是相邻的,否则 uniq 不会删除它们。因此,你可能需要先对它们进行排序,或将排序命令与 uniq 组合以获得结果。让我给你看一些例子。

首先,让我们创建一个带有一些重复行的文件:

vi ostechnix.txt
welcome to ostechnix
welcome to ostechnix
Linus is the creator of Linux.
Linux is secure by default
Linus is the creator of Linux.
Top 500 super computers are powered by Linux

正如你在上面的文件中看到的,我们有一些重复的行(第一行和第二行,第三行和第五行是重复的)。

1、 使用 uniq 命令删除文件中的连续重复行

如果你在不使用任何参数的情况下使用 uniq 命令,它将删除所有连续的重复行,只显示唯一的行。

uniq ostechnix.txt

示例输出:

如你所见, uniq 命令删除了给定文件中的所有连续重复行。你可能还注意到,上面的输出仍然有第二行和第四行重复了。这是因为 uniq 命令只有在相邻的情况下才会删除重复的行,当然,我们也可以删除非连续的重复行。请看下面的第二个例子。

2、 删除所有重复的行

sort ostechnix.txt | uniq

示例输出:

看到了吗?没有重复的行。换句话说,上面的命令将显示在 ostechnix.txt 中只出现一次的行。我们使用 sort 命令与 uniq 命令结合,因为,就像我提到的,除非重复行是相邻的,否则 uniq 不会删除它们。

3、 只显示文件中唯一的一行

为了只显示文件中唯一的一行,可以这样做:

sort ostechnix.txt | uniq -u

示例输出:

Linux is secure by default
Top 500 super computers are powered by Linux

如你所见,在给定的文件中只有两行是唯一的。

4、 只显示重复的行

同样的,我们也可以显示文件中重复的行,就像下面这样:

sort ostechnix.txt | uniq -d

示例输出:

Linus is the creator of Linux.
welcome to ostechnix

这两行在 ostechnix.txt 文件中是重复的行。请注意 -d(小写 d) 将会只打印重复的行,每组显示一个。打印所有重复的行,使用 -D(大写 D),如下所示:

sort ostechnix.txt | uniq -D

在下面的截图中看两个选项的区别:

5、 显示文件中每一行的出现次数

由于某种原因,你可能想要检查给定文件中每一行重复出现的次数。要做到这一点,使用 -c 选项,如下所示:

sort ostechnix.txt | uniq -c

示例输出:

 2 Linus is the creator of Linux.
 1 Linux is secure by default
 1 Top 500 super computers are powered by Linux
 2 welcome to ostechnix

我们还可以按照每一行的出现次数进行排序,然后显示,如下所示:

sort ostechnix.txt | uniq -c | sort -nr

示例输出:

 2 welcome to ostechnix
 2 Linus is the creator of Linux.
 1 Top 500 super computers are powered by Linux
 1 Linux is secure by default

6、 将比较限制为 N 个字符

我们可以使用 -w 选项来限制对文件中特定数量字符的比较。例如,让我们比较文件中的前四个字符,并显示重复行,如下所示:

uniq -d -w 4 ostechnix.txt

7、 忽略比较指定的 N 个字符

像对文件中行的前 N 个字符进行限制比较一样,我们也可以使用 -s 选项来忽略比较前 N 个字符。

下面的命令将忽略在文件中每行的前四个字符进行比较:

uniq -d -s 4 ostechnix.txt

为了忽略比较前 N 个字段(LCTT 译注:即前几列)而不是字符,在上面的命令中使用 -f 选项。

欲了解更多详情,请参考帮助部分:

uniq --help

也可以使用 man 命令查看:

man uniq

今天就到这里!我希望你现在对 uniq 命令及其目的有一个基本的了解。如果你发现我们的指南有用,请在你的社交网络上分享,并继续支持我们。更多好东西要来了,请继续关注!

干杯!


via: https://www.ostechnix.com/uniq-command-tutorial-examples-beginners/

作者:SK 译者:MjSeven 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

相关内容

不向std::vector...
可以使用std::make_unique函数来创建新的std::u...
2025-01-10 07:00:56
不同的破坏unique_p...
unique_ptr是C++11引入的智能指针,它是独占所有权的智...
2025-01-08 18:00:36
不能将ShouldBeUn...
在Queued事件监听器中不能使用“ShouldBeUnique”...
2024-12-27 05:00:25
BulkCreateSeq...
出现该错误,是因为在Sequelize中的BulkCreate函数...
2024-12-26 15:01:35
BisonC++inval...
在标记类型的析构函数中调用release()方法释放unique_...
2024-12-19 07:02:19
避免在使用numpy un...
在使用numpy的unique函数计数时,可以避免使用Python...
2024-12-17 13:01:31

热门资讯

PHP最佳实践(译) 简介PHP是一门复杂的语言,经过多年折腾,使其不同版本之间高度不一致,有时还有些bug。 每个版本都...
值得收藏的 27 个机器学习的... 机器学习 ( Machine Learning ) 有很多方面,当我开始研究学习它时,我发现了各种各...
为什么计量 IT 的生产力如此... 在某些行业里,人们可以根据一些测量标准判定一个人的生产力。比如,如果你是一个零件制造商,可以通过一个...
8 个提升你的隐私防护的开源密... 使用一些顶级开源密码管理器,确保你的登录凭证安全无虞。密码管理器是一项非常有用的实用程序。在你想寻找...
硬核观察 #885 苹果 AR... 苹果 AR 眼镜被无限期推迟据报道,由于技术上的挑战,苹果公司已经无限期推迟了其轻型增强现实(AR)...
Helix:高级 Linux ... 说到 基于终端的文本编辑器,通常 Vim、Emacs 和 Nano 受到了关注。这并不意味着没有其他...
8个有趣的Linux提示与技巧... 我们时不时给你带来关于Linux的提示与技巧。和这个系列保持一致,这里有8个我们从读者收到最有趣的提...
2020 年的 GitHub ... 距离 2020 年结束只剩下区区 24 天,我们即将结束魔幻的 2020 ,迎来新的一年,新的一年或...
开源新闻速递:openSUSE... 今日关注openSUSE 项目组的 Dominique Leuenberger 在他的周报中说:“这...
KDE4.11 Beta1 正...   KDE 项目工作组刚刚发布了 KDE Software Compilation 4.11 Bet...