删除重复文件的神器:dupeGuru
创始人
2024-03-01 14:52:42
0

最近,我需要清理我父亲的文件和文件夹。有一个难题是,里面存在很多不正确的名字的重复文件。有移动硬盘的备份,同时还为同一个文件编辑了多个版本,甚至改变的目录结构,同一个文件被复制了好几次,名字改变,位置改变等,这些文件挤满了磁盘空间。追踪每一个文件成了一个最大的问题。万幸的是,有一个小巧的软件可以帮助你省下很多时间来找到删除你系统中重复的文件:dupeGuru。它用Python写成,这个去重软件几个小时前切换到了GPLv3许可证。因此是时候用它来清理你的文件了!

dupeGuru的安装

在Ubuntu上, 你可以加入如下硬编码的软件PPA:

$ sudo apt-add-repository ppa:hsoft/ppa
$ sudo apt-get update 

接着用下面的命令安装:

$ sudo apt-get install dupeguru-se 

在ArchLinux中,这个包在AUR中。

如果你想自己编译,源码在GitHub上。

dupeGuru的基本使用

DupeGuru的构想是既快又安全。这意味着程序不会在你的系统上疯狂地运行。它很少会删除你不想要删除的文件。然而,既然在讨论文件删除,保持谨慎和小心总是好的:备份总是需要的。

你看完注意事项后,你可以用下面的命令运行duprGuru了:

$ dupeguru_se 

你应该看到要你选择文件夹的欢迎界面,在这里加入你你想要扫描的重复文件夹。

一旦你选择完文件夹并启动扫描后,dupeFuru会以列表的形式显示重复文件的组:

注意的是默认上dupeGuru基于文件的内容匹配,而不是他们的名字。为了防止意外地删除了重要的文件,匹配列列出了其使用的匹配算法。在这里,你可以选择你想要删除的匹配文件,并按下“Action” 按钮来看到可用的操作。

可用的选项相当广泛。简而言之,你可以删除重复、移动到另外的位置、忽略它们、打开它们、重命名它们甚至用自定义命令运行它们。如果你希望删除重复文件,你可能会像我一样非常意外竟然有这么多种删除方式。

你不仅可以将删除的文件移到垃圾箱或者永久删除,还可以选择留下指向原文件的链接(软链接或者硬链接)。也就是说,重复文件将会删除文件存储,但是会保留下一个指向原文件的链接。这将会省下大量的磁盘空间。如果你将这些文件导入到工作空间或者它们有一些依赖时很有用。

还有一个奇特的选项:你可以用HTML或者CSV文件导出结果。我不确定你会不会需要这么做,但是我假设你想追踪重复文件而不是想让dupeGuru处理它们时会有用。

最后但并不是最不重要的是,偏好菜单可以让你按照你的想法来操作去重这件事。

这里你可以选择扫描的标准,基于内容还是基于名字,并且有一个阈值来控制结果的数量。这里同样可以定义自定义在执行中可以选择的命令。混在其他那些小的选项中,要注意的是dupeGuru默认忽略小于10KB的文件。

要了解更多的信息,我建议你到官方网站看下,这里有很多文档、论坛支持和其他好东西。

总结一下,dupeGuru是我无论何时准备备份或者释放空间时所想到的软件。我发现这对高级用户而言也足够强大了,对新人而言也很直观。锦上添花的是:dupeGuru是跨平台的,这意味着你可以在Mac或者在Windows PC上都可以使用。如果你有特定的需求,想要清理音乐或者图片。这里有两个变种:dupeguru-medupeguru-pe, 相应地可以清理音频和图片文件。与常规版本的不同是它不仅比较文件格式还比较特定的媒体数据像质量和码率。

你觉得dupeGuru怎么样?你会考虑使用它么?或者你有任何可以替代的软件的建议么?让我在评论区知道你们的想法。


via: http://xmodulo.com/dupeguru-deduplicate-files-linux.html

作者:Adrien Brochard 译者:geekpi 校对:wxy

本文由 LCTT 原创翻译,Linux中国 荣誉推出

相关内容

npm发布包教程(五):废...
npm包发布后可以对包进行废弃或删除操作,废弃和删除...
2025-05-31 07:16:09
【C++】面试101,链表...
1.链表相加(二) 最直观的思路就是直...
2025-05-28 18:59:08
美“第一夫人”呼吁打击AI...
本报驻美国特约记者 戴润芝 ●王 策 美国“第一夫人”梅拉尼娅·特...
2025-03-06 09:21:42
原创 ...
据上观新闻报道,中共中央政治局委员、外交部长出席慕尼黑安全会议,在...
2025-02-21 21:46:57
捕捉块在尝试使用无效对象I...
在JavaScript中,如果想要捕捉块在尝试删除不存在的对象时正...
2025-01-12 16:30:48
不重新生成文件的情况下从文...
在不重新生成文件的情况下,从文本文件中删除行有以下几种解决方法:方...
2025-01-12 14:01:33

热门资讯

Helix:高级 Linux ... 说到 基于终端的文本编辑器,通常 Vim、Emacs 和 Nano 受到了关注。这并不意味着没有其他...
使用 KRAWL 扫描 Kub... 用 KRAWL 脚本来识别 Kubernetes Pod 和容器中的错误。当你使用 Kubernet...
JStock:Linux 上不... 如果你在股票市场做投资,那么你可能非常清楚投资组合管理计划有多重要。管理投资组合的目标是依据你能承受...
通过 SaltStack 管理... 我在搜索Puppet的替代品时,偶然间碰到了Salt。我喜欢puppet,但是我又爱上Salt了:)...
Epic 游戏商店现在可在 S... 现在可以在 Steam Deck 上运行 Epic 游戏商店了,几乎无懈可击! 但是,它是非官方的。...
《Apex 英雄》正式可在 S... 《Apex 英雄》现已通过 Steam Deck 验证,这使其成为支持 Linux 的顶级多人游戏之...
如何在 Github 上创建一... 学习如何复刻一个仓库,进行更改,并要求维护人员审查并合并它。你知道如何使用 git 了,你有一个 G...
2024 开年,LLUG 和你... Hi,Linuxer,2024 新年伊始,不知道你是否已经准备好迎接新的一年~ 2024 年,Lin...
什么是 KDE Connect... 什么是 KDE Connect?它的主要特性是什么?它应该如何安装?本文提供了基本的使用指南。科技日...
Opera 浏览器内置的 VP... 昨天我们报道过 Opera 浏览器内置了 VPN 服务,用户打开它可以防止他们的在线活动被窥视。不过...