迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 >

如何将相似图像从一个文件夹分离到不同的文件夹

作者:迹忆客 最近更新:2022/10/12 浏览次数:

在本博客中,我们将讨论从文件夹中分离相似的图像。 为此,我们正在使用 python 的 imagehash 模块。 它基于图像散列。

图像散列概述

如果你不想了解图像哈希,可以跳过整个块(最好不要这样做)。 这是使用算法为图像分配值的过程。 如果两个图像看起来相同但格式不同,在捕获第二张图像时旋转、调整大小、颜色略有变化,或任何其他轻微噪音,应散列到相同的数字或更接近的数字。 尽管它们的数据的实际位完全不同,但如果它们在我们眼中看起来几乎相同,它们散列到相同的值。它们是许多类型的散列算法,例如 a-hashp-hash……。 在这篇博文中,我们将使用 a-hash

安装

我们可以使用以下命令安装它:

$ pip install imagehash

导入所需模块

from os import listdir
from PIL import Image
import imagehash
import shutil

主要逻辑:

我们使用两个 for 循环将图像与文件夹中的其余图像一一进行比较。然后我们计算每个图像的平均哈希值,并为 hashDiff 分配一个值(此处为 35)。 如果图像相同,则两个哈希值的差异不应跨越 hashDiff

folder=r’name_of_the_folder_having_all_the_images’ 
for i in range(len(os.listdir(folder))): 
    for j in range(i+1,len(os.listdir(folder))):
         path_0=os.path.join(folder,os.listdir(folder)[i])
         path_1=os.path.join(folder,os.listdir(folder)[j])
         hash_0 = imagehash.average_hash(Image.open(path_0))
         hash_1 = imagehash.average_hash(Image.open(path_1))
         hashDiff = 35

在下面,我们将启动一个条件来检查 hash_0hash_1 是否小于 hashDiff(35)。 如果小于 35,则表示它们是相似的图像。现在我们正在使用 shutil 模块将重复的图像移动到名为“duplicates_folder”的文件夹中。

if hash_0 - hash_1 <hashDiff:
   orginal=os.path.join(folder,os.listdir(folder)[j])
   target=os.path.join(r'duplicates_folder',os.listdir(folder)[j])
   shutil.move(orginal,target)

下面是整个代码:

from PIL import Image
import imagehash
from os import listdir
import shutil
folder=r'name_of_the_folder_having_all_the_images' 
for i in range(len(os.listdir(folder))):
     for j in range(i+1,len(os.listdir(folder))):
            path_0=os.path.join(folder,os.listdir(folder)[i])
            path_1=os.path.join(folder,os.listdir(folder)[j])
            hash_0 = imagehash.average_hash(Image.open(path_0))
            hash_1 = imagehash.average_hash(Image.open(path_1))
            hashDiff = 35
            if hash_0 - hash_1 <hashDiff:
                    orginal=os.path.join(folder,os.listdir(folder)[j])
                    target=os.path.join(r'duplicates',os.listdir(folder)[j])
                    shutil.move(orginal,target)
                    break
print("Done")

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

Python for 循环中的下一项

发布时间:2023/04/26 浏览次数:179 分类:Python

本文讨论了 Python 中的 for 循环以及如何通过使用 for 循环和示例来跳过列表的第一个元素。

Python While 循环用户输入

发布时间:2023/04/26 浏览次数:148 分类:Python

我们可以在 while 循环中使用 input() 函数来输入数据,直到在 Python 中满足某个条件。

Python 中的整数规划

发布时间:2023/04/26 浏览次数:193 分类:Python

本文介绍了整数规划和可用于解决混合整数规划问题的 Python 工具。

在 Python 中将整数转换为罗马数字

发布时间:2023/04/26 浏览次数:87 分类:Python

本篇文章将介绍在 Python 中将整数转换为罗马数字。以下是一个 Python 程序的实现,它将给定的整数转换为其等效的罗马数字。

在 Python 中将罗马数字转换为整数

发布时间:2023/04/26 浏览次数:144 分类:Python

本文讨论如何在 Python 中将罗马数字转换为整数。 我们将使用 Python if 语句来执行此操作。 我们还将探讨在 Python 中将罗马数字更改为整数的更多方法。

在 Python 中读取 gzip 文件

发布时间:2023/04/26 浏览次数:70 分类:Python

本篇文章强调了压缩文件的重要性,并演示了如何在 Python 中使用 gzip 进行压缩和解压缩。

在 Python 中锁定文件

发布时间:2023/04/26 浏览次数:141 分类:Python

本文解释了为什么在 Python 中锁定文件很重要。 这讨论了当两个进程在没有锁的情况下与共享资源交互时会发生什么的示例,为什么在放置锁之前知道文件状态很重要,等等

在 Python 中将 PDF 转换为文本

发布时间:2023/04/26 浏览次数:196 分类:Python

在本教程中,我们将学习如何使用 Python 使用 PyPDF2、Aspose 和 PDFminer 将 PDF 文档转换为文本文件。

在 Python 中创建临时文件

发布时间:2023/04/26 浏览次数:53 分类:Python

本文讲解了tempfile库函数的四个子函数:TemporaryFile、NamedTemporaryFile、mkstemp、TemporaryDirectory。 每个部分都提供了适当的程序,以简化对概念的理解。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便