K-means 寻找图像主体颜色

  • 编辑栏
 
 
几个月前,我写了篇文章“纯python编写K-means算法,提取图片中的主体颜色”,找到图片中的显著颜色。 今天突发奇想,能不能把k-means用于图片压缩呢?对图像rgb三个通道进行聚类,得到中心点像素,并填充对应的类别区域,我找来了一张上海的图片进行压缩

我的代码如下,由于在jupyte编辑器上写的代码,因此显示图片使用的matplotlib模块

import numpy as np
import matplotlib.pyplot as plt
from skimage import io
import cv2 as cv
import os
from sklearn.cluster import KMeans

img = io.imread('shanghai.jpg')
img = np.array(img, dtype=np.float64) / 255

plt.axis('off')
plt.imshow(img)

outImgPath = '/data/githubFile/outImgBlog'
if not os.path.exists(outImgPath):
os.makedirs(outImgPath)


# 定义函数完成kemans功能
def KMeansImage(img, k):
w, h, c = img.shape
dd = np.reshape(img, (w * h, c))
km = KMeans(n_clusters=k)
km.fit(dd)
labels = km.predict(dd)
centers = km.cluster_centers_
new_img = img.copy()
for i in range(w):
for j in range(h):
ij = i * h + j
new_img[i][j] = centers[labels[ij]]
return {'new_image': new_img, 'center_colors': centers}


plt.figure(figsize=(12, 9))
plt.imshow(d)
plt.axis('off')
plt.show()
for i in range(200, 1000, 100):
print('Number of clusters:', i)
out = KMeansImage(img=img, k=i)
centers, new_image = out['center_colors'], out['new_image']
print('new_image.shape:', new_image.shape)
plt.figure(figsize=(12, 1))
plt.imshow([centers]);
plt.axis('off')
plt.show()

# 使用算法跑出的中心点,生成一个矩阵,为数据可视化做准备
result = []
result_width = 200
result_height_per_center = 80

for center_index in range(i):
result.append(np.full((result_width * result_height_per_center, centers.shape[1]), centers[center_index] * 255,
dtype=int))
result = np.array(result)
result = result.reshape((result_height_per_center * i, result_width, centers.shape[1]))

# # 保存图片
imgName = 'block-%s.jpg' % i
cv.imwrite(os.path.join(outImgPath, imgName), result)

plt.figure(figsize=(12, 9))
plt.imshow(new_image)
plt.axis('off')
plt.show()
imgName = 'outputImg-%s.jpg' % i
cv.imwrite(os.path.join(outImgPath, imgName), new_image * 255)

当k为2时(左侧为提取出的主体颜色,右侧为使用提起出的主体颜色描绘的图片),图片中仅有两种颜色,非常单调。

当k为3时,图片中有三种颜色,最明显的变化是天空开始分层了。

当k为5时,可以看出,比上面两幅图片颜色层次更加丰富了,天空分层更多。

当k为11时

当k为51时,天空分层更多,其他部分也开始显示出彩色,由于照片是晚上拍的,可以看到,提取到的51种颜色,大都是深色。

当k为151时,色彩更加丰富了,天空层次的过度也更加自然。

当k为200时,图片的色彩过度已经很自然啦。

观察上面的图片,可以看到,当K值增大的时候,图片的色彩会更加丰富,画面变得更加细腻。

跑代码的过程中,也存在一些问题:

 

  1. K-means的速度实在是太慢了!可以考虑将图片压缩降低分辨率后,再计算主体颜色。
  2. 提取到的颜色存在一定的随机性,相同的K值,跑出来的结果存在差异。

The End


已发布

分类

标签:

评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注