Pythonベースの画像強調技術-Python チュートリアル-php.cn

このチュートリアルを理論用語から始めましょう。画像の強化について話すとき、それは基本的に、元の画像よりも適切な画像の新しいバージョンが必要であることを意味します。たとえば、ドキュメントをスキャンすると、出力画像の品質が元の入力画像よりも低くなる可能性があります。したがって、出力画像の品質を向上させて、視聴者にとって視覚的により表現力豊かになる方法が必要であり、ここで画像強化が役立ちます。画像を強化するとき、私たちが行うことは、コントラストやエッジなどの画像の特徴を鮮明にすることです。

画像強調は画像の情報量を増やすものではなく、選択した特徴のダイナミックレンジを増やし、最終的に画像の品質を向上させることに注意してください。したがって、ここでは出力画像が実際にどのように見えるかはわかりませんが、出力画像の詳細を観察するなど、改善点があるかどうかを (主観的に) 知ることができるはずです。

画像強調は、デジタル画像処理 (つまり、セグメンテーション、表現) に含まれる基本ステップのうちの前処理ステップとしてよく使用されます。画像を強調するには多くの手法がありますが、このチュートリアルでは

画像逆変換

とべき乗則変換の 2 つの手法を紹介します。これらを Python で実装する方法を見ていきます。はじめましょう！画像反転

このセクションのタイトル (イメージ反転とも呼ばれます) から推測できるように、イメージ反転の目的は、入力イメージの暗い強度をイメージの明るい強度に変換することです。出力画像の明度を出力画像の暗度に変換します。言い換えれば、暗い領域はより明るくなり、明るい領域はより暗くなります。

I(i,j)

は、(i,j)に位置するピクセルの強度値を参照するとします。ここで明確にするために、グレースケールイメージの強度値は[0,255]の範囲内に収まりますが、(i,j)はそれぞれ行と列の値を指します。画像逆演算子をグレースケール画像に適用すると、出力ピクセルO(i,j)値は次のようになります。リーリー現在、ほとんどの画像はカラーです。これらのイメージには、red

、

green、blueの 3 つのチャネルが含まれており、RGBイメージと呼ばれます。この場合、上記の式とは反対に、各チャネルの強度を 255 から減算する必要があります。したがって、出力画像はピクセル(i ,j):にあります。リーリー導入の後で、Python で画像逆演算子を実装する方法を見てみましょう。簡単にするために、この演算子をグレースケールイメージで実行することに注意してください。ただし、この演算子をカラーイメージに適用する方法についていくつかのアイデアを示し、完全なプログラムは演習として残しておきます。カラー画像の場合、最初に行う必要があるのは、各ピクセルチャネル (RGB など) の強度値を抽出することです。これを行うには、Python イメージングライブラリ (PIL) を使用できます。引き続き、baboon.png からヒヒのサンプル画像をダウンロードします。画像のサイズは

500x500

です。ピクセル位置

(325, 432)

で赤、緑、青の強度値を抽出するとします。これは次のように実行できます:リーリードキュメントによると、メソッドgetpixel()の機能は次のとおりです。

指定された位置のピクセル値を返します。上記のスクリプトを実行すると、次の結果のみが得られることがわかります:

138

!しかし、3 つのチャンネルの (RGB) 強度値はどこにあるのでしょうか?この問題は、読み取られている画像の

mode

に関連しているようです。次のステートメントを実行してパターンを確認します:リーリー出力Pが得られます。これは、画像がパレットモードで読み取られたことを意味します。できることの 1 つは、さまざまなチャネルの強度値を返す前に、画像を RGB モードに変換することです。これを行うには、次のように

convert()

メソッドを使用します。リーリーこの場合、戻り値は(180, 168, 178)になります。これは、赤、緑、青チャネルの強度値がそれぞれ 180、168、178 であることを意味します。

これまで説明したことをすべてまとめると、画像の RGB 値を返す Python スクリプトは次のようになります:

リーリーイメージ逆演算子を続行する前に、あと 1 つのポイントが残っています。上の例は、の RGB 値を 1 つの

ピクセルだけ取得する方法を示していますが、逆演算子を実行する場合は、

すべての

ピクセルに対してそれを行う必要があります。

各ピクセルの異なるチャネルのすべての強度値を印刷するには、次の操作を実行できます:リーリーこの時点では、ピクセルごとにすべてのカラー画像チャネル (RGB など) に画像逆演算子を適用する方法を確認するための演習としてこれを残しておきます。

画像逆演算子をグレースケール画像に適用する例を見てみましょう。先に進んで、boat.png をダウンロードしてください。これは、このセクションのテストイメージとして機能します。次のようになります:

我将使用 numpy 库来完成此任务。在上面的图像上应用图像逆运算符的 Python 脚本应如下所示：

import cv2 import numpy as np from PIL import Image img = Image.open('boat.png') array_img = np.array(img) image_invert = np.invert(array_img) cv2.imwrite('new_boat.jpg', image_invert)

ログイン後にコピー

Numpy 是一个用于使用 Python 进行科学计算的 Python 包。 OpenCV-Python 是一个旨在解决计算机视觉问题的库。 OpenCV-Python 与 numpy 捆绑在一起，因此如果先安装 OpenCV-Python，则无需安装 numpy。我们首先用 Pillow 打开图像，然后将其转换为 numpy 数组。

然后我们使用numpy的invert()函数将图像反转并保存新的反转图像。invert()函数会将白色转换为黑色，反之亦然。

下面左边是原始图像，右边是新反转的图像。

请注意，应用该运算符后，图像的某些特征变得更加清晰。例如，看看右侧图像中的云彩和灯塔。

幂律变换

这个算子，也称为伽马校正，是我们可以用来增强图像的另一个算子。让我们看看算子方程。在像素(i,j)处，运算符如下所示：

p(i,j) = kI(i,j)^gamma

ログイン後にコピー

I(i,j)是图像位置处的强度值(i,j);k和gamma是正常数。我不会在这里讨论数学细节，但我相信您可以在图像处理书籍中找到该主题的详尽解释。但需要注意的是，在大多数情况下，k=1，所以我们主要是改变gamma的值。因此，上述方程可以简化为：

p(i,j) = I(i,j)^gamma

ログイン後にコピー

我将在这里使用OpenCV和NumPy库。如果您需要了解有关该库的更多信息，请查看我的教程 NumPy 简介。我们的测试图像将再次是boat.tiff（继续下载它）。

执行幂律变换运算符的 Python 脚本如下所示：

import cv2 import numpy as np im = cv2.imread('boat.tiff') im = im/255.0 im_power_law_transformation = cv2.pow(im,0.6) cv2.imshow('Original Image',im) cv2.imshow('Power Law Transformation',im_power_law_transformation) cv2.waitKey(0)

ログイン後にコピー

请注意，我们选择的 gamma 值是0.6。下图显示了原始图像以及对该图像应用幂律变换算子的结果（左图为原始图像，右图为应用幂律变换算子后的结果）。