人工神經網路之5~影像分割

1-5.影像分割

前面提到的影像辨識僅能從一張圖片當中,判斷其內容是屬於哪一類物體。如果換個角度來看十幾萬個像素灰階值,經過模型計算輸出後,只能得到一個編號值,這是相當不經濟的

至少,模型應該可以從圖片中辨識多於一種物體而且各種物體的位置大小也都可以判讀出來這樣的神經網路,才能提供足夠多的訊息給使用者

影像分割的目的,就是要簡化影像的表示形式,使其更容易被理解和分析。這個領域的發展,近年來引進人工智慧的活力後點在於將圖片中的不同物體各自所包含的範圍,標記出一致性的灰階值。這種方式叫做語意分割(Semantic segmentation),意即對圖片內容涵意的理解

圖1-5-1. 語意分割處理前後的圖片

上面的第一張圖,是包含貓和狗兩種物體的圖片。神經網路取出貓和狗各自輪廓線所包含的範圍,各自標記其範圍內一樣的灰階值。在此狗標記紫色,貓標記褐色加上背景的黑色,圖中總共只有三種顏色,但這已經足夠讓模型判斷出圖片中有幾種物體,以及各種物體之形狀及位置了

上示圖片中每一像素都有三個灰階值,代表紅藍三原色

Leave a Comment

Your email address will not be published. Required fields are marked *

Shopping Cart