2024年9月27日 星期五

花蓮赤科山金針花+無中生有+Python影像內容辨識 (各位熟悉的標題又回來了)

東台灣三大金針花山頭,在結婚前夕於2014.07.171819成功打卡於六十石山忘憂亭(然後離開時把錢包留在現場,接著警察打電話來叫我於山腳下派出所領回),過來於2016.09.0203成功打卡於太麻里忘憂谷,然後在今年8月醫院評鑑結束後安排花蓮玉里3天2夜旅遊,再度到六十石山踩點打卡並攻下最後的金針花山頭-赤科山

後製-215

此次旅遊目的,其一為劃掉旅遊類別項下「攻下赤科山」,其二為讓兒子親臨現場看看滿坑滿谷的花海景觀(足以堪稱世界級美景)。親臨現場的感受,絕對不是在家用47吋液晶電視接Apple TV開Flickr app看過往拍攝作品所能比擬。

此次旅行出發前,我兒子已多次看過太麻里和六十石山相簿,所以出發前一晚睡覺前夕非常期待。

後製-225

後製-208


後製-148

好了,小弟我老毛病又發作了,開始惡搞,呼叫 PhotoShop !

AI生成


後製-130_AI

對於成品非常滿意(若鳥腳能完全扣掛在肩膀上就完美了)。另張圖被我搞成這樣

後製-132_AI

圖說註解:只是在海岸山脈盆地裡打撈些溪流小蝦來祭五臟廟,都是當地小農常吃的下酒菜。這裡的小蝦大概都長這樣,不用太驚嚇。

前後比較

圖片 20240917234808


接下來換Python登場!我慣用的Python IDE是Spyder。

使用haarcascade_frontalface_default.xml為人臉辨識參考資料庫(被專家訓練過的人臉識別模型),另使用yolov4.weights和yolov4.cfg做為物件類別辨識參考資料庫(也是被訓練過的模型),來頭極大,說明見以下網頁:

YOLOv4輕快準!邊緣即時偵測應用就靠它

YOLOv4 產業應用心得整理 - 張家銘

一眼揪出你有沒有超速!世界第一物件偵測技術: YOLOv4

當前最快最準的AI偵測技術!辨識車輛只要一眼瞬間——YOLOv4

先透過haarcascade_frontalface_default.xml識別人臉,成功抓出圖內3張臉!


過來使用嚴苛的超級團體照(圖片本身就不清楚)。可發現一半以上的臉未成功判定。此外也有一處(布條上出現「一張臉」)誤判情形,之後再找看看有否其它更精準的模型可使用。

前述有講到yolov4,所以它的前一代是yolov3,兩者辨別能力差異性如下:

簡言之,當x值往右邊跑,y值就會上升。y上升得愈快,辨識的準確性就愈高,就如同統計學裡的ROC curve。圖資訊充份說明yolov4辨識能力遠優於yolov3。

過來使用yolov4 辨別物件類型。

物品成功辨識


person 

person

bird

cell phone

dining table



2個person, 1個motorbike, 1個banana(0.503),banana率值過低,最後的確也誤判,那個是海龜燒 XD



斑馬特徵明顯,所以圖片模糊下照樣成功識別(率值高達0.986)。此拍攝於奇美博物館內。


1個person, 3個motorbike, 1個car,完美識別。

2張鳥圖大多數都識別成功了



前陣子很紅的AI生成圖,也成功識別,至於烏龜沒認出來,可能由於yolov4內無此類別。


下次換來玩影片內物件識別,且改抓Scaled-YOLOv4(含有三個重要模型,Tiny, CSG以及Large,分別針對低端、普通端和高端GPU)來識別影像內容。

以上,報告完畢。

沒有留言: