速記AI課程-手把手的機器學習(四)

高智敏
4 min readMar 24, 2018

Our Recent Advances and Experiences on Deep Learning for Computer Vision

從中研院到台大電機的王鈺強教授,專攻電腦視覺,與業界合作經驗豐富。不過著重的議題-遷移學習(Transfer Learning)已在其他課程提過,就沒有這麼驚艷,倒是最後的冤獄案頗讓人耳目一新。

在圖像辨識領域,已經可以看出下圖有幾個人、這些人在幹嘛以及有人站在體重計上,不過,比較困難、需要高階理解力的問題還是需要努力,如照片在哪照的、為什麼這張照片好笑等。

歐巴馬惡搞隨扈

為什麼需要挑戰這麼難的問題?其中一個應用,是讓廣告置入與投放,可以在影片或內容對的時間點,投給正確的受眾。以Youtube廣告為例,雖然有自動內容審查機制暴力,但還是有不少廣告主的影片被放到仇恨影片中,引起不少廣告主開始抵制Google廣告。因此,如果可以讓電腦看懂影片是不當內容,進而避免投放廣告,將是多大的市場!

現在的影像辨識應用很廣,大家也多半都很熟悉,如各種生物辨識、OCR、運動賽事輔助、AR/VR、Style Transfer、自駕車、機器人等等。

NBA黑科技
步態分析(GAIT), 不可能的任務:失控國度有出現過

遷移學習(Transfer Learning)的基本概念是透過某領域資料訓練的模型,應用到另一個相似領域應用。如文字的翻譯,可先訓練西歐語系的翻譯,接著再應用在中文並進行調教,或是書評機器人跑去練習影評,自駕車的模型先在GT(電腦賽車遊戲)中訓練。

最後王分享近期的幾個研究。一是如FaceApp一樣,可以創造原本不存在的表情、年紀甚至性別!

有點誇張的真實

另外,許多第一人視角影片(如GoPro)時間都很長,如何快速進行影片重點摘要(Summarization),並Highlight出精彩片段,也是熱門議題。

運動玩家很需要

機器自己學會修圖、補足監視器影像光線不足的問題、紅外線光模式轉換成正常日光、舊影片修復、缺漏影片段落預測等等,都是近期多所著墨之處。

而整場分享最酷的,應該是冤獄案的協助(詳細報導如下)。王提到利用平面的照片,轉呈人臉的3D模型,進而計算嫌疑犯與模糊監視器中是否為同一人的機率(結果7成不是它)。

非常清楚的3D人臉比對(雖然看起來還是好像…)

--

--