(圖/翻攝 Google 官方)
Google Pixel 3 號稱史上最強單鏡頭手機,強大的軟體支援及自家研發的「Pixel Visual Core」,拍出來的照片超越硬體極限。Google 近期在官方部落格公開,Pixel 3「最佳鏡頭」(Top Shot)的技術細節,讓使用者一窺 Google 的設計內幕。
要講解「最佳鏡頭」技術前,得先知道 Google Clip 這款 AI 微型照相機。體積略大於草莓,配有 Google 演算法技術,可針對鏡頭內的人物、場景進行辨識分析,並依據臉部表情分析出最佳照片,自動幫用戶按下快門、捕捉最佳場景。讓 AI 判斷快門時機,Google Clip 的實驗可說是「最佳鏡頭」技術的前身。
Google 表示,當使用者開啟相機,系統就會預設啟動「最佳鏡頭」,自動捕捉按下快門瞬間前後 1.5 秒內的 90 張照片。最狂的是,Google 知道你按下快門的時機,不見得這麼即時,因此就連按下快門前的畫面連帶一起捕捉。系統會挑出兩張照片供用戶選擇,第一張是使用者自行設定的原始照片,第二張則是依據特徵評分,Google 認為最佳的畫面。 (圖/翻攝 Android Central)
如何判定「最佳鏡頭」呢?Google 列出三個標準,首先是照片的基本屬性,包含照明與光源;第二則是客觀條件,例如眼睛是否張開、有沒有微笑;最後則是主觀品質,例如情緒的表達。Pixel 3 會先分析照片是否模糊,接著再透過一連串複雜的公式,針對客觀、主觀條件進行評分。這部分的數據與模型,就仰賴 Google 早期累積的數據,以及不斷對機器進行的模擬與訓練。
為了讓系統的審美觀與大眾一致,Google 找來數百名受測者,分別有不同族群、性別與年齡,請他們依據人物、自拍、風景、動態等不同分類的照片,從數張照片中挑出最喜歡的一張,Google 在藉此建立相關模型與特徵。
Google 文中還敘述許多較為專業的神經網路技術,並且搭配機器學習和優化硬體,從各方面來建構 Pixel 3 的拍照功能。簡單來說,藉由 Pixel Visual Core 晶片,Pixel 3 能夠即時、低功耗的進行相片分析,硬體端受限於電力以及散熱的限制,也須針對模型進行最佳化處理,「最佳鏡頭」技術可說是軟硬體結合的最佳應用範例。
|