倍可親
標題:
學界 | 曾刷新兩項世界紀錄,騰訊優圖人臉檢測演演算法 DSFD 正式開源
[列印本頁]
作者:
大千世界
時間:
2019-4-10 02:52
標題:
學界 | 曾刷新兩項世界紀錄,騰訊優圖人臉檢測演演算法 DSFD 正式開源
2019-04-09 20:26公司/設計/騰訊
AI 科技評論按:近年來,卷積神經網路在人臉檢測中取得了很大的成功,然而這些方法在處理人臉中多變的尺度,姿態,遮擋,表情,光照等問題時依然比較困難。為此,騰訊優圖推出名為 DSFD (中文名為雙分支人臉檢測器)的全新演演算法,該演演算法在著名人臉檢測數據集上取得喜人結果,如今騰訊優圖決定將之進行開源。
騰訊優圖的研究員們發現,雖然之前的人臉檢測演演算法大都採用深度學習模型,並在特徵學習的過程中也有採用特徵金字塔網路(Feature Pyramid Network),但在面對遮擋、暗光、大姿態、小臉等複雜場景時,仍容易出現誤檢或漏檢的情況。因此,在 FPN 基礎上,騰訊優圖團隊採用了 3 種不同級聯方式的空洞卷積(Dilated Convolution),設計了特徵增強模塊 FEM,充分學習到了不同感受野下的人臉特徵。
本文提出了一種新的方法,分別處理了人臉檢測方向的三個關鍵點,包括更好的特徵學習,漸進式的損失函數設計以及基於錨點分配的數據擴充:
(1)新的「特徵增強」模塊(FEM:Feature Enhance Module)
FEM 在採用 Top-Down 層間信息融合的同時,在同一「感受野」內做了更多的 enhancement。因此在 width and depth 上學習到了更有效的 context 和 semantic 信息。
(2)「分層錨點漸進」式的代價函數監督(PLA:Progressive Anchor Loss)
模型採用 2 個層級(hierarchy),基於第一層(low-level)和第二層(high-level)的差異性,適配了不同尺寸的 anchor。在訓練過程中,PAL 對整個模型形成了更有效的監督。
(3)「改進的錨點匹配策略」(Improved Anchor Matching Strategy)
One-stage detector 由於在輸出層分配有密集的 anchor,anchor 與 face 匹配的好壞直接影響訓練效果。優圖的研究人員 data augmentation 過程中充分考慮了不同大小的 face 和各個 anchor 的關係,提出了一種新的數據擴增法。
DSFD 演演算法
該演演算法已被計算機視覺頂級會議CVPR 2019接收,原文《DSFD: Dual Shot Face Detector》(
https://arxiv.org/abs/1810.10220v2
)由南京理工大學計算機科學與工程學院 PCALab 與騰訊優圖實驗室合作完成。
在兩個著名的人臉檢測數據集 WIDER FACE 和 FDDB 的 5 個評測維度上,DSFD 演演算法均刷新了當時的世界紀錄,取得了 Top1 的人臉檢測結果:
WIDER FACE 評測結果
FDDB 評測結果
為了與更多同行探討 DSFD 演演算法的實際應用,騰訊優圖在近日公布了開源地址:
Github開源地址:
https://github.com/TencentYoutuResearch/FaceDetection-DSFD
據了解,目前騰訊優圖的人臉檢測技術已在安防、金融、社交、交通等多個應用場景落地,並在手機 QQ、微眾銀行、天天 P 圖等多個公司內外部產品上進行應用驗證。
點擊閱讀原文,查看 CVPR 小組,了解 CVPR 2019 的最新動態
歡迎光臨 倍可親 (https://big5.backchina.com/)
Powered by Discuz! X3.1