學界 | 曾刷新兩項世界紀錄，騰訊優圖人臉檢測演演算法 DSFD 正式開源

大千世界 · 發表於 2019-4-10 02:52

　　　　2019-04-09 20:26公司/設計/騰訊

　　AI 科技評論按：近年來，卷積神經網路在人臉檢測中取得了很大的成功，然而這些方法在處理人臉中多變的尺度，姿態，遮擋，表情，光照等問題時依然比較困難。為此，騰訊優圖推出名為 DSFD （中文名為雙分支人臉檢測器）的全新演演算法，該演演算法在著名人臉檢測數據集上取得喜人結果，如今騰訊優圖決定將之進行開源。

　　

　　騰訊優圖的研究員們發現，雖然之前的人臉檢測演演算法大都採用深度學習模型，並在特徵學習的過程中也有採用特徵金字塔網路（Feature Pyramid Network），但在面對遮擋、暗光、大姿態、小臉等複雜場景時，仍容易出現誤檢或漏檢的情況。因此，在 FPN 基礎上，騰訊優圖團隊採用了 3 種不同級聯方式的空洞卷積（Dilated Convolution），設計了特徵增強模塊 FEM，充分學習到了不同感受野下的人臉特徵。

　　本文提出了一種新的方法，分別處理了人臉檢測方向的三個關鍵點，包括更好的特徵學習，漸進式的損失函數設計以及基於錨點分配的數據擴充：

　　（1）新的「特徵增強」模塊（FEM：Feature Enhance Module）

　　FEM 在採用 Top-Down 層間信息融合的同時，在同一「感受野」內做了更多的 enhancement。因此在 width and depth 上學習到了更有效的 context 和 semantic 信息。

　　（2）「分層錨點漸進」式的代價函數監督（PLA：Progressive Anchor Loss）

　　模型採用 2 個層級（hierarchy），基於第一層（low-level）和第二層（high-level）的差異性，適配了不同尺寸的 anchor。在訓練過程中，PAL 對整個模型形成了更有效的監督。

　　（3）「改進的錨點匹配策略」（Improved Anchor Matching Strategy）

　　One-stage detector 由於在輸出層分配有密集的 anchor，anchor 與 face 匹配的好壞直接影響訓練效果。優圖的研究人員 data augmentation 過程中充分考慮了不同大小的 face 和各個 anchor 的關係，提出了一種新的數據擴增法。

　　

　　DSFD 演演算法

　　該演演算法已被計算機視覺頂級會議CVPR 2019接收，原文《DSFD: Dual Shot Face Detector》（https://arxiv.org/abs/1810.10220v2）由南京理工大學計算機科學與工程學院 PCALab 與騰訊優圖實驗室合作完成。

　　在兩個著名的人臉檢測數據集 WIDER FACE 和 FDDB 的 5 個評測維度上，DSFD 演演算法均刷新了當時的世界紀錄，取得了 Top1 的人臉檢測結果：

　　

　　WIDER FACE 評測結果

　　

　　FDDB 評測結果

　　為了與更多同行探討 DSFD 演演算法的實際應用，騰訊優圖在近日公布了開源地址：

　　Github開源地址：https://github.com/TencentYoutuResearch/FaceDetection-DSFD

　　據了解，目前騰訊優圖的人臉檢測技術已在安防、金融、社交、交通等多個應用場景落地，並在手機 QQ、微眾銀行、天天 P 圖等多個公司內外部產品上進行應用驗證。

　　點擊閱讀原文，查看 CVPR 小組，了解 CVPR 2019 的最新動態