倍可親

標題: 學界 | 曾刷新兩項世界紀錄,騰訊優圖人臉檢測演演算法 DSFD 正式開源 [列印本頁]

作者: 大千世界    時間: 2019-4-10 02:52
標題: 學界 | 曾刷新兩項世界紀錄,騰訊優圖人臉檢測演演算法 DSFD 正式開源
    2019-04-09 20:26公司/設計/騰訊

  AI 科技評論按:近年來,卷積神經網路在人臉檢測中取得了很大的成功,然而這些方法在處理人臉中多變的尺度,姿態,遮擋,表情,光照等問題時依然比較困難。為此,騰訊優圖推出名為 DSFD (中文名為雙分支人臉檢測器)的全新演演算法,該演演算法在著名人臉檢測數據集上取得喜人結果,如今騰訊優圖決定將之進行開源。

  

  騰訊優圖的研究員們發現,雖然之前的人臉檢測演演算法大都採用深度學習模型,並在特徵學習的過程中也有採用特徵金字塔網路(Feature Pyramid Network),但在面對遮擋、暗光、大姿態、小臉等複雜場景時,仍容易出現誤檢或漏檢的情況。因此,在 FPN 基礎上,騰訊優圖團隊採用了 3 種不同級聯方式的空洞卷積(Dilated Convolution),設計了特徵增強模塊 FEM,充分學習到了不同感受野下的人臉特徵。

  本文提出了一種新的方法,分別處理了人臉檢測方向的三個關鍵點,包括更好的特徵學習,漸進式的損失函數設計以及基於錨點分配的數據擴充:

  (1)新的「特徵增強」模塊(FEM:Feature Enhance Module)

  FEM 在採用 Top-Down 層間信息融合的同時,在同一「感受野」內做了更多的 enhancement。因此在 width and depth 上學習到了更有效的 context 和 semantic 信息。

  (2)「分層錨點漸進」式的代價函數監督(PLA:Progressive Anchor Loss)

  模型採用 2 個層級(hierarchy),基於第一層(low-level)和第二層(high-level)的差異性,適配了不同尺寸的 anchor。在訓練過程中,PAL 對整個模型形成了更有效的監督。

  (3)「改進的錨點匹配策略」(Improved Anchor Matching Strategy)

  One-stage detector 由於在輸出層分配有密集的 anchor,anchor 與 face 匹配的好壞直接影響訓練效果。優圖的研究人員 data augmentation 過程中充分考慮了不同大小的 face 和各個 anchor 的關係,提出了一種新的數據擴增法。

  

  DSFD 演演算法

  該演演算法已被計算機視覺頂級會議CVPR 2019接收,原文《DSFD: Dual Shot Face Detector》(https://arxiv.org/abs/1810.10220v2)由南京理工大學計算機科學與工程學院 PCALab 與騰訊優圖實驗室合作完成。

  在兩個著名的人臉檢測數據集 WIDER FACE 和 FDDB 的 5 個評測維度上,DSFD 演演算法均刷新了當時的世界紀錄,取得了 Top1 的人臉檢測結果:

  

  WIDER FACE 評測結果

  

  FDDB 評測結果

  為了與更多同行探討 DSFD 演演算法的實際應用,騰訊優圖在近日公布了開源地址:

  Github開源地址:https://github.com/TencentYoutuResearch/FaceDetection-DSFD

  據了解,目前騰訊優圖的人臉檢測技術已在安防、金融、社交、交通等多個應用場景落地,並在手機 QQ、微眾銀行、天天 P 圖等多個公司內外部產品上進行應用驗證。

  點擊閱讀原文,查看 CVPR 小組,了解 CVPR 2019 的最新動態






歡迎光臨 倍可親 (https://big5.backchina.com/) Powered by Discuz! X3.1