倍可親

回復: 0
列印 上一主題 下一主題

學界 | 曾刷新兩項世界紀錄,騰訊優圖人臉檢測演演算法 DSFD 正式開源

[複製鏈接]

7492

主題

1萬

帖子

2萬

積分

貝殼光明大使

Rank: 6Rank: 6

積分
23113
跳轉到指定樓層
樓主
大千世界 發表於 2019-4-10 02:52 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
    2019-04-09 20:26公司/設計/騰訊

  AI 科技評論按:近年來,卷積神經網路在人臉檢測中取得了很大的成功,然而這些方法在處理人臉中多變的尺度,姿態,遮擋,表情,光照等問題時依然比較困難。為此,騰訊優圖推出名為 DSFD (中文名為雙分支人臉檢測器)的全新演演算法,該演演算法在著名人臉檢測數據集上取得喜人結果,如今騰訊優圖決定將之進行開源。

  

  騰訊優圖的研究員們發現,雖然之前的人臉檢測演演算法大都採用深度學習模型,並在特徵學習的過程中也有採用特徵金字塔網路(Feature Pyramid Network),但在面對遮擋、暗光、大姿態、小臉等複雜場景時,仍容易出現誤檢或漏檢的情況。因此,在 FPN 基礎上,騰訊優圖團隊採用了 3 種不同級聯方式的空洞卷積(Dilated Convolution),設計了特徵增強模塊 FEM,充分學習到了不同感受野下的人臉特徵。

  本文提出了一種新的方法,分別處理了人臉檢測方向的三個關鍵點,包括更好的特徵學習,漸進式的損失函數設計以及基於錨點分配的數據擴充:

  (1)新的「特徵增強」模塊(FEM:Feature Enhance Module)

  FEM 在採用 Top-Down 層間信息融合的同時,在同一「感受野」內做了更多的 enhancement。因此在 width and depth 上學習到了更有效的 context 和 semantic 信息。

  (2)「分層錨點漸進」式的代價函數監督(PLA:Progressive Anchor Loss)

  模型採用 2 個層級(hierarchy),基於第一層(low-level)和第二層(high-level)的差異性,適配了不同尺寸的 anchor。在訓練過程中,PAL 對整個模型形成了更有效的監督。

  (3)「改進的錨點匹配策略」(Improved Anchor Matching Strategy)

  One-stage detector 由於在輸出層分配有密集的 anchor,anchor 與 face 匹配的好壞直接影響訓練效果。優圖的研究人員 data augmentation 過程中充分考慮了不同大小的 face 和各個 anchor 的關係,提出了一種新的數據擴增法。

  

  DSFD 演演算法

  該演演算法已被計算機視覺頂級會議CVPR 2019接收,原文《DSFD: Dual Shot Face Detector》(https://arxiv.org/abs/1810.10220v2)由南京理工大學計算機科學與工程學院 PCALab 與騰訊優圖實驗室合作完成。

  在兩個著名的人臉檢測數據集 WIDER FACE 和 FDDB 的 5 個評測維度上,DSFD 演演算法均刷新了當時的世界紀錄,取得了 Top1 的人臉檢測結果:

  

  WIDER FACE 評測結果

  

  FDDB 評測結果

  為了與更多同行探討 DSFD 演演算法的實際應用,騰訊優圖在近日公布了開源地址:

  Github開源地址:https://github.com/TencentYoutuResearch/FaceDetection-DSFD

  據了解,目前騰訊優圖的人臉檢測技術已在安防、金融、社交、交通等多個應用場景落地,並在手機 QQ、微眾銀行、天天 P 圖等多個公司內外部產品上進行應用驗證。

  點擊閱讀原文,查看 CVPR 小組,了解 CVPR 2019 的最新動態

一直被朋友稱為小博士。其實就是書讀得多一些而已。

您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2024-4-25 12:01

快速回復 返回頂部 返回列表