顔認証とは、画像や動画の中の被写体を特定したり、身元を確認したりする技術のことを指します。
最初の顔認識アルゴリズムは1970年代初頭に開発されました。それ以来、その精度は飛躍的に向上し、現在では、指紋や虹彩認識など、従来よりも堅牢なものとされてきた生体認証法よりも、顔認証を好む傾向にあります。
顔認証が他の生体認証法よりも人気がある大きな違いの一つは、顔認証が本質的に非侵襲的であるということです。例えば、指紋認証ではセンサーに指を押し当てる必要があり、虹彩認証ではカメラに非常に近づける必要があり、音声認識では大きな声で話す必要があります。対照的に、最近の顔認証システムでは、ユーザはカメラの視野内にいることだけで十分です(カメラから適度な距離にいることを前提としています)。これにより、顔認証は最も使い勝手の良い生体認証法となります。
また、監視システムなど、利用者がシステムに協力することが期待できない環境でも顔認証を導入することができるため、応用の可能性が広がるということです。顔認識の他の一般的なアプリケーションには、アクセス制御、不正行為の検出、認証、ソーシャルメディアなどがあります。
制約のない環境に配備された場合、顔認識は、現実世界における顔画像の表現のばらつきが大きいため、最も困難な生体認証方法の一つでもあります(このような顔画像は、しばしば自然顔(自然顔)と呼ばれています)。 顔画像の可変的な側面には、頭部のポーズ、年齢、咬合、照明条件、顔の表情などがあります。
顔認証の技術は年々大きく変化しています。 従来の手法は、人為的に設計された特徴(エッジやテクスチャ記述子など)と機械学習技術(主成分分析、線形判別分析、サポートベクターマシンなど)の組み合わせに依存しています。
これまでの研究者は、制約のない環境で異なる変化に頑健な特徴量を設計することが難しいから、異なる年齢、異なる姿勢、異なる照明条件などに対応できる手法など、それぞれの変化に特化した手法に注目してきました。 近年、従来の顔認識手法は、畳み込みニューラルネットワーク(CNN)をベースとした深層学習手法に代わられています。
非常に大規模なデータセットで訓練して、これらのデータを特徴付けるための最適な特徴を学習できることです。このような顔認識手法は、顔画像のロバストな特徴を学習することができるため、訓練プロセスで使用された顔画像によって提示される実世界の変動に対応でき、非常に高いレベルの精度を達成しています。
コンピュータビジョンにおけるディープラーニング手法の人気が高まっていることで、CNNは他にもターゲットの検出·認識、セグメンテーション、光学的文字認識、顔の表情分析、年齢推定など、多くのコンピュータビジョンのタスクを解決するために利用されており、顔認識の研究が加速しています。