皆様からのご意見・ご要望を募集中!
サイトの品質向上のため、アンケートにご協力をお願いします。
(所要時間:3分程度)

アンケートに答える

後で回答する

回答しない

TDK
Tech-Mag TDK Techno Magazine 〜テクマグ〜
サイト内検索
メールマガジン登録個人情報保護基本方針
home
電気と磁気の?館
じしゃく忍法帳
フェライト・ワールド
column
テクの雑学
アースサイエンス&TDKテクノロジー
パワーエレクトロニクス・ワールド
コンデンサ・ワールド
なるほどノイズ(EMC)入門2
なるほどノイズ(EMC)入門1
過去の読み物

TDKホームページ
 トップページテクの雑学 > 第132回 もはやピント合わせは不要? 最適な表情までもナビするデジタルカメラ
テクの雑学

第132回 もはやピント合わせは不要? 最適な表情までもナビするデジタルカメラ

豊富なデータベースで、高精度の認識が可能
 では、いったい、どうやって人間の顔を認識しているのでしょう?
 さまざまな方式がありますが、ここでは、最も広く普及していると考えられる手順を例に説明してみます。

 最初に、人間の「顔」を構成する各パーツと、その配置を幾何学的情報に置き換えて数値化し、それらを特定の「パターン」として集約したテンプレートを作っておきます。人の顔は、地域や性別、年代などによって大きく異なっていますが、口が目より上に付いている人はいませんし、鼻が口より下に付いている人もいません。そのような定義を行いつつ、顔の構成要素を純粋な幾何学的パターンに置き換えると、想像よりは狭い範囲に収まってしまうようです。テンプレート化にあたっては、色の濃淡情報が用いられることが多いようです。デジタル画像は、非常に高精細とはいえ基本的にはドットマトリクスですから、顔表面にある凹凸によって生じる陰影を、色の濃淡パターンとして扱うことで、多くのパターンを高速に認識することができます。

*ドットマトリクス: 小さな点(ドット)の集合(マトリクス)で文字や図形を表現する方式。一般に使われているプリンタには、さまざまな印刷方式があるが、そのほとんどはドットマトリクス方式に分類できる。


 ここからが実際に撮影する場合の手順になります。顔認識の基本は、撮像素子から入力された光学的な情報を2次元の画像データとして扱い、特定の処理を加えることで、「パターン」として認識できるようにすることです。おおざっぱな流れとしては、最初に「顔領域の検出と切り出し」を行います。撮像素子に入力された光学情報を信号化して処理装置に送り、その中に「顔」と判断できるパターンがあるかどうかを調べる工程です。顔が検出されたら、その部分の向きが基準(まっすぐ正面を向いた)状態に変換する「正規化処理」を行ってから、そこにある「特徴点」を抽出します。ここでいう特徴とは、両目の距離や鼻の幅といった「幾何学的特徴」や、顔の色彩やその変化と濃淡、また画像情報の「境目」や「角」などを検出して利用する「パターン分布特徴」などを指します。そして最後に、ここまでの作業で算出された顔の情報を、データベースに登録済みのパターンと照合して、その顔の持ち主の年齢や性別といった属性を判別します。

 顔領域の検出は、「肌色領域検出」と「テンプレートマッチング」を組み合わせて使うことが多いようです。人間の肌と推測できる色の範囲を決めておき、画像の中にそれが含まれていたら、色の濃淡パターンに置き換えて数値化したテンプレートと照合することで、顔か否かを判断します。


 画像中に顔と判断できる情報が見つかったら、次に「ガボールフィルタ」を使って特徴点の抽出を行ないます。ガボールフィルタは、人間の視覚処理の一部をモデル化したもので、難しく言うと「ガウス関数を用いて、サイン(SIN)/コサイン(COS)波などのパターンと位置を区別する空間フィルタ」ということになりますが、要は画像を細分化して方向を変えるといったフィルタ処理を行い、それぞれの局所的な濃淡の情報を取り出しながら、周期性や方向性のパターン認知の精度を高めるしくみと考えればいいでしょう。

 次に、パターンを特定の形に固定した上で処理を加えながら、パターンと周囲の波形がどのように変化するかを観察し、その特徴を抽出します。この過程で、広い周波数に渡って解析できる「ウェーブレット関数」を用いることから、この手順を「ガボール・ウェーブレット変換」と呼びます。この手法は、画像の局所的な情報を使って判断するため、照明などの影響を受けにくいこと、さまざまな方向と濃淡の周期による特徴情報が抽出できるので、顔の向きによる濃淡パターンの変化などにも対応しやすいといった特徴から、個人認証などの高度な顔認識システムに多く採用されています。

 このような計算処理によって得られた情報と、データベース化されている統計データとを照合し、「人間の顔」であると判断できるパターンの有無や、その属性を判断しているわけです。

 最後に、副次的な処理を行います。デジタルカメラは、撮像素子から入力された光学情報を元に、「画像処理エンジン」が特定のルールに沿って「絵を描く」ものです。そのルールの中に、「顔があったら、肌部分の色調やコントラストを調整して、より自然で美しく見えるようにする」といった機能を実現していくわけです。笑顔を認知してシャッターを切るには、「笑顔データベース」を使う手法や、「顔を認知→口を認知→口角が持ち上がったり、歯が見えたら笑顔」と認知する手法が用いられています。また、顔の持ち主の属性を判断することで、冒頭に記した「子どもの顔に優先的にピントを合わせる」といった処理も可能になります。

 顔認識技術は、今後、さまざまな分野に応用されていくと予想されます。たとえば、自動車のモニタ用カメラに応用すれば、特定の状況(たとえば駐車のための操作中など)で、周囲に人がいることを察知して注意喚起する、といった用途が考えられます。
 反面、公共の場所に設置される防犯用カメラなどへの応用は、プライバシー侵害の観点から議論が必要なところです。用途と、その功罪については、みなさんも関心を持って見守り続けていただきたいと思います。


著者プロフィール:松田勇治(マツダユウジ)
1964年東京都出身。青山学院大学法学部卒業。在学中よりフリーランスライター/エディターとして活動。
卒業後、雑誌編集部勤務を経て独立。
現在はMotorFan illustrated誌、日経トレンディネットなどに執筆。
著書/共著書/編集協力書
「手にとるようにWindows用語がわかる本」「手にとるようにパソコン用語がわかる本 2004年版」(かんき出版)
「記録型DVD完全マスター2003」「買う!録る!楽しむ!HDD&DVDレコーダー」「PC自作の鉄則!2005」(日経BP社)
「図解雑学・量子コンピュータ」「最新!自動車エンジン技術がわかる本」(ナツメ社)など


前のページへ | 2/2 | 次のページへ

ページtop
HOME 電気と磁気の?(はてな)館 アースサイエンス&TDKテクノロジー テクの雑学 コンデンサ・ワールド
Copyright(c) 1996-2014 TDK Corporation. All rights reserved.
※記事の内容は、記事掲載時点での情報に基づいたものです。一部、現在TDKで扱っていない製品情報等も含まれております。
TDKホームページは、Internet Explorer5.5以降、Netscape Navigator7.0以降でご覧いただくことを推奨しています。