光通信、映像伝送ビジネスの実務者向け専門情報サイト

光通信ビジネスの実務者向け専門誌 - オプトコム

有料会員様向けコンテンツ

従来技術の半分の学習データ量でも高精度に識別可能なディープラーニング技術を開発【NEC】

DX/IoT/AI 無料

従来技術との違い

 NECは8月19日、従来の半分程度の学習データ量でも高い識別精度を維持できるディープラーニング技術を新たに開発したと発表した。
 識別精度の向上には、識別が難しい学習データをより多く学習することが有効だが、学習に適した質の良いデータを十分に確保することが重要だ。今回発表された技術は、ニューラルネットワークの中間層で得られる特徴量を意図的に変化させることで、識別が難しい学習データを集中的に人工生成するというもの。これにより、少ない学習データ量でも識別精度を大きく向上させ、ディープラーニングを適用したシステムの開発期間短縮に貢献するという。
 NECは「具体的には、ディープラーニング技術の適用に必要な学習データ量を半分程度に削減する。また本技術は、データの種類を問わず汎用的に適用可能であることから、専門家による調整が不要になる。これにより従来、学習データ収集時間やコストの高さが阻害要因となっていた製品の外観検査やインフラ保全など、さまざまなシステムの早期立ち上げを可能にする」としている。

技術の特長

必要となる学習データを従来技術に比べ半分に削減
 識別精度の向上には、識別が難しい「苦手な学習データ」をより多く学習することが有効であると広く知られている。データ拡張と呼ばれる従来技術では、ニューラルネットワークに入力する前にデータを意図的に加工・変形させ、学習データ量を人工的に増やしていた(例えば画像に対しては、回転や拡大・縮小、ノイズの付加など)。しかし、このような増やし方では、「苦手な学習データ」の量が不十分で、かつ識別精度向上に寄与しないデータも多く生成され、十分な学習効果が得られなかった。
 対して今回の技術は、ニューラルネットワークの中間層で得られる特徴量を意図的に変化させることで、識別が失敗しやすい「苦手な学習データ」を集中的に人工生成し識別精度を高めるという。NECは「本技術を公開データベース(手書き数字認識:MNIST、物体認識:CIFAR-10(注3))にて評価し、学習データ量が半分でも従来技術と精度が変わらないことを確認した」としている。

データの種類の違いによる専門家の調整が不要
従来のデータ拡張では、データの種類毎にデータの生成方法を変える必要があった。例えば、画像では大きさや回転角度など、音声では声の高さや話す速さなどを変えることでデータを人工的に増やしていった。さらに、専門家がデータ生成方法を慎重に選び、学習に悪影響を及ぼすデータが発生しないよう調整する必要があった。
対して今回の技術は、ニューラルネットワーク内部の数値に基づいて自動的に学習データを生成するため、多様なデータに対して汎用的かつ効率良く適用することができ、専門家による調整を不要にする。

公開データに対する評価結果


従来技術では生成困難な識別が苦手な学習データ(文字認識:概念図)