ARMキー・テクノロジー解説02 ―― Mali-T600シリーズで実現可能になる組み込み向けGPUコンピューティングとアプリケーション例

菅波 憲一

tag: 組み込み

2012年11月 9日

 

●キャッシュコヒーレンシ


 スマートフォンでGPUコンピューティングを実行するケースとして,写真,動画などを扱う処理が想定されますが,写真や動画データはデータサイズが非常に大きく,CPUとGPU間でのデータの受け渡しで頻繁に発生するメモリアクセスがボトルネックとなり,システム全体の性能を大きく落としてしまいます.よって,高速にかつ効率的に処理を実行するためには,CPUとGPU間のキャッシュのコヒーレンシが非常に重要です.Mali-T600シリーズはCCI(Cache Coherent Interconnect)をサポートするAMBAのバスアーキテクチャで動作するようにデザインされています.キャッシュデータはシステム上に共存するARM CPUと共有できるため,外部メモリーへのアクセスが大きく低減できます.


●GPUコンピューティングの実行を容易にするフレームワークOpenCL/Renderscript


 GPUコンピューティングを実行するためには様々な手段がありますが,現在,OpenCLやRenderscriptといったGPUコンピューティングに最適なフレームワークが,いよいよ本格的に市場に展開される時期に来ています.これらのフレームワークは演算精度や算術演算機能なども仕様として規定にしており,浮動小数点演算についてはIEEE754を規定しています.


 Mali-T600シリーズはOpenCL Full Profile v1.1に準拠し,v1.2にも準拠する予定です.


 これによって,既にOpenCLで開発したアプリケーションはMali-T600シリーズでそのまま実行することが可能になります.逆にOpen CL Full Profileに準拠していないGPUの場合,既にOpenCLで開発したアプリケーションを実行させた場合に期待した演算結果が出ない可能性があります.また,Mali-T600シリーズはこれらの演算機能のほとんどをハードウェアで実装しているため,算術演算の実行でCPUのリソースを消費することなく,システム性能を下げることはありません.


●GPUコンピューティングによりひろがるComputer Vision


 Computer Visionとは,算術演算を用いた写真や動画の加工技術で,実世界から取得した映像・画像データを解析して元の画像を加工したり,そこから必要なデータを抽出したりする技術です.


 そのため,膨大で多岐にわたるアルゴリズムの実行可能なプラットフォームが必要となります.今日これらのアプリケーションは既にスマートフォンやタブレットで幅広く利用されていますが,実行するのに非常に大きなCPUリソースを必要とするアプリケーションであるため,限られたCPUリソースのもとでは機能や性能は制限されてしまいます.


 Mali-T600シリーズが実現するGPUコンピューティングでは,撮った写真の品質をさらに向上させ,エフェクト機能を向上させる複雑なImage Filterや,あらかじめ登録してある自分や家族,友達の顔を認識してタグ付けし,特定のフォルダにその写真を保存させるための顔認識技術(写真3),露出を変えつつ撮影した複数枚の写真を合成することで白飛びや黒つぶれの少ない幅広いダイナミックレンジを持つHDR(High Dynamic Range Imaging)画像(写真4),SW処理による手ぶれ補正,パノラマ写真技法などもCPUリソースを脅かすことなく実行可能になります.


写真3 顔認識技術

 


写真4 HDR画像

 

 

 またComputer Visionは,自動車産業の分野においてはADAS(Advanced Driver Assistance)の一つの機能として非常に大きな注目を集めています.例えば,車載のカメラが前方,後方,側面から車外の映像を取得し,即座に障害物や歩行者,標識などを認識することで事故を未然に防ごうとする場合,迅速で正確な演算結果が求められます.


 GPUコンピューティングはこれまで限られた特殊用途もしくは高価なシステムでしか実行できないものでした.しかし,Mali-T604を搭載した製品が年末から続々と市場にリリースされることによって,2013年はGPUコンピューティングがユーザーにとってより身近で実現可能なものとなると予想しています.


 Mali-T600シリーズが実現するGPUコンピューティングは,スマートフォンやタブレット,デジタルTVにおけるGUIやComputer Vision,インターネットアプリケーションの実行性能をより最適にかつ効率的に実行することを可能にします.

 


すがなみ・けんいち
アーム(株)メディアプロセッシング部門 ビジネスデベロップメント マネージャー

 

http://www.event-info.com/arm-seminar2012/

ARM Technology Symposium 2012 Japan Preview TOP

 

«  1  2
組み込みキャッチアップ

お知らせ 一覧を見る

電子書籍の最新刊! FPGAマガジン No.12『ARMコアFPGA×Linux初体験』好評発売中

FPGAマガジン No.11『性能UP! アルゴリズム×手仕上げHDL』好評発売中! PDF版もあります

PICK UP用語

EV(電気自動車)

関連記事

EnOcean

関連記事

Android

関連記事

ニュース 一覧を見る
Tech Villageブログ

渡辺のぼるのロボコン・プロモータ日記

2年ぶりのブログ更新w

2016年10月 9日

Hamana Project

Hamana-8最終打ち上げ報告(その2)

2012年6月26日