HONEY BEE 101K は Renesas SH-Mobile APE5R を搭載した
Android スマートフォンです。
CPU Core は ARM Cortex-A9 1.2GHz の dual、
GPU core は PowerVR SGX543MP2 と意外なほどパワフルです。
・KYOCERA HONEY BEE 101K
GPU である PowerVR SGX543MP2 は iPhone 4S/iPad2 に使われており、
4core 版 SGX543MP4 は iPad 3 や PS Vita で有名です。
ところが Android ではほとんど見かけることがありませんでした。
触る機会があったので試してみました。
・CPU info/GPU Caps/Extension 等
Android なので PVRTC だけでなく ETC1 もサポートされています。
テクスチャサイズが 4096 になっただけで、Extension 等それ以外の
機能は PowerVR SGX540 とほとんど同じです。
GL_EXT_shadow_samplers も無く iOS 5 になる前の iPad2 に
似ているかもしれません。
・GPU ベンチマーク
速度はそこそこですが走らせるにあたりいくつか問題がありました。
(1) GL_OUT_OF_MEMORY が出やすい
glDrawElements() で GL_OUT_OF_MEMORY が発生することがあります。
「CPU info/GPU Caps/Extension 等」のページに meminfo の値も追加してみました。
比べてみると GPU に割り当てられていると思われる領域が
101K の場合少ないようです。
ただしこれが本当に GPU memory に影響しているのか、
また GL_OUT_OF_MEMORY の原因なのかどうかはわかりません。
例えば Tegra3 である TF201 も少なくなっています。
その代わり他のデバイスには存在しない DirectMap4k/DirectMap2M という
エントリが存在しており、おそらく他のデバイスとは異なる方法で
GPU メモリを管理していると考えられます。
(2) 3D 描画しているのに CPU clock が低下する
画面を操作している間だけ描画フレームレートが上昇することに
気が付きました。
CPU clock をモニタリングしてみると、ベンチマークの 3D 描画中も
300MHz 程度まで clock が下がっているようです。
画面を連打していると 1.2GHz 近くまで上がるため、ユーザー操作が
ない場合は描画負荷が高くても cpu を寝かせる仕様なのかもしれません。
ハイエンド機ではないので当然かもしれませんが、RAM も少な目で
GPU をあまり活かしきれていないのが少々残念でした。
Android スマートフォンです。
CPU Core は ARM Cortex-A9 1.2GHz の dual、
GPU core は PowerVR SGX543MP2 と意外なほどパワフルです。
・KYOCERA HONEY BEE 101K
GPU である PowerVR SGX543MP2 は iPhone 4S/iPad2 に使われており、
4core 版 SGX543MP4 は iPad 3 や PS Vita で有名です。
ところが Android ではほとんど見かけることがありませんでした。
触る機会があったので試してみました。
・CPU info/GPU Caps/Extension 等
Android なので PVRTC だけでなく ETC1 もサポートされています。
テクスチャサイズが 4096 になっただけで、Extension 等それ以外の
機能は PowerVR SGX540 とほとんど同じです。
GL_EXT_shadow_samplers も無く iOS 5 になる前の iPad2 に
似ているかもしれません。
・GPU ベンチマーク
速度はそこそこですが走らせるにあたりいくつか問題がありました。
(1) GL_OUT_OF_MEMORY が出やすい
glDrawElements() で GL_OUT_OF_MEMORY が発生することがあります。
「CPU info/GPU Caps/Extension 等」のページに meminfo の値も追加してみました。
比べてみると GPU に割り当てられていると思われる領域が
101K の場合少ないようです。
ただしこれが本当に GPU memory に影響しているのか、
また GL_OUT_OF_MEMORY の原因なのかどうかはわかりません。
OS RAM MemTotal (RAM-MemTotal)
--------------------------------------------------------------
ZEN Touch2 2.1 256MB 185.2MB 70.8MB
ZiiO 7 2.1 512MB 408.3MB 103.7MB
LuvPad AD100 2.2 512MB 438.3MB 73.7MB
Desire X06HT 2.2 576MB 415.2MB 160.1MB
Galaxy S SC-02B 2.2 512MB 302.1MB 209.9MB
Xperial arc SO-01C 2.3 512MB 335.4MB 176.6MB
Xperial ray SO-03C 2.3 512MB 335.4MB 176.6MB
HONEY BEE 101K 2.3 512MB 478.1MB 33.9MB
Novo7 Paladin 4.0 512MB 334.9MB 177.0MB
SXZ-PD10 4.0 512MB 368.3MB 143.7MB
EVO 3D ISW12HT 2.3 1024MB 808.1MB 215.9MB
Galaxy S2 SC-02C 2.3 1024MB 836.9MB 187.1MB
Galaxy Nexus SC-04D 4.0 1024MB 631.2MB 392.8MB
Optimus Pad L-06C 3.1 1024MB 662.3MB 361.7MB
Galaxy Tab 10.1 SC-01D 3.2 1024MB 756.7MB 267.3MB
EeePad TF201 4.0 1024MB 983.2MB 40.8MB (*1)
*1: DirectMap4k/DirectMap2M
例えば Tegra3 である TF201 も少なくなっています。
その代わり他のデバイスには存在しない DirectMap4k/DirectMap2M という
エントリが存在しており、おそらく他のデバイスとは異なる方法で
GPU メモリを管理していると考えられます。
(2) 3D 描画しているのに CPU clock が低下する
画面を操作している間だけ描画フレームレートが上昇することに
気が付きました。
CPU clock をモニタリングしてみると、ベンチマークの 3D 描画中も
300MHz 程度まで clock が下がっているようです。
画面を連打していると 1.2GHz 近くまで上がるため、ユーザー操作が
ない場合は描画負荷が高くても cpu を寝かせる仕様なのかもしれません。
ハイエンド機ではないので当然かもしれませんが、RAM も少な目で
GPU をあまり活かしきれていないのが少々残念でした。
2012/04/23
Android SXZ-PD10 Cortex-A5 の速度
Cortex-A5 搭載 Android 端末 SXZ-PD10
(SHENZHEN LINK-CREATE TECHNOLOGY PD10 普及版)
を試してみました。
CPU や GPU のデータは下記ページにまとめています
・CPU/GPU
以下抜粋です。
Cortex-A5 は vfpv4 ですが cpuinfo の Features では vfpv3。
・ARM vfp の種類
上記のように SXZ-PD10 は Cortex-A5 1.2GHz + Mali-400 で
Android 4.0 が搭載されています。
実際にプログラムを走らせた結果は次のページにまとめています。
・CPU benchmark
以下は部分的に抜き出したものです。
single thread のテストなので Multi core CPU や HT 対応 CPU でも
1 thread 分の速度なので注意してください。
Cortex-A5 は同時に実行できる命令数が半分なので、上位の CPU より
遅くなっています。
ところがこの Cortex-A5 には vfpv4 + neon が搭載されており、
浮動小数点演算ではかなり高速であることがわかりました。
・CPU bench FPU
Cortex-A8 のように vfp で遅くなることもなく、vfp/neon 共に高速に
実行できています。
GPU の結果は下記ページに追加しています。
・Mobile GPU bench mark
関連エントリ
・2012/02/15 Android 4.0 MIPS で RenderScript, ainol Novo 7 Paladin の浮動小数点演算速度
・2012/01/14 Android 4.0 RenderScript Compute の速度 その2
・2011/11/07 Android 3.x RenderScript (7) RenderScript Compute の速度
(SHENZHEN LINK-CREATE TECHNOLOGY PD10 普及版)
を試してみました。
CPU や GPU のデータは下記ページにまとめています
・CPU/GPU
以下抜粋です。
Processor : ARMv7 Processor rev 1 (v7l) BogoMIPS : 415.33 Features : swp half thumb fastmult vfp edsp thumbee neon vfpv3 CPU implementer : 0x41 CPU architecture: 7 CPU variant : 0x0 CPU part : 0xc05 CPU revision : 1 GL_VERSION: OpenGL ES 2.0 GL_RENDERER: Mali-400 MP GL_VENDOR: ARM GL_SHADING_LANGUAGE_VERSION: OpenGL ES GLSL ES 1.00
Cortex-A5 は vfpv4 ですが cpuinfo の Features では vfpv3。
・ARM vfp の種類
上記のように SXZ-PD10 は Cortex-A5 1.2GHz + Mali-400 で
Android 4.0 が搭載されています。
実際にプログラムを走らせた結果は次のページにまとめています。
・CPU benchmark
以下は部分的に抜き出したものです。
SoC / CPU MB/sec T/GHz device ------------------------------------------------------------------ MSM7225 ARM11 600MHz 6.99 11.65 IDEOS JZ4770 XBurst1 1.0GHz 16.40 16.40 Novo7 Paladin TCC8923 Cortex-A5 1.2GHz 18.42 15.35 SXZ-PD10 MSM8255 Scorpion 1.0GHz 24.82 24.82 Xperia ray SC-03C Tegra2 Cortex-A9 1.0GHz 25.11 25.11 OptimusPad L-06C Atom Z540 1.86GHz 30.44 16.37 VAIO Type P VGN-P90S Exynos4210 Cortex-A9 1.2GHz 33.42 27.85 Galaxy S2 SC-02C Tegra3 Cortex-A9 1.3GHz 36.15 25.82 EeePad TF201 APQ8060 Scorpion 1.5GHz 42.64 28.43 Galaxy Tab SC-01D MB/sec の数値が大きい方が速い。 整数演算のみ。single thread (single core) のみ。 ・MB/sec = 1秒あたりの変換byte数 ・T/GHz = MB/sec を CPU 1GHz あたりの速度に変換したもの
single thread のテストなので Multi core CPU や HT 対応 CPU でも
1 thread 分の速度なので注意してください。
Cortex-A5 は同時に実行できる命令数が半分なので、上位の CPU より
遅くなっています。
ところがこの Cortex-A5 には vfpv4 + neon が搭載されており、
浮動小数点演算ではかなり高速であることがわかりました。
・CPU bench FPU
Linpack 1.2.8 Single Multi MFLOPS MFLOPS Soc/CPU ------------------------------------------------------------------- 18.091 Cortex-A8 1.0GHz S5PC110 Galaxy S SC-02B 18.684 MIPS XBurst1 1.0GHz JZ4770 Novo7 Paladin 25.732 Cortex-A5 1.2GHz TCC8923 SXZ-PD10 35.628 Scorpion 1.0GHz QSD8250 Desire X06HT 31.142 57.331 Cortex-A9 x2 1.0GHz Tegra2 OptimusPad L-06C 46.164 74.664 Scorpion x2 1.2GHz MSM8660 EVO 3D ISW12HT 56.076 89.860 Scorpion x2 1.5GHz APQ8060 Galaxy Tab SC-01D 57.342 92.981 Cortex-A9 x2 1.2GHz Exynos4210 Galaxy S2 SC-02C 47.071 140.908 Cortex-A9 x4 1.3GHz Tegra3 EeePad TF201 MFLOPS の数値が大きいほうが速い
Render NDK VFP NEON
CPU Script Java Java2 C++ asm asm
--------------------------------------------------------------------
JZ4770 XBurst1 1.0GHz 289 479 11736 158 - -
TCC8923 Cortex-A5 1.2GHz 67 295 6798 57 35 23
S5PC110 Cortex-A8 1.0GHz - 698 1012 166 139 20
Tegra 2 Cortex-A9 1.0GHz 50 243 1219 75 46 -
Tegra 3 Cortex-A9 1.3GHz 38 172 3634 42 35 34
APQ8060 Scorpion 1.5GHz - 279 1758 43 26 26
単位は実行時間(ms)、数値が小さいほうが速い。
Cortex-A8 のように vfp で遅くなることもなく、vfp/neon 共に高速に
実行できています。
GPU の結果は下記ページに追加しています。
・Mobile GPU bench mark
関連エントリ
・2012/02/15 Android 4.0 MIPS で RenderScript, ainol Novo 7 Paladin の浮動小数点演算速度
・2012/01/14 Android 4.0 RenderScript Compute の速度 その2
・2011/11/07 Android 3.x RenderScript (7) RenderScript Compute の速度
2012/04/19
PlayStation Suite と対応ハードの性能比較
PlayStation Suite Developer Program より対応ハード一覧。
2012/04/19 現在。
すべて ARMv7A + OpenGL ES 2.0 世代。
機能的には Tegra2, 速度的には single core 1.0GHz + Adreno205 が
最低スペックとなるようです。
素の Android で同等の開発を行う場合 Java + OpenGL ES 2.0 となりますが、
PC 上で同作する Emulator が安定しなかったり、最近になってやっと
GPU や OpenGL ES 2.0 がサポートされたりと、
端末や OS 互換性の問題だけでなく開発環境そのものにも制約が多かったのも事実。
PSS は簡単に導入できて Emulator まであっさり起動するので
Android の苦労が嘘のようです。
上の表はこちらにもまとめています。
・PlayStation Suite 対応ハード
2012/04/19 現在。
device SoC CPU core GPU core RAM display ------------------------------------------------------------------------------- Xperia PLAY MSM8255 Scorpion 1.0GHz Adreno 205 512MB 854x480 Xperia arc MSM8255 Scorpion 1.0GHz Adreno 205 512MB 854x480 Xperia acro MSM8255 Scorpion 1.0GHz Adreno 205 512MB 854x480 Sony Tablet P Tegra250 Cortex-A9 1.0GHz x2 ULP GeForce(8) 1GB 1024x960 Sony Tablet S Tegra250 Cortex-A9 1.0GHz x2 ULP GeForce(8) 1GB 1280x800 Xperia acro HD MSM8260 Scorpion 1.5GHz x2 Adreno 220 1GB 1280x720 Xperia S MSM8260 Scorpion 1.5GHz x2 Adreno 220 1GB 1280x720 Xperia ion MSM8260 Scorpion 1.5GHz x2 Adreno 220 1GB 1280x720 PS Vita Cortex-A9 ?GHz x4 PowerVR SGX543MP4+ 640MB 960x544
すべて ARMv7A + OpenGL ES 2.0 世代。
機能的には Tegra2, 速度的には single core 1.0GHz + Adreno205 が
最低スペックとなるようです。
素の Android で同等の開発を行う場合 Java + OpenGL ES 2.0 となりますが、
PC 上で同作する Emulator が安定しなかったり、最近になってやっと
GPU や OpenGL ES 2.0 がサポートされたりと、
端末や OS 互換性の問題だけでなく開発環境そのものにも制約が多かったのも事実。
PSS は簡単に導入できて Emulator まであっさり起動するので
Android の苦労が嘘のようです。
上の表はこちらにもまとめています。
・PlayStation Suite 対応ハード
2012/04/18
Mobile CPU core の速度比較
ARM や MIPS、Atom 等さまざまな CPU を比べてみました。
・CPU benchmark
厳密なテストとは言いがたいので参考程度にお願いします。
コンパイラの違いでも結構差が出ているようです。
関連エントリ
・Android 4.0 ainol Novo 7 Paladin、MIPS CPU の NDK と Vivante GPU
・CPU benchmark
厳密なテストとは言いがたいので参考程度にお願いします。
コンパイラの違いでも結構差が出ているようです。
関連エントリ
・Android 4.0 ainol Novo 7 Paladin、MIPS CPU の NDK と Vivante GPU
2012/03/17
iPad 3 PowerVR SGX543MP4 の速度
更新しました。
・Mobile GPU bench mark
間違いなく PowerVR SGX543MP4 は最強です。
これまでのハイエンドグループのスコアの 2倍程度出ています。
でもそれをもってしても 2048x1536 の解像度は一筋縄では
いかないようです。
速度優先ならレンダリング解像度を下げる必要がありそうです。
またこれだけハイレゾになるとピクセルに負担をかけるのは現実的で
ないので、多くの処理を頂点で行い 3D モデルを適度に
ハイポリ化した方が良いと思われます。
2D も 3D もベクタ化を考えた方が良さそうです。
関連エントリ
・頂点性能の比較 その2 (OpenGL ES 2.0 Mobile GPU)
・A5 PowerVR SGX543MP2 は iOS 5 だと速い
・さらに OpenGL ES 2.0 Mobile GPU の速度比較
・OpenGL ES 2.0 Mobile GPU の速度比較 (dual core世代) 更新
・Mobile GPU bench mark
間違いなく PowerVR SGX543MP4 は最強です。
これまでのハイエンドグループのスコアの 2倍程度出ています。
でもそれをもってしても 2048x1536 の解像度は一筋縄では
いかないようです。
速度優先ならレンダリング解像度を下げる必要がありそうです。
またこれだけハイレゾになるとピクセルに負担をかけるのは現実的で
ないので、多くの処理を頂点で行い 3D モデルを適度に
ハイポリ化した方が良いと思われます。
2D も 3D もベクタ化を考えた方が良さそうです。
関連エントリ
・頂点性能の比較 その2 (OpenGL ES 2.0 Mobile GPU)
・A5 PowerVR SGX543MP2 は iOS 5 だと速い
・さらに OpenGL ES 2.0 Mobile GPU の速度比較
・OpenGL ES 2.0 Mobile GPU の速度比較 (dual core世代) 更新
| 次のページ(日付が古い方向)>>