Ryzen Zen3 の vfpbench 結果

Zen4 と順序が逆になりましたが Zen3 の結果も手に入れることができました。モバイル向け APU、Ryzen 5 5560U です。

実行ユニットは Zen2 同様 256bit の乗算(積和) x2 + 加算 x2 の構成です。そのため単純な fma 換算ではピーク値が Zen2 と変わらない fma x2 となるのですが、Zen3 の場合少々結果が異なります。

AVX vmulps (32bit x8) n8          :    0.172    64245.3     8030.7  (  8.0 3.5)
AVX vaddps (32bit x8) n8          :    0.172    64267.0     8033.4  (  8.0 3.5)
AVX vmul+addps (32bit x8) n8      :    0.086   128217.7    16027.2  (  8.0 7.0)
FMA vfmaddps (32bit x8) n8        :    0.214   103087.1     6442.9  ( 16.0 2.8)
FMA vfmaddps (32bit x8) n12       :    0.275   120290.1     7518.1  ( 16.0 3.3)
FMA vfma+mlps (32bit x8) n12      :    0.258    96422.6     8035.2  ( 12.0 3.5)
FMA vfma+adps (32bit x8) n12      :    0.172   144552.0    12046.0  ( 12.0 5.2)
AVX vml+ad+adps (32bit x8) n9     :    0.244    50965.1     6370.6  (  8.0 2.8)

fma x2 よりも fma + add の方が値が高くなっており、fma x 2 に加えて add も十分なスループットで回っているように見えます。ピーク値も追加の add 命令の分だけ上昇しています。パイプライン構成自体は大きく変わらないものの、Zen2 より命令発行数と実行効率が向上し、演算性能が上がっている事がわかります。

Zen4 の場合はこれに加えてさらに AVX512 にも対応します。fma だけ見ると違いがないように見えるかもしれませんが、世代毎に演算能力は上がっています。

関連エントリ

Pixel 7a Google Tensor G2 の vfpbench の結果

Google の Pixel 7a は Pixel 7 や Fold と同じ Tensor G2 が搭載されています。Tensor G2 でも vfpbench を走らせてみました。

Tensor G2 には 3種類の CPU Core が搭載されています。

Cortex-A55x41.80 GHz
Cortex-A78x22.35 GHz
Cortex-X1x22.85 GHz

それぞれの結果を詳しく見ると、A55 はスカラーの add, mul, fma や 64bit 演算で 2命令走りますが 128bit 演算では 1命令です。よって 64bit 演算 x2 の構成であることがわかります。

A55
FPU fmul (32bit x1) n8            :    0.319     3389.7     3389.7  (  1.0 1.9)
FPU fadd (32bit x1) n8            :    0.334     3243.8     3243.8  (  1.0 1.8)
FPU fmadd (32bit x1) n8           :    0.319     6785.6     3392.8  (  2.0 1.9)
NEON fmul.4s (32bit x4) n12       :    0.924     7027.6     1756.9  (  4.0 1.0)
NEON fadd.4s (32bit x4) n12       :    0.928     6995.3     1748.8  (  4.0 1.0)
NEON fmla.4s (32bit x4) n12       :    0.924    14046.3     1755.8  (  8.0 1.0)

対して A78 はスカラーも 128bit 演算も変わらず 2命令で一定なので、128bit x2 になります。

A78
FPU fmul (32bit x1) n8            :    0.301     4676.9     4676.9  (  1.0 2.0)
FPU fadd (32bit x1) n8            :    0.301     4678.5     4678.5  (  1.0 2.0)
FPU fmadd (32bit x1) n8           :    0.301     9353.7     4676.9  (  2.0 2.0)
NEON fmul.4s (32bit x4) n12       :    0.452    18712.2     4678.1  (  4.0 2.0)
NEON fadd.4s (32bit x4) n12       :    0.452    18713.6     4678.4  (  4.0 2.0)
NEON fmla.4s (32bit x4) n12       :    0.452    37368.1     4671.0  (  8.0 2.0)

最上位の Cortex-X1 はスカラー・ベクター関係なく add/mul 演算で 4命令、fma で 2命令です。fma のピーク値だけ見るとあまり差がないように見えますが、128bit x4 と演算能力が大きく拡張されており高いスループットが期待できます。

X1
FPU fmul (32bit x1) n8            :    0.151    11337.4    11337.4  (  1.0 4.0)
FPU fadd (32bit x1) n8            :    0.150    11370.1    11370.1  (  1.0 4.0)
FPU fmadd (32bit x1) n8           :    0.301    11364.5     5682.3  (  2.0 2.0)
NEON fmul.4s (32bit x4) n12       :    0.226    45347.7    11336.9  (  4.0 4.0)
NEON fadd.4s (32bit x4) n12       :    0.226    45353.3    11338.3  (  4.0 4.0)
NEON fmla.4s (32bit x4) n12       :    0.448    45813.8     5726.7  (  8.0 2.0)

まとめると以下の通りです。

s-adds-muls-fmav-addv-mulv-fma
Cortex-A5522211164bit x2
Cortex-A78222222128bit x2
Cortex-X1442442128bit x4

関連エントリ

Meta Quest シリーズの価格変化のまとめ

Meta Quest (Oculus Quest) の価格の変動をまとめてみました。

2019/052020/092021/072022/082023/032023/062023/102024/01
Quest 1 64GB$399
49800
Quest 1 128GB$499
62800
Quest 2 64GB$299
37180
Quest 2 128GB$299
37180
$399
59400
変更なし$299
47300
変更なし$299
39600
Quest 2 256GB$399
49280
変更なし$499
74400
$429
64405
$349
53900
変更なし$349
46200
Quest 3 128GB$499
74800
変更なし
Quest 3 512GB$649
96800
変更なし

Meta Quest3 の CPU (Snapdragon XR2 Gen2)

Meta Quest 3 は今年 (2023年) の 10月に発売されたばかりの最新の VR ヘッドセットです。Inside Out のセルフトラッキングのみで 6.6DoF を実現する Quest シリーズの 3世代目であり、カラーパススルーに対応したことで MR ゲームもプレイできるようになりました。

シースルー型の HoloLens と違い、ディスプレイ部が視界の一部のみに限られていることもありません。HoloLens に期待していた世界が Quest3 でようやく現実になったといえます。

MR 機能だけでなく、世代が上がりプロセッサもトラッキングも強化されています。特にコントローラーはトラッキング用の LED リングが無くだいぶ小さくなりました。VR というより Switch のような左右分離型のただのゲームコントローラーに見えます。

その Quest3 で以前 Termux が動くことを確認したので同時に vfpbench も走らせてみました。ただし実行中も画面の描画やトラッキングは行われていたため、結果の値には注意が必要です。プロセッサ自体のピーク性能ではなく、GPU やトラッキングにリソースが奪われている状態での結果と思ってください。

スペックによると Quest 3 のプロセッサは Qualcomm Snapdragon XR2 Gen2 が採用されていることがわかります。

https://www.meta.com/jp/quest/quest-3/#specs

計測結果は以下の通り

vfpench MetaQuest3

アプリケーションから見えるプロセッサは 6 Core で 2+4 の 2グループでした。

CPU Thread:  6
CPU Core  :  6
CPU Group :  2
  Group 0: Thread= 2  Clock=2.054400 GHz  (mask:3)
  Group 1: Thread= 4  Clock=2.361600 GHz  (mask:3c)

この両グループの結果を比べてみると、各命令の IPC には明確な差がなくクロック以外はほぼ同等となっています。そのため同じ CPU core が使われている可能性があります。なおこの情報だけではプロセッサの種類まで特定することはできませんでした。

NEON fmul.2d (64bit x2) n12       :    0.819     5189.4     2594.7  (  2.0 1.1)
NEON fadd.2d (64bit x2) n12       :    0.816     5209.8     2604.9  (  2.0 1.1)
NEON fmla.2d (64bit x2) n12       :    0.819    10376.6     2594.1  (  4.0 1.1)

64bit と 128bit に差がないのでリトルコアではなく、また fma と mul/add の差もないため、X1~X3 のようなハイエンドコアでも無さそうです。ただし計測結果はミドルコアのクロックにしてはあまり高くないので、バックグラウンドでパフォーマンスが奪われていたのかもしくは動作中に想定よりクロックが落ちていた可能性があります。この結果はあくまで参考程度でお願いします。

Total:
SingleThread HP max:   42.163 GFLOPS
SingleThread SP max:   21.240 GFLOPS
SingleThread DP max:   10.445 GFLOPS
MultiThread  HP max:  263.868 GFLOPS
MultiThread  SP max:  134.370 GFLOPS
MultiThread  DP max:   63.517 GFLOPS

関連エントリ

SteamDeck に Ubuntu で開発環境を作る (Distrobox)

SteamDeck の最新の OS には最初から Distrobox がプリインストールされており、簡単に Ubuntu などの環境を入れられることがわかりました。前回の vfpbench は SD-Card から起動した Windows11 上で走らせましたが、今回は SteamOS 上でそのまま実行できるように Ubuntu を入れてみます。

● デスクトップの設定

以降の一連の作業は USB Hub 経由で SteamDeck に USB のキーボードとマウスを接続した状態で行っています。Bluetooth のキーボード&マウスでも構いません。

(1) デスクトップに切り替える

  1. STEAM ボタン → 電源 →「デスクトップに切り替え」

元のゲーミングモードに戻るには、デスクトップ左上の「Return to Gaming Mode」のアイコンダブルクリックかログアウトを行います。

(2) キーボード配列を日本語に変更する場合

  1. 左下の Application Launcher アイコンクリック→ Settings → System Settings
  2. 一番上の Keyboard → Layouts Tab を開く
  3. 「Configure layouts」にチェックを入れる → 「+ Add」をクリック
  4. “Japanese” で検索して「Japanese (OADG 109A)」を選択
  5. デフォルトで入っている「us English (US)」を選択して「- Remove」をクリック
  6. 右下の「Apply」をクリック

(3) 表示言語を日本語に変更する場合

  1. 左下の Application Launcher アイコンクリック→ Settings → System Settings
  2. Regional Settings → Language 右端の「Modify…」
  3. 「Change Launguage」→「日本語」を選択→右下の「Apply」→右上の「Restart now」→「OK」
  4. 再起動後、ゲーミングモードになっている場合は再び STEAM→電源→「デスクトップに切り替え」

● Distrobox で Ubuntu をインストールする

Distrobox / podman 自体のインストール手順は不要です。公式 Image を使ってクリーンインストールした状態でも /usr/bin にコマンドが含まれていることを確認しました。

  1. 左下の「アプリケーションランチャー」アイコンクリック → システム→ Konsole (KDE Terminal) でコンソールを開く
  2. 以下内容で ~/.distroboxrc ファイルを作成します
xhost +si:localuser:$USER
export PIPEWIRE_RUNTIME_DIR=/dev/null
  1. コンソールで以下のコマンドを実行
$ distrobox create -i ubuntu:22.04

Do you want to pull the image now? [Y/n]: に Y を入力

  1. 以下のコマンドを実行
$ distrobox enter ubuntu-22-04

以後、4. のコマンドだけで Ubuntu 環境に入ることが可能です。またはアプリケーションランチャーからも直接「Ubuntu-22-04」のアイコンを探して起動することができます。

● Ubuntu 環境の設定など

あとは Ubuntu 上で apt コマンドを使ってソフトウエアのインストールができます。

例 vfpbench のために git, clang を入れる

$ sudo apt update
$ sudo apt upgrade -y
$ sudo apt install -y git clang

例 vim + uim-mozc を使った日本語入力を行う場合

  1. ソフトウエアをインストールします

予め (3) の日本語表示設定をしておく必要があります。

$ sudo apt install vim
$ sudo apt install language-pack-ja
$ sudo apt install uim-fep uim-mozc
  1. 以下の内容で ~/.uim ファイルを作成しておきます。
(define default-im-name 'mozc)
(define-key generic-on-key? '"<Control> ")
(define-key generic-off-key? '"<Control> ")
  1. 起動します
$ export LANG=ja_JP.UTF-8
$ uim-fep

例 vscode を使う

  1. https://code.visualstudio.com/Download から 「.deb」「x64」 をダウンロードしておきます。
  2. 以下のコマンドでインストール&起動します
$ sudo apt install ./code_~_adm64.deb
$ code

活用など

SteamDeck の SteamOS はスマートフォンのように電源ボタンで簡単にスリープ可能で復帰も安定しています。持ち歩ける開発環境として便利に使えそうです。

関連エントリ