A12Bionicについて
A12Bionicについて昨日知ったのですが、1秒間に5兆回という処理能力は、ちょっと疑問です。
SoCについてはあまり知らないのですが、IntelのCPUが5GHzマックスくらいの世界ではこのA12Bionicの存在は超越的に見えます(笑)。
何故、1秒間に5兆回の命令を実行できるのか不思議で仕方がないのですが、誰か知っておられる方、
教えてください。
PowerBook, Mac OS 9.2.x
A12Bionicについて昨日知ったのですが、1秒間に5兆回という処理能力は、ちょっと疑問です。
SoCについてはあまり知らないのですが、IntelのCPUが5GHzマックスくらいの世界ではこのA12Bionicの存在は超越的に見えます(笑)。
何故、1秒間に5兆回の命令を実行できるのか不思議で仕方がないのですが、誰か知っておられる方、
教えてください。
PowerBook, Mac OS 9.2.x
既出ですが Apple によると A12 Bionic は CPU(2 + 4 = 6 の非対称コア)、GPU(4 コア)、Neural Engine(8 コア)、ISP などで構成されているようです。
iPhone XS - A12 Bionic - Apple(日本)
(ttps://discussionsjapan.apple.com/message/101102691#message101102691)
ところで、
ottan3104 による書き込み:
A12Bionicについて昨日知ったのですが、1秒間に5兆回という処理能力は、ちょっと疑問です。 SoCについてはあまり知らないのですが、IntelのCPUが5GHzマックスくらいの世界ではこのA12Bionicの存在は超越的に見えます(笑)。 何故、1秒間に5兆回の命令を実行できるのか不思議で仕方がないのですが、誰か知っておられる方、 教えてください。
----------
書くなら、ちゃんと書いてくださいね。並列は8基と書いてありましたね。ただ、それでも5兆は12桁、5Gは9桁なんですね。8基で1000倍は無理でしょ?
----------
私が一番知りたかったのは、SoCであるA12Bionicで1チップパソコンとして、インテルの1000倍の性能にできるのではないか?と思っただけです。1秒間に5兆回の命令実行と言うのは、兆は12桁なので、Intelの5GHzと比べると1000倍のクロックスピードになりますね。確かにユニットは8基あって、並列に動くということにはなっていますが、Intelの場合のクロックは1クロックで1命令を実行できるわけではないので、数十クロックかかる演算も一杯あります。
----------
そういうわけで、今回のA12Bionicもそうなんですが、パソコンの実質性能も明らかに嘘なので、昨今のマシンと比べて、「これくらいの性能で良いんじゃない?」という「指標値」があるに過ぎないと私は思っているんですよ。たまたま、この「指標値」をA12Bionicと書かれたチップに与える!というようなものだと思いますね。
----------
それでも、A12bionicが5兆回の計算をしてくれるなら、私はやっぱり、「応援せざるを得ない」という状況だと思っているだけです。
これらは A12 Bionic と Neural Engine を事実上(あるいは総称やその類として)同一視しているように読めます。そもそも「毎秒5兆の演算処理」を行う Neural Engine は A12 Bionic の一部分に過ぎません(A12 Bionic のダイに占める Neural Engine の面積は CPU や GPU よりやや狭く見える)。
ついでに前出のリンク先から追加で引用しておきます(ただし A11 Bionic の話)。
引用:「AppleがNeural Engineの性能として、“operations per second”という単位を使ったことは、整数演算コアであることを暗示している。」
引用:「推論は、学習よりさらにデータの数値精度を落とすことが可能で、16-bit浮動小数点/整数から8-bit整数、4-bit整数、あるいはもっとイレギュラーな精度や、さらに極端にはバイナリ、そして混合精度までさまざまなアプローチが出てきている。」
それから表現の正しさを表現者の属性で直ちに判断して良いかどうかはともかく前出のリンク先の一方の人は半導体メーカーの設計者のようです。
念のため既出のリンク先の一部を引用しておきます(ただし A11 Bionic の話)。
【後藤弘茂のWeekly海外ニュース】iPhone Xの深層学習コア「Neural Engine」の方向性 - PC Watch
引用:「推論フェイズでは、データの数値精度をかなり落としても推論精度がそれほどは落ちない。そして、データの数値精度は、演算コアの電力消費やダイエリア、そしてデータ転送帯域及び外部メモリ帯域と密接に絡む。データ精度を落とせば落とすほど、電力やエリアの効率が高くなる。その分、演算ユニット数を増やして推論の性能を上げることができる。そのため、推論の精度と性能電力コスト(PPA:Performance, Power, Area)のトレードオフでバランスを取ることになる。とはいえ、どこまで数値精度を落としていいのか、見極めが難しいので、様子を見ながら徐々に落としている。」
http://www.atmarkit.co.jp/ait/articles/1709/27/news016.html
引用:「同じ「計算」といっても、どんな回路を作るべきなのかは相当に異なる。それにこのごろは先ほど述べた半精度浮動小数(16bit)どころか、8bitの整数あるいはもっと少ないbit幅でもAIはできるという方向がはやり出している。Googleなどもそっちへ行っている。詳細は分からないが、このAppleのハードウェアもそのような機能を盛り込んでいる、と想像している。毎秒6000億回の計算ができるといっても、スーパーコンピュータになるわけではないのだ。」
AR○ Mac の(与太)話はイマイチだったようですがともあれ A12 Bionic に搭載されている Neural Engine の「毎秒5兆の演算処理」はある意味では正しそうとかそういう感じなのでしょうか(ただし以下は A11 Bionic の話)。
【後藤弘茂のWeekly海外ニュース】iPhone Xの深層学習コア「Neural Engine」の方向性 - PC Watch
半導体のことはよくわからないですけど前出のリンク先の解説から推測すると A12 Bionic の Neural Engine は計算精度を落とすことによって「毎秒5兆の演算処理」を実現しているのではないかと思います。
ottan3104 による書き込み:
私が一番知りたかったのは、SoCであるA12Bionicで1チップパソコンとして、インテルの1000倍の性能にできるのではないか?と思っただけです。
それはないと思いますしそもそも最初の質問とは違います。
A12 Bionic のニューラル・エンジンなるものにどれだけの演算機を詰め込んでいるのか、演算機をどのようなネットワーク形態で組んでいるのか存じませんが、総合的に毎秒5兆回の演算能力があると言う事なのでしょう。今日日のコンピュータ技術では、多数の演算機を総当たりでネットワークが組めるようですから、後はマイクロコードで目的に合わせたネットワーク制御でしょうか ... 人工知能草創期には、理論はできていても実用化までは程遠い世界でしたので、「やっと実用化の光が見えてきた」と感慨深いものがあります。
普通になってますが並列処理なんでは。
質的に全く異なるものを数値だけで比較しても無意味です。
GPUとCPUの演算スピードを比較するようなもの。
MPU(CPU)が早くてもOSの処理が重ければ、ユーザレベルでは遅くなる。
SoCで調べましたが、SoCというものは、1チップパソコンで、そのハードのうえにsystemが内蔵されているタイプだそうで、それをSoC(System On Chip)というらしいですね。
ですので、SoC内部にCPUもありますし、音源チップなども内蔵されているそうです。
今までの集積度限界の話からいうと、「不思議ですら」ありますが、こんなものが作れるなら、Intelやめて別の高速パソコンがあれば良いと思うのですけれどね(笑)。
何故、クロックスピードが全く違う物が存在するのか私にはまったくわかりません(笑)。
ニューラルネットワークに関しても私は知っていますが、半導体で出来る程度の代物では全くありません。
どうも、「適当なネーミング」で「よくわからないセラミック」を詰め込んでいるだけのようですね。
まぁ、昔からパソコンのCPUというのも、理系4大卒の私には、おかしくて仕方がないものだったので、パソコンが当初から「意味不明の物体X」と考えると、まぁ、A12Bionicも「新しい薬の名前」のようにアイテム的なネーミングと
考えるとわかるような気にはなります。
実際には、CPUなんて動いてすらいないのかも知れませんね!
ああ、皆さん、いろんな意見ありがとうございます。
私が一番知りたかったのは、SoCであるA12Bionicで1チップパソコンとして、インテルの1000倍の性能にできるのではないか?と思っただけです。
1秒間に5兆回の命令実行と言うのは、兆は12桁なので、Intelの5GHzと比べると1000倍のクロックスピードになりますね。確かにユニットは8基あって、並列に動くということにはなっていますが、Intelの場合のクロックは1クロックで1命令を実行できるわけではないので、数十クロックかかる演算も一杯あります。
それに、メモリ、ディスクのスピードを考えると、「**のように遅いシステム」なんですね(笑)。
SoCの解説ページを見ると、これは、1チップパソコンなんですね(笑)。つまり、これ1個で何も買わなくて済むレベルなんですよ(笑)。
ですから、マニアックすぎるハードディスクとか、イチイチクロックの変わるメモリとか、そういうものを換装しながら考えないといけない面倒くさいパソコンではなく、このA12Bionicがそのまま1チップパソコンになれば、
この全く次元の違う性能が本当だとしたら、安く量産化して、Intelを蹴散らしてくれれば良いな!と思っただけです。
Appleのハードは昔からWindows陣営に比べて全く遅くてかないませんでしたが、
「5兆回やと!お前、速過ぎる!」
と狂喜乱舞したんですが、このコミュニティの方の反応を見ると、「そうでもないらしいな?私はかなり興奮したけどな!」と思ってしまいました。
昔、PowerPCが出た時はかなり期待したんですけど、無茶苦茶遅かったので、ああ、やっぱりApple製品は無理やな!とガクッと来ました。
まぁ、5兆回程度では、私の職業であるシステムエンジニアのレベルでは、「へぇー、速なったな!」くらいなんですが、「個人で手に入る価格」ですので、私はどんどん、こういう1チップで出来るシステムを拡充していってほしいと思っています。
HAYAMA による書き込み:
2000年に発売されたプレイステーション2のグラフィック・シンセサイザーなるチップの仕様を見て、ottan3104 さんと同じように「このチップで Windows が動けば他のチップはいらない」と思ったことがありました。その思いはすぐに単なる勘違いだと気づかされるのですが、昔の思い出です。
その考えだと ○RM Mac ネタは「単なる勘違い」ということになります(しそうかも知れませんがそもそも「それはないと思います」は「インテルの1000倍の性能にできるのではないか?」についてです)。
プレイステーション2は、私も持っていました。
ICOのグラフィックを見て、「凄い!」と即決で買いました(笑)。
チップの性能が、スペック通りと思っておられるかもしれませんが、実は全く違います(笑)。
Intelのデスクトップをずっと使って気ましたが(職業プログラマなので当たり前ですが)、実は私の個人持ちの32ビット機は、Celeron 2.5GHzだったんですが、それよりも5年後に発売されたCore2Duoの3.06GHzの方が、ベンチマークを取ると、遥かに遅いことを知ってから、私は「ヤフオク」でマシンを漁り出しました(笑)。
確かに、パソコンは昔から不思議なものでしたが、ベンチマークではっきり出たので「これは恐ろしい!」と思いました。私の作成したベンチマークはクロック性能がモロに出るベンチマークプログラムでしたが、1.5倍も古い方が速かったのです。
そういうわけで、パソコンがスペック通りと思われている書き方をされていますが、記述されているスペックすら怪しいのが現実です。今はCore i5やCore i3を使っていますが、私の使っている第一世代のCore i5の内蔵GPUでは、実は4K再生が出来たりします(笑)。これはね、まだ4K表示をサポートしていない時期のマシンなんです。おかし過ぎますね。今私がこの記事を書いているCore i3 4130は、普通にHDMIやDPで繋ぐと動画性能はCore i5に負けてしまうのですが、これもおかしいことに、HDMI、DVI、DPで繋がずにD-SUBで繋ぐとなぜか4Kデコード出来るんです!
私は、ビックリしましたが、そもそも若い頃、Pentium 60MHz(初代Pentium)で初めて写真の画像を出したときには、まだWindowsは3.1でした。Windows3.1の頃のビットマップアイコンは無茶苦茶バリバリに見えていましたが、その隣で表示したハイカラー(6万5千色)の写真は物凄くきれいに映し出されたので、「おかしいな?このハード?綺麗すぎる、いったいどうなっているんや、パソコン?」と20分ほど凍り付いた覚えがあります(笑)。
プレイステーションは今は4が現行機ですが、私はプレイステーション3を持っています。このマシンで動画再生すると「パソコン」とは全くレベルの違う動画が見れたりします。特に動く物体になると歴然の差となります。
まぁね、確かにポリゴンの表示力はスペック上低かったりしますが、実際には固定の256MBでプログラム的に考えると「バーテックス(点)」の数がメモリ上に乗りきらないのは明らかなんですね(爆笑)。つまり、スペック値というのは、全く「嘘」なんです。それは知っているんですけどね・・・。
そういうわけで、今回のA12Bionicもそうなんですが、パソコンの実質性能も明らかに嘘なので、昨今のマシンと比べて、「これくらいの性能で良いんじゃない?」という「指標値」があるに過ぎないと私は思っているんですよ。
たまたま、この「指標値」をA12Bionicと書かれたチップに与える!というようなものだと思いますね。
昔に使っていた「AMD」の初代Athlon1GHzを思い出すと、ちょっと嫌な気がします。
このAthlonはね、ハードディスクベースのマシンでしたが、アプリの起動に関して言うと、今使っている第4世代のCore-iよりも全然速いんですよ!このマシンはSAMSUNGのSSDを積んで使っているんですが、このマシンよりもAthlon1GHzの方が起動やアプリの動作が全然速いです(爆笑)。
まぁ、別にA12Bionicが速いと言っても、私たちシステムエンジニアレベルでは、「1000倍か?まぁまぁ速いな!」というのは前に書いた通りです。
1000倍と言う程度では、企業のシステムでは、まぁしゃーない結構上がっているなという話でしかなく、A12Bionicが1チップパソコンで、本当に5兆回の演算が可能なら、「個人的にいけ!いけ!、Intelなくせ!」と思っているだけです。
ベンチマークは、私自身が作成し、実行しているので明らかですよ。
それに動画については「アップコンバート」ですか?意味が不明ですが、解像度の問題でも何でもないですよ。
動きの激しい物だけ見比べると、パソコンとは全く違う画像になるだけです。PS3の方が遥かに俊敏に物を描画できます。もちろん、PC側は、その当時のグラフィックアクセラレータを通して再生しています。
確かに、いわゆるフラグシップの数万円もするようなアクセラレータとは違いますけどね(笑)。
計算精度ですか?これが不思議ですね。ハードはあるクロック数で計算をしますが、PCの浮動小数点演算とスマホの浮動小数点演算が例え桁が違っても「クロック数」が変わるのはおかしいので(仕様でしかない)、私はそんな話は信じられないですね。Intelの整数で言うと、32ビットと64ビットはクロックに従いますので、ソフトを32ビット版にしようと64ビット版にしようと、速度の変化なんて微々たるものですね。それは、誰でもわかります。
Intでも、Doubleでも、桁数でしかないですよ、それは私たちシステムエンジニアにとっては当たり前のことですが、一般の人にはわからないかもしれませんね。
パソコンの実質性能が嘘なのは、書いた通り昔から知っていますが、PS3の256MBなんかで、背景まで緻密に組み上げているようなゲームの実行は、全く不可能とすぐにバレているので、私は昔からゲーム機が好きです。
値段の割に速いですからね(笑)。頂点データだけで、メモリがパンクするのは明らかですからね(笑)。
でも、私はパソコンを使わないと「仕事」には開発環境が必要なので、仕方がなく使っているだけです。
Windowシステムに関しては、私たち開発者側は普通にうまく使えますけど、一般人がMac OS XやWindowsを使いこなせるまでの学習工数を考えると「一般じんなぁ、使わんやろうな、ブラウザしか。」と思いますね。
ところが、時流で仕方がなく、好きでもない「スマホ」を使っている人達のGoogle Chromeがソフトリミッターで事実上、使い物にならない現実はきついですね。Googleのヘルプフォーラムで文句を言っても、全く社員からは無しのツブテでした。スペックをあげさせるためにわざとOSを遅くして、無理やりチップの性能値を見かけ上、上げて買い替えさせるのも「違法行為そのもの」なので、いい加減にして欲しい気持ちがあります。
そういう現状で、5兆回計算できるチップが出たのなら、これは、本当に「人にとって役立つ事」ですよね?
チップの性能が嘘でも何でも、ソフトでリミッターをかけようがかけまいが、「速くなる」ということは本当に良い事ですね。
でも、Intelは**くさ過ぎるので私はさっさとコンピューターチップを作ることを止めて欲しいのも事実です。
第7世代から第8世代に変わって、「たかが40%スピードアップ」では、商品価値がないに近いので、「いい加減にしろ!」と言いたいだけです。
ですから、どうせ昔から「嘘の性能表示」をしているし、PS3の動画デコード性能やポリゴン表示性能を考えると**らしい嘘ばっかりついているので、1000倍くらいは上げろ!という意味でここに書いただけですよ。
私も確かに実性能が嘘とわかっていても、PS3が全てにおいて使えるか?というとブラウザさえ無理なので、結局はメーカーのプレスの情報を聞いて、「最新機種の速い物に変えざるを得ない」のが現状なので、より仕様に詳しい方にちょっとでも詳しい説明が聞きたかっただけです。
ottan3104 による書き込み:
そういう、インプリシットな情報ではなく、単にどういった機能があるとか、何ができるかという点に絞っていただくと、一般ユーザーの方にもメリットがあると思います。
少なくとも「ottan3104 さんは A12 Bionic が CPU(2 + 4 = 6 の非対称コア)、GPU(4 コア)、Neural Engine(8 コア)、ISP などで構成されていることを前提にせず、A12 Bionic と Neural Engine を事実上同一視することを前提にして投稿し続けていた」を指摘することはこのトピックを閲覧する可能性がある「一般ユーザーの方にもメリットがある」と考えます。それから「単にどういった機能があるとか、何ができるか」なら Apple の公式情報も含めてすでにいくつかのリンクが提示されていますしそもそも最初の質問の「何故、1秒間に5兆回の命令を実行できるのか不思議で仕方がないのですが、誰か知っておられる方、 教えてください。」と違います。
おまけ。
ttps://discussionsjapan.apple.com/message/101087333#message101087333
確かにね、「1秒間に5兆回はなぜか?」という質問で始まりましたが、その裏には、ではなぜ、Intelのような既存のCPUが5GHzで精いっぱいで、A12Bionicが5兆回か?という意味で取っていただくと私の本意が伝わると思います。
パソコンがしこたま不思議なおかしな機械というのは、私の説明ではっきりしていますが、この千倍の能力をどこでどうやって克服したかというのが、飛び過ぎているということをはっきり説明してくださる方いたらいいなと思っただけです。
ただ、オタク記事ははっきり私が説明した通り、手計算程度で矛盾を起こすので、そういう「たらいまわし的なリンクを示すだけ」という返答は、このサイトが質問サイトである限り、意味がないと書いただけです。
残念ながら、私は理系の仕事という立場もあり、「矛盾」を平気で他人にオファーする気はないので、そこのところは理解してくださいね!
> 86系MPUと、ARM、専用プロセッサを一緒くたにしてもらっても話にならない。
クロックモデルという意味では全く同じですよ?知らないんですか?
> この程度での話に理系かどうかを問題にするほどのことでもないと思うが。
この程度ですか?
面白いですね。2000個程度のモデルで400万個のリンクが生成すれば、どう考えてもメモリが簡単にパンクするのは当たり前ですね。
* 一部編集させていただきました。Apple Inc.
A12Bionicについて