FMA3とは? わかりやすく解説

FMA3

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/18 05:57 UTC 版)

ストリーミングSIMD拡張命令」の記事における「FMA3」の解説

インテル2009年仕様変更し、現在使われているFMA命令セットFMA instruction set)。4オペランド方式をやめ、3つのソースオペランドのうち任意の1つ破壊することにより3オペランドFMA実現している。インテルHaswellマイクロアーキテクチャ以降で、AMDBulldozerマイクロアーキテクチャPiledriverコア以降サポートしている。なお、AMD当初SSE5において採用したFMA命令も同じ3オペランド方式であったベーシックなmm256_fmadd_ps命令場合Intel CPUで1サイクルあたり16個の単精度FMA演算実行する (256 [bit/inst.] ÷ 32 [bit/fp32FMA] ÷ 0.5 [CPI=cycle/inst.])。例えば3GHzで動作するプロセッサであれば1コア当たり 48 GMAC/s (=96 GFLOPS) のピーク性能可能にする(参考: FLOPS#代表的なハードウェア浮動小数点数演算能力)。 FMA4比べるレジスタ退避を行う必要がある場合に不利であるが、命令長を1バイト短くすることができるため、デコーダ実装命令キャッシュフットプリントでは有利である。インテルIvy Bridgeマイクロアーキテクチャ以降AMDBulldozerマイクロアーキテクチャでは、レジスタ・リネーミングによってレジスタ間のmov命令をゼロレイテンシで実行できるため、これと組み合わせればレジスタ退避ペナルティ軽減できるインテルマイクロプロセッサにおいてはAVX2命令同時に採用されたため、AVX2命令一部であると誤解されることがある。しかし、両者CPUIDフラグ独立設けられており、必ずしも両者同時にサポートされているとは限らない例えば、FMA3をサポートするAMDPiledriverコアではAVX2命令サポートしていない)。

※この「FMA3」の解説は、「ストリーミングSIMD拡張命令」の解説の一部です。
「FMA3」を含む「ストリーミングSIMD拡張命令」の記事については、「ストリーミングSIMD拡張命令」の概要を参照ください。

ウィキペディア小見出し辞書の「FMA3」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「FMA3」の関連用語

FMA3のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



FMA3のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのストリーミングSIMD拡張命令 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS