[B! float] masterqのブックマーク

masterq id:masterq

floatに関するmasterqのブックマーク (13)

KMC Staff Blog:SoftFloatの未定義動作バグ（1）signedのunsignedな絶対値を求める際にINT_MIN
masterq 2024/07/05
c

ub

undefined

behavior

max

float

netbsd

libc

clang

llvm
リンク
GitHub - 10buttons/awedio_esp32: ESP32 backend for the awedio audio playback library
masterq 2024/03/14
esp32

rust

i2s

sound

audio

mp3

float
リンク
GitHub - tarcieri/micromath: Embedded Rust arithmetic, 2D/3D vector, and statistics library
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
masterq 2024/01/12
rust

embedded

math

float

vector
リンク
JSONとBigInt
ちょっと前にblueskyで見かけた話題。もとは「GraphQLのスキーマではintが32ビットしかなくて、64ビット整数とかないのがイケてない」といった話だったかなと思う。直感的にはこれは「Javascriptではすべてが倍精度浮動小数点数だから64bit intがないから」ということになるが、よくよく調べてみるといろいろややこしい歴史的事情があるようだ。たしかにJSにはもともとひとつのNumber型しかなく、いわゆるdouble型(倍精度浮動小数点)だけで数値を表現してきた。IEEE754の倍精度浮動小数点数は仮数部が52ビットあるので、実際には32ビット整数ていどであれば全て誤差なく表現できる。なので32ビット整数または倍精度浮動小数点数がどちらも使えるというふうに理解されてきた。そうはいっても不便なので、現代のJSにはBigIntがある。ES2020で導入されたらしい。ただし普
masterq 2023/09/08
JSONも理想郷ではなかったんだなぁ。代替策がシリアライザに詳しくないので参考になる

json

javascript

number

double

float
リンク
Herbie Automatically Improving Floating Point Accuracy
Herbie detects inaccurate expressions and finds more accurate replacements. The red expression is inaccurate when x > 1; Herbie's replacement, in blue, is accurate for all x. Herbie improving accuracy on the “Hamming” benchmark suite. Longer arrows are better. Each arrow starts at the accuracy of the original expression, and ends at the accuracy of Herbie’s output, in each case on random double-pr
masterq 2021/09/09
あとで読む

float

math
リンク
Float Toy
Click on a cell below to toggle bit values, or edit the hex or decimal values directly. Use this to build intuition for the IEEE floating-point format. See Wikipedia for details on the half-precision, single-precision and double-precision floating-point formats. 16-bit (half)
masterq 2021/06/15
ビット表現を16,32,64ビットの浮動小数点数に変換する。有事の際には便利そう。

float

bit

calc

web
リンク
Digital signal processing for STM32 microcontrollers using CMSIS
masterq 2020/02/17
stm32

cortem

arm

doc

dsp

simd

mac

cmsis

float
リンク
x86でdoubleがfloatより速いかどうかを検証してみた - Qiita
昔話それは昔々のこと。 x86には浮動小数点演算を行う手段がなく、外付けの浮動小数点演算ユニットを接続するという手法で、浮動小数点演算を実現していたのであった。 x87と呼ばれたそれはとてもエクセレントなシステムで…という話はwikipediaに譲ろう。 https://ja.wikipedia.org/wiki/Intel_8087 重要なのは、x87が内部表現として80bitの拡張倍精度を使っている、ということ。これのおかげで、x87においては、確かに~~doubleのほうが速かった (floatだとdoubleへのキャストコストが発生するため)~~ 嘘だろそれ。ASM見たら別にキャストとかしてなかったわ。どっちかというと丸めの影響で精度が異なることのほうが重要だわ。改めて調べてみると、doubleが速いとされている資料についてはあんまりないことに気付く。 (同等としている資料
masterq 2019/12/06
double

float

benchmark

sse

x86

intel

doc

japanese

avx
リンク
単精度、倍精度、多精度、混合精度コンピューティングの違いとは？
パイについての考え方はいくつかあり、アップルパイ、パンプキンパイ、キーライムパイなどさまざまです。それと同様に、数学定数である円周率 ℼ の表現方法もさまざまで、3.14159 と表したり、0 と 1 が延々と続く 2 進数で表したりもできます。無理数である円周率は、繰り返すことなく永遠に続く 10 進数です。そのため円周率を使って計算を行う場合、人間かコンピューターが数値を切り捨てたり四捨五入したりする前に、小数点以下の桁数を指定する必要があります。小学校では 3.14 として手計算しますが、高校の関数電卓では桁数が10 桁になることもあります。これは、同じ数値をより高い詳細度で表しています。コンピューターサイエンスではこれを精度と呼び、通常は 10 進数ではなくビット、つまり 2 進数を単位とします。複雑な科学的シミュレーションの場合、開発者は長年、ビッグバンのような出来事を理
masterq 2019/11/23
"従来の倍精度アプリケーションを最大25倍高速化すると同時に、その実行に必要なメモリ、実行時間、消費電力を削減することが可能" なんと

nvidia

float

double

mix
リンク
浮動小数点数型と誤差
有限桁Ｃ言語で扱える実数値は，２進数の有限小数で表された数値である．例えば次のようなものである． 1.5(10) = 1.1(2) 3.25(10) = 11.01(2) 理論的には小数が無限に続く値でも，そのうちの有限個の桁数でその値を表すしかない．例えば，0.1 を２進数の小数で表すと 0.1(10) = 0.000110011001100110011...(2) と無限に続くが，コンピュータの内部では有限桁で丸められている．このような場合には，本当の値ではなく，近似値でしか表すことができない．指数表記（浮動小数点表記）科学計算では非常に大きな実数値や非常に小さな実数値も扱うことがある．そのようなときには，通常の１０進数の表記ではなくて，次のような指数表記で表すれば無駄な 000...000 という桁を表記しなくてもよくなる． 1234567890000000000000
masterq 2019/11/22
"float 型の精度（有効桁数）は２進数にして 24 (=23+1) 桁であり，１０進数では約 7 桁となる．"

c

language

float

double

doc

japanese
リンク
浮動小数点数の誤差を考慮した比較【double/float型の正しい比較方法】
// #include <float.h> // FLT_EPSILON, DBL_EPSILON, LDBL_EPSILON // #include <math.h> // fabsf, fabs, fabsl, fmaxf, fmax, fmaxl /* float型（倍精度浮動小数点数） */ if (fabsf(a - b) <= FLT_EPSILON * fmaxf(1.f, fmaxf(fabsf(a), fabsf(b)))) {} /* double型（単精度浮動小数点数） */ if (fabs(a - b) <= DBL_EPSILON * fmax(1, fmax(fabs(a), fabs(b)))) {} /* long double型（四倍精度浮動小数点数） */ if (fabsl(a - b) <= LDBL_EPSILON * fmaxl(1.L, fm
masterq 2019/11/07
c

language

compare

float

doc

japanese
リンク
GitHub - google/double-conversion: Efficient binary-decimal and decimal-binary conversion routines for IEEE doubles.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
masterq 2013/04/12
むー

algorithm

float

floatingpoint

c++
リンク
文字列・数値相互変換 by Ｃ
masterq 2013/04/11
floatingpoint

float

c
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx