午後わてんのブログ

ベランダ菜園とWindows用アプリ作成(WPFとC#)

処理速度

C#.NET CoreでSIMDを使ってドット積、byte型配列ならMultiplyAddAdjacentが速かった

値は全て255の要素数1千万のbyte型配列、これのドット積を求めるのに色々試してみた SIMDを使わない普通の掛け算と足し算 System.NumericsでSIMD Dot System.Runtime.IntrinsicsでSIMD AVX Multiply + Add SSE2 MultiplyAddAdjacent FMA MultiplyAdd SSE41 D…

C#SIMDで合計値、byte型配列をIntrinsicsとNumericsのAddで合計値の処理速度

IntrinsicsとNumericsのAddでbyte型配列の合計値を計算 使ったアプリは AVX2をサポートしていないCPUだと動かないかも? Intel CPUだとHaswellコアから対応なので第4世代、2013年以降 AMD CPUだとZenコアから対応なので、Ryzen全部とAthlonでもZenコアなら対…

byte型配列から最小値と最大値、CPUのSIMDを使うクラスIntrinsicsとNumericsどちらが速いのか

CPUのSIMDを使うクラスIntrinsicsとNumerics、どちらが速いのかを、要素数1千万のbyte型配列から最小値と最大値を求める時間で比較してみた 今回の方法では結果は差が出なかった。シングルスレッド、マルチスレッドともに同じ速さ。Intrinsicsはポインタを使…

C#でSIMDを使うSystem.Runtime.Intrinsicsを試してみた、byte型配列の合計

SIMDを使っての計算はSystem.Numerics.Vectorクラスと、これとは別にSystem.Runtime.Intrinsicsってのもあるみたいで試してみた 環境 CPU AMD Ryzen 5 2400G(4コア8スレッド) MEM DDR4-2666 Window 10 Home 64bit Visual Studio 2019 Community .NET Core 3.…

C#.NETで分散を求めるマルチスレッド編

前回、シングルスレッド編 gogowaten.hatenablog.com これの続き いろいろ試して一番早かったのはこれ //分散 private double Variance(byte[] ary) { var myBag = new ConcurrentBag<long>(); Parallel.ForEach( Partitioner.Create(0, ary.Length, ary.Length / </long>…

C#.NETで分散を求める2回め、System.Numerics.Vector.Dotも使ってみたけど…

今回の記事は前回の gogowaten.hatenablog.com ↑この記事を書き直したもので 直した理由は速度比較をしていたんだけど、Math.Powの使い所が間違っていて、速度比較になっていないことが記事を書いた6日後に gogowaten.hatenablog.com わかったから、なので前…

C#.NETのMathPowは速くない?べき乗計算は掛け算を繰り返したほうが速い場合もあった

Math.Powを使うと遅くなる状況がある アプリダウンロード先とコードはギットハブ アプリファイル名:20200217_MathPow.zip github.com アプリ作成と計測環境 CPU AMD Ryzen 5 2400G(4コア8スレッド) MEM DDR4-2666 Window 10 Home 64bit Visual Studio 2019 …

ドット積を求めるSystem.Numerics.VectorのDotメソッドを使って分散を求めてみた

2020/02/19追記ここから 処理時間の基準にしたTest01でMathPowの使い方に問題があることが6日後の gogowaten.hatenablog.com ↑の記事でわかったので 書き直したのが ↓ gogowaten.hatenablog.com なのでここから↓はほとんど意味ない 2020/02/19追記ここまで …

本当は速いSystem.Numerics.Vector.Addを使って、int型配列の値合計2回め

前回、前々回でイマイチだったSystem.Numerics.Vector、本当は速かった int型配列の要素の合計の処理時間、シングルスレッド編 test19が今回追加したもの グラフにすると 普通のForループより2倍速くなった! マルチスレッド編 前回で速かったTest12~15より…

int型配列の合計値マルチスレッド編

前回は シングルスレッドだけでの計算だった 今回はマルチスレッド 1から100万1までの連番の合計を1000回求めるのにかかった時間 合計値の正解は500001500001 計測アプリ ボタンを押して待つだけ、test2とtest11だけは極端に遅い、test5とtest21はオーバーフ…

int型配列要素の合計値を求めるのにSystem.Numerics.VectorのAddを使ってみたけど

int型配列要素数100万の合計を100回求める処理時間測定 まとめ forかforeachが速い LINQは遅いけど今どきのCPUなら10億回の計算でも0.5秒で終わる VectorのAddはforより速いこともあるけど条件がめんどくさい 2020/02/11追記ここから gogowaten.hatenablog.c…

C#、配列から最大値を求めるMaxは、MathクラスよりSystem.Numerics.Vectorクラスのほうが速い

要素数1千万のint型配列(値はランダム)から、最大値を1000回求めた時の処理時間は、MathクラスよりVectorクラスのほうが2倍以上速い結果になった 青色グラフはシングルスレッド 赤色グラフは配列を分割してマルチスレッド 緑色グラフは1000回ループを分割し…

処理速度比較、画像の使用色数を数える、重複なしのリストのHashSetも速いけど配列+ifも速かった

画像の使用色数を数える 画像ファイルからのBitmapSourceからCopyPixelsして取得するbyte[]を使って 重複しない色の配列やリストを作って数える方法で処理速度比較してみた 条件 BitmapSourceのPixelFormatはPbgra32限定、アルファ値は無視するので256*256*2…