Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

ClippedReluのAVX-512対応を実装 #288

Merged
merged 1 commit into from
Oct 7, 2024

Conversation

KazApps
Copy link
Contributor

@KazApps KazApps commented Sep 25, 2024

概要

ClippedReLU::PropagateでAVX-512が有効な場合の実装を行いました。

考慮点

halfkp_512x2-8-96のようなアーキテクチャの場合に、AVX-512で処理すると端数が生じ、その分速度が低下したためkInputDimensionsの値に合わせてフォールバックするようにしました。

ベンチマーク

こちらの環境 (R9-7945HX) では (変更前でも変更後でも) AVX-512を有効にするとNPSが若干低下するため、この変更による速度向上については計測できていません。

@yaneurao
Copy link
Owner

ありがとうございます!
いま手が離せないので諸々は今週の土曜日に対応させていただきます。

ところで、KazAppsさん、将棋AIのDiscordに参加しませんか?
私あてにメール([email protected])、いただければ招待リンクをお送り致します。

@KazApps
Copy link
Contributor Author

KazApps commented Sep 25, 2024

ありがとうございます!
ぜひ参加させていただきたいと思います。

後ほどメールをお送りしますので、よろしくお願いします。

@yaneurao yaneurao merged commit 434a339 into yaneurao:master Oct 7, 2024
0 of 182 checks passed
@yaneurao
Copy link
Owner

yaneurao commented Oct 7, 2024

素晴らしいです!ありがとうございます!

@KazApps KazApps deleted the clipped-relu-avx512 branch October 13, 2024 14:23
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants