Skip to content

Commit

Permalink
- ふかうら王、持ち時間制御その9
Browse files Browse the repository at this point in the history
以下のところ1/4 ⇨ 1/8に。
```
     // 経過時間がoptimum /8 を超えてるのに残りmaximum時間をすべて用いても訪問数が逆転しない。
     // ただしこの時、eval_diffが0.1なら50%というように、eval_diffの値に応じてrest_optimum_poを減らして考える。
     if (   elapsed >= optimum / 8
```
- ふかうら王の Softmax_Temparatureの上限値変更。500 → 10000
  • Loading branch information
yaneurao committed Feb 8, 2024
1 parent 07d2e8f commit 41c528c
Show file tree
Hide file tree
Showing 2 changed files with 3 additions and 3 deletions.
2 changes: 1 addition & 1 deletion source/engine/dlshogi-engine/YaneuraOu_dlshogi_bridge.cpp
Original file line number Diff line number Diff line change
Expand Up @@ -91,7 +91,7 @@ void USI::extra_option(USI::OptionsMap& o)
o["C_base_root"] << USI::Option(25617, 10000, 100000);

// 探索のSoftmaxの温度
o["Softmax_Temperature"] << USI::Option( 174 /* 方策分布を学習させた場合、1400から1500ぐらいが最適値らしいが… */ , 1, 500);
o["Softmax_Temperature"] << USI::Option( 174 /* 方策分布を学習させた場合、1400から1500ぐらいが最適値らしいが… */ , 1, 10000);

// 各GPU用のDNNモデル名と、そのGPU用のUCT探索のスレッド数と、そのGPUに一度に何個の局面をまとめて評価(推論)を行わせるのか。
// GPUは最大で8個まで扱える。
Expand Down
4 changes: 2 additions & 2 deletions source/engine/dlshogi-engine/dlshogi_searcher.cpp
Original file line number Diff line number Diff line change
Expand Up @@ -882,9 +882,9 @@ namespace dlshogi
// 勝率差0.2なら、探索が早期に終了して良いと思う。
WinType ratio = std::max( 1.0 - eval_diff * 5 , 0.0 );

// 経過時間がoptimum /4 を超えてるのに残りmaximum時間をすべて用いても訪問数が逆転しない。
// 経過時間がoptimum /8 を超えてるのに残りmaximum時間をすべて用いても訪問数が逆転しない。
// ただしこの時、eval_diffが0.1なら50%というように、eval_diffの値に応じてrest_optimum_poを減らして考える。
if ( elapsed >= optimum / 4
if ( elapsed >= optimum / 8
&& best_searched > second_searched + rest_maximum_po * ratio
)
{
Expand Down

0 comments on commit 41c528c

Please sign in to comment.