top of page

dlshogiの実用性とNNUE系と比較した時の持ち時間の影響

# 追記(2021/8/18) 新しいバージョンDL2_exhが発表されております。かなり強くなっておりますが、インストールの方法はこの記事と同じです。


昨年行われた第一回電竜戦でdlshogiのグループであるGCT将棋が優勝。チェスと同じく将棋ソフトも深層学習系(Deep Learning=DL系)のソフトが席巻する新しい時代が来るのではという期待が持たれました。その後、WCSC31において多くのグループのDLへの参入することになりましたが、結果はelmoの優勝で終わりDL系ソフトに対してNNUEエンジンがまだまだ戦えることを示しました。囲碁やチェスと比べると将棋における深層学習系ソフトの発展はやや緩やかに感じていましたが、現状どうなっているのか興味深い点です。


やねうら王に代表されるStockfish系のソフトと比べると深層学習系のソフトはインストールが難しく(関連するライブラリのインストールが必要)グラフィックボードの入手難ということもあり、現時点ではそれほど普及していないように感じます。私自身もソフト開発の能力がないためかこれまでDL系というとスクリプトを修正するだけで使うことができるAobazeroで少し遊んだ程度で検討などに使う実用ソフトとしてはみなしていませんでした。


WCSC31の開催中に発表されたやねうら王氏のブログでdlshogiがレーティングを急速に伸ばしているという記述があったので手元のグラボでどの程度DL系ソフトが使えるのか試したくなってきました。dlshogiはDL系ソフトとしては最強です。Windows用にコンパイルされたものも公開されているので、準備しなくてはいけないのはライブラリー関係のみ、しばらく試行錯誤が必要でしたが無事に動くようになりました。


(1)インストール

Windows環境ですので公開されているコンパイル済みファイルをダウンロードしそこに書かれている指示に従ってライブラリーをインストールすればShogiGUI, 将棋所といったソフトから使うことができます。ただ、ライブラリーのインストールはそれほど自明ではなく

(a) CUDAの指定されたバージョン11.1をインストールする必要がある。dlshogiのサイトで指定されているリンクを追うと最新版(この原稿を書いている時点では11.3)をインストールすることになりソフトを使うときにエラーが出て使えません。正しいバージョンをダウンロードするには例えば"CUDA11.1"を検索して出てくるサイトを用いる必要があります

(b) TensorRTについても指示されたバージョンをインストールする必要があります。デフォールトで出てくる最新版とは違うのでご注意を。

(c) 環境変数PATHの設定: 最近のWindowsではかつてのようにコントロールパネルから設定することができなくなっています。(コントロールパネルがなくなっている?)PATHを設定するときは Windowsボタン-設定を開いた後、設定画面からPATHを検索して出てくるリンクから設定を行うのが一番簡単のようです。


(2)実用性

手持ちのハードで強さの測定を行いました。スペックは

GPU:Nvidia GeForce 2080

CPU:AMD Ryzen 7 1800X (8コア16スレッド)

GPUは購入時はややハイエンドでしたがPASSMARKによると現行のGeForce 3060と同等の性能であるとのこと、コンシューマレベルと考えてもおかしくないと考えます。CPUも古いですが現在の3800XとのNPSの差は20%程度であり、差分のうち幾らかはやねうら王の進歩(Zen2のサポート)由来とすると、それなりに対応するGPU・CPUの対になっていると考えられます。

この環境下で自己対局を行いDLとNNUEの強さを比較しました。以下の対局の棋譜はこのリンクからダウンロードできます。設定は一手2秒、互角局面集(たややん32)を用いて24手まで進行させそこから対局。CPU側はコア実数の8スレ、GPU側(dlshogi)はデフォールト設定。やねうら王のノード数は10Mノード弱でレーティングサイトの設定(12Mノード前後)よりはやや少なめです。


(a) Yaneuraou4.83/Kristallweizen(R4300)、通称白ビールとの対局。

勝敗 dlshogi 247 YO483/Kristallweizen 45 レート差 283

先手勝 dlshogi : 119 YO483/Kristallweizen : 20

後手勝 dlshogi : 128 YO483/Kristallweizen : 25

千日手 5 持将棋 3 平均手数 128 対局数 300

KristallweizenはWCSC29(2年前の大会)の準優勝チームですが、R280程度の優位性が見られます。


(b) Yaneuraou6.03/Suisho3(R4500)との対局

勝敗 dlshogi 170 Suisho3/YO6.03 112 レート差 68

先手勝 dlshogi : 92 Suisho3/YO6.03 : 62

後手勝 dlshogi : 78 Suisho3/YO6.03 : 50

千日手 13 持将棋 5 平均手数 124 対局数 300

水匠はやねうら王mブランチとの組み合わせで昨年の大会WCSC30を制しました。やねうら王6.03はmブランチと同等以上の強さで、今年の大会ではelmoとの組み合わせで優勝しました。YO603/Suisho3は今年優勝したソフト(elmo)と同じレベルと考えられます。その組み合わせでレート差70程度優れているというのはDLShogiがコンシューマー向け環境下で最強であることを示しているように見えます。


(3)長時間での優位性

実際にユーザーが使う棋譜の検討などでは一手2秒より長い時間コンピューターに思考させます。その意味では長い持ち時間でより強くなることが求められます。dlshogiとやねうら王6/Suisho3の自己対局を異なる持ち時間の元で行いました。一手2秒は(2b)にある通りで、


一手1秒

勝敗 dlshogi 174 Suisho3/YO6.03 113 レート差 71

先手勝 dlshogi : 88 Suisho3/YO6.03 : 58

後手勝 dlshogi : 86 Suisho3/YO6.03 : 55

千日手 12 持将棋 1 平均手数 123 対局数 300


一手5秒

勝敗 dlshogi 191 Suisho3/YO6.03 93 レート差 117

先手勝 dlshogi : 108 Suisho3/YO6.03 : 55

後手勝 dlshogi : 83 Suisho3/YO6.03 : 38

千日手 14 持将棋 2 平均手数 126 対局数 300


一手1秒と2秒とではほとんど差がありません(統計的な優位性なし)でしたが、一手5秒ではレート差が120程度まで広がりました。これは長時間における優位性を示しており、検討などでdlshogiの信頼性が高いことを示しています。対局数が比較的少ないため統計的信頼性に留意する必要がありますが、以上の結果は深層学習系ソフトであるdlshogiがYaneuraou/NNUEに対して十分優位性・実用性を持っていることを示していると考えます。

Comments


特集記事
最新記事
アーカイブ
タグから検索
まだタグはありません。
ソーシャルメディア
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square
bottom of page