新たな評価関数のファミリー
前回の記事のあとから、凄まじい勢いで新しい評価関数が登場し始めました。プログラマでなくても、ある程度の将棋の知識とコンピュータリソースさえあれば、自分にカスタマイズされた評価関数ができるというのは大きなインパクトが有ったのだと思います。記事のあとも色々な出来事が有りました。
全自動評価関数作成スクリプト「Shivoray(シボレー)」の登場
ブレンド手法の一般化
後者については、私のサイトへのメールでyanetesという方からelmoとリゼロepoch8のブレンド(ブリード・キメラ化)が強いのではという示唆をいただき、少し調べてみたら実際結構強い、、そのむねツィートして一日もしないうちにやね氏によるより詳細なデータが登場し、大騒ぎになるという事態になりました。人間の将棋界は藤井くんの活躍で大きな盛り上がりをみせていますが、将棋ソフトの世界もそれに負けない大きな進展 -- ノンプログラマーによるソフト改良 -- により大きなブレークスルーが来るのかなと胸躍る感じです。もしかすると私のような級位者でもコンピュータの助けを借りて将棋の真理に近づけるのかもしれないという希望が出てきました。
私が知っている範囲で新たな評価関数の動きをまとめると(漏れているものがあるようでしたらお知らせください)
くらいでしょうか。現在、出張中ということで機動力が発揮できないということもあり、手元で観察することはできませんがすでに、まふさんのところには膨大なデータが、、現時点で
まふ>野生の読み太>relmo>elmo-qhapaq>elmo
の順で全体の差は100前後(?)と理解しています。今のソフトはすでに十分強いのでR100違って実用的にどう違うのだ、というつっこみはあると思いますが、ギリギリのチューニングを求める人には最前線を追うのはとても重要なのかもしれません。個人的にはすでに出回っている評価関数とは全く違う育成をして相手の研究の裏をかく(そこまで頑張っているのはかなりの高段者~プロでしょうが)とか、弱い評価関数を色々作って評価関数の味見をするのが面白いかなと思っています。