コンピュータ将棋動画勢!

観るコン将(コンピュータ将棋観戦オンリー勢)から見たコンピュータ将棋の記述

【連載】あなたの知らない将棋ソフトたち 第三回 芝浦将棋とその仲間たち

本連載の第一回では「きふわらべ」、第二回では「うさぴょん」とそれぞれひとつのソフトに焦点を当て、その紹介記事を書いたのですが、今回は趣向を変えてコンピュータ将棋界における一大派閥である、芝浦将棋ファミリーを紹介したいと思います。


コンピュータ将棋界におけるファミリー

コンピュータ将棋界においてファミリーと言うと、ボナンザチルドレン、あるいはやねうら王チルドレンといったソフトを思い浮かべる方がいるかもしれません。

「ボナンザ」*1、「やねうら王」*2はともにオープンソースのソフトウェアであり、公開時にトップクラスの強さを持っていたことから、これらを利用した多数の将棋ソフトが誕生しました。ボナンザを利用したソフトとしては、なんと単純に複数のボナンザの指し手の多数決を取るだけで強くなったという「文殊*3や、ボナンザを超高効率でクラスタした、当時引退棋士であった米長邦雄氏に勝利した「ボンクラーズ*4などがあります。

やねうら王は現状世界最強のオープンソース将棋ソフトであるため、これをベースとしたソフトは枚挙にいとまがなく、「Kristallweizen」*5、人間やソフトの既存の棋譜を全く使わずとも自己対戦だけで最強レベルの将棋ソフトを作れるほどの効率のよい学習方法*6を導入した「elmo」*7ボナンザ以来長らくコンピュータ将棋のスタンダードであった三駒関係の評価関数を刷新したNNUEを導入した*8「たぬき」*9、等々、さまざまな工夫がやねうら王チルドレンによってコンピュータ将棋に持ち込まれ、なおかつそれらが棋力向上につながることが証明されました

これらは言わばソースコードを元にした繋がりをもつファミリーと言えるでしょう。ところが、コンピュータ将棋界には師弟関係を元にした、もう一つのファミリーがあるのです。それが「芝浦将棋」とその仲間たちです。

芝浦将棋

「芝浦将棋」は、芝浦工業大学工学部情報工学科の五十嵐治一教授*10と教授の研究室の学生たちによって開発された将棋ソフトです。第20回世界コンピュータ将棋選手権で世界コンピュータ将棋選手権に初出場し、それ以来毎年その代の学生たちが自分たちの芝浦将棋を開発して世界コンピュータ将棋選手権に出場しています。

芝浦将棋は毎年主要開発者や開発方針が変わっているため、その特色を一言で纏めることは難しいのですが、大まかに言って強化学習の手法を取り入れていること、そして評価関数バイナリ等、なんらかの部分でボナンザをベースにしていることがほぼ毎年共通しています。ボナンザをベースとしているのは、芝浦将棋が学生の卒業研究であり、完成された将棋ソフトであるボナンザが研究の新しいアイディアを上乗せしやすいため、そして強化学習の手法を取り入れているのは指導教官である五十嵐教授の研究テーマが強化学習分野であるためだと思われます。

芝浦将棋の迷走発展

芝浦将棋は第23回コンピュータ将棋選手権からその名を「芝浦将棋Jr.」と変えて出場しています。はじめは強化学習の手法の将棋における応用を模索していた芝浦将棋ですが、将棋ソフト開発の魔力に取りつかれてしまったのか開発に関わる学生の数を増やし、強化学習を棚上げしてなんとデータ構造や探索部の独自実装*11へと踏み切ります

残念ながらこれらの独自実装は失敗に終わり、第23回世界コンピュータ将棋選手権はバグによる反則負けで全敗を喫し一次予選敗退となります*12

その後もしばらく強化学習には手をつけず、芝浦将棋Jr.はDIY精神を発揮し独自実装の将棋プログラムを作ることにこだわりつづけます*13

芝浦将棋Softmax

第27回コンピュータ将棋選手権からは芝浦将棋Jr.に加えて「芝浦将棋Softmax」が登場します。芝浦将棋Softmaxは同じく五十嵐教授と五十嵐研究室の学生により書かれたプログラムであり、他のほぼすべての将棋ソフトがαβ探索をする中でモンテカルロ探索を取り入れた画期的な将棋ソフト*14であり、探索部以外はボナンザをベースにすればいいのに前年度までの芝浦将棋Jrをベースとしています。

そして芝浦将棋Softmaxは、なんと芝浦将棋Jr.が一次予選敗退する中で二次予選へと駒を進めます*15

受け継がれる五十嵐教授の教え

長年コンピュータ将棋に取り組み続けた五十嵐研究室ですが、五十嵐教授の指導が優れていて学生たちが楽しく研究に取り組める環境にあったためか、学生が卒業後も趣味で将棋プログラムの開発を続けることがありました。

その一つが、第21回コンピュータ将棋選手権に出場した芝浦将棋の開発者である山本一将氏の開発した「ひまわり」*16です。ひまわりは強化学習の手法を取り入れており、「既存の棋譜を使わずに強い将棋プログラムを作る」という五十嵐教授のテーマを受け継いでいることがうかがえます。

もう一つが森岡祐一氏の開発した「GA将」*17です。GA将が登場したのは芝浦将棋よりも前なのですが、開発者である森岡氏は強化学習に関する五十嵐教授との共著論文も執筆されており、GA将も強化学習の手法を取り入れた将棋ソフトとなっています。なお、惜しくも近年は森岡氏は世界コンピュータ将棋選手権への出場を引退されてしまっているようです。*18

社会人が仕事をしながら将棋ソフトの開発を趣味で続けることは、並大抵の苦労ではなく、よほどの情熱がなければできないことであることは間違いありません。五十嵐教授は今年、芝浦工業大学を退官されました。ですが、長年続けてきたコンピュータ将棋ソフトの開発、そしてその思いは、これらのソフトを見ればわかる通り、後継者らに間違いなく受け継がれているのだと思います。

願わくは芝浦将棋、そして芝浦将棋ファミリーが、これからも世界コンピュータ将棋選手権を盛り上げつづけてくれる存在であらんことを。

*1:開発者は保木邦仁氏。第16回、第23回世界コンピュータ将棋選手権優勝。

*2:開発者はやねうらおこと磯崎元洋氏。第29回コンピュータ将棋選手権優勝。

*3:開発者は小幡拓弥氏ら。第19回世界コンピュータ将棋選手権第三位。

*4:開発者は伊藤英紀氏。第21回世界コンピュータ将棋選手権優勝。後継のPuella αはオープンソースだったが、実装が難解で伊藤氏の優れたクラスタ方式は他の誰にも真似ができず惜しくも歴史に埋もれてしまった。

*5:開発者は芝世弐氏ら。第28回世界コンピュータ将棋選手権優勝、他準優勝等多数。他の将棋ソフトも多数ライブラリとして使用。

*6:elmo自体が他ソフトの棋譜を学習に使用していないという訳ではない。

*7:開発者は瀧澤誠氏。第27回世界コンピュータ将棋選手権優勝等。

*8:那須悠氏により第28回世界コンピュータ将棋選手権より導入された。

*9:開発者は野田久順氏ら。世界コンピュータ将棋選手権決勝出場多数。ただし初年度は平岡拓也氏によるAperyをベースとしていた。

*10:今年退官されたそうです。

*11:ただし探索の手法的にはすべてボナンザにある手法をなぞったようなもので、いわゆるDIYである。

*12:学生らの卒論は大丈夫だったのだろうか……

*13:学生らの卒論は本当に大丈夫だったのだろうか……

*14:強いとは言っていない。またやねうらお氏がより洗練されたモンテカルロ将棋を2011年頃すでに開発していた。また同年、激指を開発した東大近山研究室のメンバーによって書かれた論文から、2011年にはすでに彼らもモンテカルロ将棋の実験をしていたことがわかる。

*15:棋力で芝浦将棋Softmaxが勝っていたと結論を出すことは早計である。一次予選はまともに動かないプログラムも多数あり、勝敗が対戦相手次第となる面があるため。

*16:第23回コンピュータ将棋選手権に初出場。その後も断続的に世界コンピュータ将棋選手権や将棋電王トーナメントに出場を続ける。

*17:第16回コンピュータ将棋選手権初出場。その後もしばらく断続的に世界コンピュータ将棋選手権に出場を続ける。

*18:背景には森岡氏が非フルスクラッチの将棋ソフトに並々ならぬ敵意を持っていることがある模様。