第30回ゲーム情報学研究会(発表件数7件)

日時:平成25年6月28日(金)13:10 - 17:10
場所:北陸先端科学技術大学院大学(石川県能美市)
   情報科学研究科講義棟2階I3・4講義室
   http://www.jaist.jp/general_info/campus/index.html
   http://www.jaist.jp/general_info/campus/map/0007.html
後援:北陸先端科学技術大学院大学 情報科学研究科

主査:伊藤 毅志 幹事: 鶴岡 慶雅,村松 正和,篠田 正人, 大久保 誠也
-------------------------------------------------------------------
[プログラム]
一般講演(30分):発表 25 分 + 質疑応答 5 分
[13:10 -- 14:40] 将棋 (3件)
[14:55 -- 15:55] アルゴリズム・大貧民 (2件)
[16:10 -- 17:10] 学習 (2件)
#当日10:30〜および17:20〜より希望者向けにパズルコレクション見学会があります
 (下記案内文末をご参照ください)
--------------------------------------------------------------------

将棋 [13:10-14:40]

(1) コンピュータ将棋の現状 2013 春
 ○瀧澤 武信(早稲田大学)
概要:
第23回世界コンピュータ将棋選手権が2013年5月に開かれた。今回は47チームの申し込みがあった.
コンピュータ将棋の実力も大いに上がっており,
昨年の選手権の上位入賞ソフトはプロ並の実力があると評価され,
実際に,2013年3月から4月にかけて行われた第2回電王戦では,プロ棋士に勝つプログラムが出てきた.
この報告では同選手権における将棋ソフトウエアの実力について考察する.

(2) 5五将棋大会2012年の動向
 ○伊藤 毅志(電気通信大学)
概要:
2012年には、11月にUEC杯、GPW杯、TAAIのサイドイベントなど、5五将棋の大会が開催された。
また、初の試みとして、ミニ将棋3種競技大会なども開催され5五将棋を中心としたミニ将棋のイベント
が盛んに行われるようになった。
これらの動向を報告し、今後の展開について展望していく。

(3) 定跡データベースの評価法の提案
 ○増子 直樹、田中 哲朗(東京大学)
概要:
コンピュータゲームにおけるゲームプレイにおいて,定跡データベースを持つことは,
対戦の多様性の確保,序盤の貧弱な評価関数の補完,思考時間の節約に役立つことが分かっているが,
対戦実験によって強さを評価する以外の効率的な評価法がこれまで提案されていなかった.
本発表では,定跡データベースの多様性を測る尺度を提案し,
データ構造が公開されている将棋プログラムを対象に評価を行う.

大貧民 [14:55-15:55]

(4) コンピュータ大貧民における手札推定の有効性について
 吉原 大夢、○大久保 誠也(静岡県立大学)
概要:
2010年度コンピュータ大貧民大会優勝プログラムであるsnowlを用いた計算機実験により、
相手手札推定の有効性を検証した。
 
(5) 情報力学に基ずくコンピュータ・ゲーム「大貧民」並びにコラボレーションツールに関する研究
 ○中川 武夫、飯田 弘之、森近 泰匡(北陸先端科学技術大学院大学)
概要:
二人で行うコンピュータゲーム「大貧民」における各指し手の評価値を正確に求める方法を先ず提案する。
次に、両プレーヤーが実際に指した手の評価値の時間推移を分析することにより、ゲーム中の勝率
(Winning Rate)、アドバンテージ(Advantage)、ゲーム結果の確かさ(Certainty of Game Outcome)の時間
推移を無次元表示する。
最後に、ゲーム中の情報運動量、情報加速度、並びに情報エネルギーの時間推移に基づき、
そのゲームの流れを勝敗、面白さ、興奮度合などの観点から考察を加える。
また、コラボレーション・ツール「Confluence」が研究者間のコミュニケーションを円滑、
かつその質の深化にどのように貢献し得るかについて、
情報力学の解析手法を応用する事により定量的評価を行う。

学習 [16:10-17:10]

(6) 方策勾配法による局面評価関数とシミュレーション方策の学習
 ○五十嵐 治一(芝浦工業大学)、森岡 祐一、山本 一将
概要:
本論文では強化学習の一手法である方策勾配法をコンピュータ将棋に適用する方法を考察した.
方策勾配法は,報酬や方策にマルコフ性の制限なく自由に設計することができるという大きなメリットがある.
本論文では,最初に全leaf局面の局面評価値をその局面への遷移確率値で重み付けた期待値を用いた指し手
評価方式を提案する.
これをベースに,探索木の各ノードにおける指し手の選択法としてBoltzmann分布に基づくソフトマックス戦略を
採用した場合の局面評価関数に含まれるパラメータの学習則を導出した.
しかし,探索や学習時の計算量が膨大となるため,3つの近似計算法を考案した.
次に,探索時にシミュレーション方策を用いてモンテカルロ探索を行う場合や,
探索の深さを制御する場合のために,局面評価関数とシミュレーション方策の両者を同時に学習する学習則を
方策勾配法により導出した.
さらに,この方策勾配の計算法を利用すると,局面ごとに正解手が既知の場合の教師付学習も可能であることを
示し,実際に学習則を導出した.

(7) 機械学習を用いた棋力の調整方法の提案と認知科学的評価
 ○仲道 隆史、伊藤 毅志(電気通信大学)
概要:
将棋AIの棋力を自然に弱く調整する事を目的として,アマチュアプレイヤの棋譜を用いて評価関数の機械学習を
行う手法を提案する.
提案手法によって評価関数を調整する事で,同程度の探索空間を利用する既存手法のAIと比較して有意に弱い
AIが生成された.
また,提案手法と既存手法によって同程度に弱くしたAIの自然さを熟達者に主観的評価させるとともに,棋譜中
から感じる人間らしさについて分析を行った.


#研究会会場近くのJAISTギャラリーでは、パズル作家として有名な
故・芦ヶ原伸之氏が収集されたパズルコレクションが展示されており、
研究会の開始前(10:30〜)および研究会終了後(〜18:30)に見学が可能です。
http://www.jaist.ac.jp/general_info/gallery/index.html