将棋ソフトの評価関数は盤面を左右反転させても同一であるべきか? Twitterで話題に ~ 2ch名人

i2chmeijinad.png

将棋ソフトの評価関数は盤面を左右反転させても同一であるべきか? Twitterで話題に

929-03.png

929-04.png


Ponanza・山本さんが問題提起










反応






Togetterまとめ

将棋の評価関数は左右対称であるべき?
http://togetter.com/li/725241



ルポ 電王戦 人間 vs. コンピュータの真実 (NHK出版新書)
NHK出版 (2014-07-04)
売り上げランキング: 32,352
[ 2014/09/29 22:45 ] コンピュータ将棋 | CM(69) | このエントリーをはてなブックマークに追加 |


スポンサーリンク
コメント一覧
  1. 2014/09/29 (月) 22:49:55
    素人だけど、左右反転させても局面同じだから同じ評価になるべきと考えるのが自然
  2. 2014/09/29 (月) 22:55:22
    これ昨日知って興味深いと思った

    個人的な意見を言えば、
    ひふみんアイってあるけど、あれはプロの解説でも「あれ?後手から見ると意外に…」ってことがあるけど、
    それは単に主観がまじってるからだと思う

    感情がないソフトからすれば、左右対象でも先手後手反転でも局面は同一だから評価値も同一になるべき。
  3. 2014/09/29 (月) 23:00:25
    なんでこれが議論になるのかすら分からない俺はついていけない
  4. 2014/09/29 (月) 23:03:11
    左効きになった気分(意味不明)
  5. 2014/09/29 (月) 23:05:37
    Togetterでこのサイト名指しされてワロタ
  6. 2014/09/29 (月) 23:08:30
    ※2
    左右対象とひふみんアイは違うみたいだぞ
  7. 2014/09/29 (月) 23:08:43
    長文コメがくるぞ!!
  8. 2014/09/29 (月) 23:12:21
    立ち上がれ小笠原 この世のために 島国が生んだ 和製大砲
  9. 2014/09/29 (月) 23:18:15
    左右非対称な初期状態から出発してある局面Aに達するまでの経路と
    初期状態から局面Aの左右反転の局面Bに達するまでの経路は当然違う。
    それで、その局面に達するまでの経路が違えば
    その局面についての評価も変わるんじゃないか(いわゆる履歴現象、履歴効果)
    ということだが
    人間の判断には履歴効果が生じるから(履歴を使って形勢判断をしたりもするので)
    AとBの局面評価が異なる可能性が少なからずある。
    コンピュータは履歴を入れて評価するようにプログラムすれば履歴効果が出て
    AとBの評価は変わる可能性があるし
    履歴を入れずに評価するようにプログラムすれば履歴効果は出ず
    AとBの評価は一致する。

    最初の「盤面を左右反転させてもまったく同じ評価値になるべきだろうか?」の
    「べきだろうか」という問題の立て方はあんまり意味がない。
  10. 2014/09/29 (月) 23:25:03
    ※9
    「左右非対称な初期状態」と「初期状態」は同じだろ
  11. 2014/09/29 (月) 23:25:22
    ※9
    まさにそこが問題で
    コンピュータ将棋は何を目指すのかって思想の問題になる
    人間と同じような判断を下せるようなコンピュータ将棋を作りたいって人もいるだろうし
    とにかく勝てるようにしたいって人もいるだろうし
  12. 2014/09/29 (月) 23:26:49
    ※10
    表現上「左右非対称な」をもう一度書くとクドイから削っただけで、同じものを指す。
  13. 2014/09/29 (月) 23:29:23
    全ての駒の全ての動きが左右対称だから
    初期局面でも現局面でも左右反転しても評価は変わらない必要があるだろうな
  14. 2014/09/29 (月) 23:37:05
    あくまで、ソフトを作る人がどう試行錯誤するかってことだな
  15. 2014/09/29 (月) 23:40:11
    経路が当然違うってどういう思考だよw
  16. 2014/09/29 (月) 23:41:39
    ※15
    えっ
  17. 2014/09/29 (月) 23:42:05
    要は定跡やプロ棋譜を参照できないから、
    駒の位置関係のみで同じ評価ができるようになれば
    そのソフトの感性はプロ棋士のそれに限りなく近いってことかね
    定跡と棋譜抜いて評価させてみれば良い気もするけどそんな単純な話ではないんだろうな
  18. 2014/09/29 (月) 23:42:25
    初期配置は点対称だし当然一致すべきじゃないか。解析する順が左右反転で変わるというのなら、評価値に影響を与えるかもしれないが、地平線の先まで解析すれば一致する。

    例えば、正負の入り混じった掛け算をするときに、人間の思考プロセスだと答えが+になるか-になるかを一目で判断し、計算の最後にその符合をつけるような計算になりがちだが、電卓は順々に最初から計算し答えを求める。それと同じことじゃゃないか?計算のプロセスの順番を変えても、正負を反転させたとしても、答えは結局同じになる。変わるのは計算効率ぐらい。
    人間も左右反転だとやりにくいかもしれないが、上に鏡でも置いて、その反転した像とにらめっこすればいつもと同じだろ?いつもと同じ条件にするというプロセスを一つ踏めば、左右反転は無効化される。

    まあ、俺みたいな凡人にはわからない深い意味があるんだろうけどな。
  19. 2014/09/29 (月) 23:55:16
    でっていう
  20. 2014/09/29 (月) 23:56:17
    初期配置は点対称だし当然一致すべきじゃないか。解析する駒の順番が左右反転で変わるというのなら、評価値に影響を与えるかもしれないが、地平線の先まで解析すれば一致するはず。

    例えば、正負の入り混じった掛け算をするときに、人間の思考プロセスだと答えが+になるか-になるかを一目で判断し、計算の最後にその符合をつけるような計算になりがちだが、電卓は順々に最初から計算し順当に答えを求める。それと同じことじゃゃないか?計算のプロセスの順番を変えたとしても、あるいは正負を反転させたとしても、答えは結局同じになる。変わるのは計算効率ぐらい。

    人間らしいプログラムを作りたいなら、上で言ってるような履歴とか手番の概念とか重点的に解析する場所の当たりをつけるアルゴリズムみたいなのもやらなくちゃいけないと思うし、総当り方式とは根本的に水と油だろう。

    まあ、俺みたいな凡人にはわからない深い意味があるんだろうけどな。
    頭良い人とは会話出来る気がせん。
  21. 2014/09/29 (月) 23:57:01
    すまん連投した
  22. 2014/09/30 (火) 00:01:32
    駒の動きは左右対称に影響されないから関係ないだろーな
    それよりは横一本マスの増減でどれだけ戦略が変わるかのほうが気になるわ
  23. 2014/09/30 (火) 00:07:25
    タイトル戦で羽生と広瀬の相振りで、左右反転すると居飛車になるっていうのあったよな
    その時のコンピュータのそれぞれの局面の評価はどうだったんだろうな
  24. 2014/09/30 (火) 00:11:05
    一見どうでもいい問題だけど追及してみるところが理系っぽいねw
    実際に評価値にズレが起こるかの結果も分析するけどその結果にいたるソフトの評価過程が肝なのかね

    こういうところからソフトのブレイクスルーが起こる可能性ゼロじゃないし面白いと思う
  25. 2014/09/30 (火) 00:20:32
    「完全な」評価関数であれば当然、左右対称局面の評価値は一致するはず。
    だが実際の棋譜には左右非対称なバイアスがあるから、それの影響を受けて評価関数にも左右のバイアスが残る。
    完全解析ができない現状で、完全を目指して無理矢理左右対称にするのか、これまでの実践譜を尊重するのか、どちらを選択するのかというだけの話。
  26. 2014/09/30 (火) 00:24:22
    単に、将棋は点対称で、チェスは線対称。
    だからチェスで起こる違いは、将棋ではないはず。

    でも違いがあるかな…と思うなら、おめーが自分で環境設定して調べろや山本くんよ。
    君はすでに君の「巻き込もう」という意思を離れて、巻き込まれてんのよ。
  27. 2014/09/30 (火) 00:24:29
    同じなら
    先手、後手がある分
    最初の評価は五分五分ではなさそう
  28. 2014/09/30 (火) 00:25:30
    左右反転って言うか盤面裏から見てるだけだから
    同じであるべきだと思うけどなー

    ずっと昔渡辺竜王(当時)のブログで似たような話があった希ガス
  29. 2014/09/30 (火) 00:28:40
    な?長文コメきただろ?
  30. 2014/09/30 (火) 00:30:08
    みんな、頭いいんだな。
  31. 2014/09/30 (火) 00:46:04
    ※ 25
    すべての正解データに左右対称の局面を加えれば、概ね同じ値が出るんじゃね?
    特徴量に左右が効くものが入ってたら別だけど
  32. 2014/09/30 (火) 00:55:16
    完璧な評価関数ならば左右反転図でも同じ評価になるはずだが
    現在のところコンピューターが学習で作る評価関数が完璧になる見込みはない

    左右対称という点だけでも完璧にしておくことは簡単にできるが
    それが機械学習のノイズになって弱くなる可能性がある

    ってとこかね
    検証してみて欲しいけど機械学習って時間と金がかかるから
    こういうのを山本さんに押し付けるのはちょっとな
    GPSチームとかがやってくれるのが一番いいんだけど
  33. 2014/09/30 (火) 01:03:23
    飛車角で左右非対称になるなら飛車4枚でやればいい()
  34. 2014/09/30 (火) 01:09:20
    ※ 32
    検証って具体的に何を調べるのさ
    駒の動きが対称である以上、左右反転した動きをする限り局面は左右対称であり続け、詰みもまた同様であることを証明するなら機械学習は関係ないが
  35. 2014/09/30 (火) 01:13:21
    うーん、どちらかというと、人間の感性というか、美意識みたいな所に行き着いてる感じ。
    どういう形を美だとして正しく評価できるか? みたいな。
    それが理論というより、実験で確認している所が面白い。
  36. 2014/09/30 (火) 01:18:23
    相矢倉は裏返すと、相振り飛車の異形に見える
    その場合、はっきり序盤は後手有利に見えるから面白い
    自分から角道を止めた先手の振り飛車が不利に見えるって事だけどね
    つまり、将棋において相矢倉の先手は本質的に不利なのかもしれない
  37. 2014/09/30 (火) 01:32:45
    ひふみんの面は左右非対称だろうが。
  38. 2014/09/30 (火) 02:22:23
    本来的には左右反転しても同じ評価にすべきだろう。

    人間が反転した盤面を見た時に、もしそれらの状況が同じだと直観的に認識できないのであれば、
    それは人間の脳による錯覚によって生み出された誤解だと思う(錯視のようなもの)。
    恐らく個人個人の「利き脳」によって印象が変わって見えているのではないだろうか。
  39. 2014/09/30 (火) 02:28:21
    非対称学習データのバイアスが過学習になってしまうのか、検証しないと結論はでないだろうな。対称、非対称の評価関数を持つマシンを戦わせて統計を出さなくては。
    本質的には、プロ棋士は左右対称な局面図2枚(および、その局面に至るまでの流れ)を見て完全に同等な形勢判断をできるか、という問題ではないかと思う。理論上では同一だが、もしも、自分はこちらの方が勝ちやすいと感じる棋士がいるのであれば、そういった思考の癖がバイアスとなって、すべての棋譜データの中にノイズが存在することになる。
    棋譜データを学習に使っている以上、そのバイアスを取り込むのか、無視するのか、選択は必要だが、前者は人にだけめっぽう強くマシンには弱い、というソフトウェアになってしまうだけかもしれない。
  40. 2014/09/30 (火) 03:13:23
    盤面を裏から見てるのと何も変わらないのでは???

    議論の趣旨が理解できない
  41. 2014/09/30 (火) 03:15:38
    100点のソフトならそら同評価値以外存在しない。だが現状まだ至っていない理想の100点に近づくために自身のそれこそ『定跡』の範疇を越えなきゃ無理であろうと考えた場合、このあえて歪な評価値[の癖に矯正したソフトより強い(仮に)]から逆算して科学するという方法はありえる所やね。

    正直偶然を積み重ね数十段飛ばしで進んでも全然時間が足りない研究だから博打していこうぜ。そっちの方が見てて面白いから。
  42. 2014/09/30 (火) 03:17:28
    そして実装的には、データのどちらを表とみなすかと言うのは人間が勝手に決めていること。

    全く同一の意味を持つプ2つのログラムがあったとして、変数名などの違いにより、人が読んだ時どちらを表と捉えるかは変わるだろう。
  43. 2014/09/30 (火) 03:22:23
    趣旨が理解できない人へ
    理論上は左右反転させても評価値は同じになります(これはみんなわかってる、よね?)
    だけど実際の将棋ソフトの評価関数をそういうふうに作ったら、むしろ弱くなっちまうんじゃねえか?
    というのが山本さんの問題提起です
  44. 2014/09/30 (火) 03:28:40
    チェスの場合はどうなのだろう?と思ってググったら、面白い記事を見つけた。
    ttp://monsieur.ddo.jp/blog/archives/2006/06/post_82.html

    でもチェスだと左右反転させると結論が変わる局面もあるのかな?
    キャスリングとかアンパッサンとか特殊なルールがあるから。
    チェスに詳しくないのでいまいちわからない。
  45. 2014/09/30 (火) 03:48:59
    コンピュータの計算にも速度面での限界がある前提に立つと…
    ・その局面に至る手の流れを無視すると、左右対称は同じ評価値
    ・手の流れから計算を省略し、有効な手のみ深く考えるソフトが強い
    →左右対称が違う評価値だと、手の流れを理解しているソフトなので強い

  46. 2014/09/30 (火) 04:03:05
    コンピューターはともかく、人が角飛入れ替えて指すと、それだけで大分感覚が変わっておもしろそう
  47. 2014/09/30 (火) 04:14:38
    ※45
    手の流れが何を指しているのかよく分からない
    同一局面であっても一手前の局面が異なっていれば最善手が異なるってことはないでしょ?
    どのような局面を経て当該局面に至ったのかが読み筋に影響するとすると
    将棋ソフトも人間の大局観に相当するような目的意識が持てることになり
    今よりも読みが効率化されより深く読めるってことなのかな
    プロ棋士が解説でよく言う「当然の1手」が分かるようになると
    でもそれで強くなるのかなあそういう先入観がないってのが売りだったけど
    もしかしたら今の技術水準だと正しい思い込みを作れるんじゃないかってことだよね多分
  48. 2014/09/30 (火) 05:40:56
    ※47
    人間の思考にそういう癖があることは分かってきてるから
    そういう部分を取り込んだソフトはより人間らしい思考をするかもしれないと思った
    議論の本筋とは外れるけど
  49. 2014/09/30 (火) 06:29:28
    将棋盤の横に鏡を置いてその鏡の中の盤面の評価値は・・・?
    こう考えるとやはり同じにならないとおかしい
    そうでないと鏡の中の将棋が現実の結果と異なることになってしまい矛盾する
    ・・・と、こんなイメージなんだけど
  50. 2014/09/30 (火) 06:44:27
    本来は同じになる。そうでなければおかしい
    しかし現在の将棋ソフトで、盤面を反転させて同じ評価値を吐かせるのはかなり大変な作業が必要になるはず
  51. 2014/09/30 (火) 07:05:16
    ※50
    元の局面とそれを反転させた局面の評価値を同じ時間計算して足して割ってそれを局面の評価値ということにすればきっちり同じにはならないけど近似はするよね
    これじゃあ手間もかかって本末転倒だけど
  52. 2014/09/30 (火) 07:14:57
    ソフトの指す将棋そのものには興味があるけど
    将棋ソフトの「中身の話」には、あんまり……
  53. 2014/09/30 (火) 07:26:55
    将棋は統計的に先手の方が微有利とされていて、先手用と後手用の戦術も別々なのに
    初期配置の形勢が±0なのが問題である、という感じにも取れる
    後手の手損分の数値化が上手くいけば解析が進化する可能性はあると思う
  54. 2014/09/30 (火) 07:55:19
    一見無意味な議論だけど、飛車角の位置入れ替えて相矢倉の定跡を指すと、意味がわかるよ
  55. 2014/09/30 (火) 08:19:30

    とりあえず、何人かが左右対称って言葉を誤用してるので指摘しておきたい。
    左右対称ってのは、「i」や「l」や「o」や「v」や「w」や「x」や「pq」のようなもの。
    ちなみに、「c」や「l」や「o」や「x」は上下対称。
    「p」と「q」が左右対称の関係にある、なんて言い方はしない。
    「p」は、線対称性がないので、反転させると違った形「q」,「b」になる。
    「i」は、線対称性があるので、反転させても同じ形になる。

    で、本題。
    「履歴効果」なんて言葉があるんですね。
    知りませんでした。
    勉強になりました。

    「>人間の判断(評価)には履歴効果が生じ」たり、現局面だけ見ても錯覚があったりするので、
    その人間が作った棋譜や定跡をデータに入れてるソフトにも、評価のズレが起こる可能性がある。
    がしかし、「>そもそも左右反転した局面が出現したりしない」ので、
    別個、反転の局面に対して、作為的に評価の差を付けない限りは、起こらない。

    で、差を付けるほうが「>モデルとしての表現力そのものは上昇する」と山本さんは言っているわけだが・・・・・、
    表現力って何?
    また、どんな法則性を元に差を付けるの?

    ってゆうか、的外れなこと言ってたらごめんなさいm(_ _;)m。
  56. 2014/09/30 (火) 09:00:27
    最初ひふみんアイのことかと勘違いしていた…
    普通は左右反転なんて考えようとも思わないもんなぁ。鏡の世界の住人かと
  57. 2014/09/30 (火) 09:29:02
    勝又が、相振り飛車と居飛車の関係について、5年以上前の本で同じような事を考えていた
  58. 2014/09/30 (火) 09:59:16
    原理原則に基づけばあるべき論としては当然左右対称性はあるべきだけど
    それは「あるべき」というか「あるはず」であって
    現ルール(主に駒配置)、有限のリソース、計算時間で強くすることを考えるなら
    必ずしも遵守されるべきものでもない
    と思います
  59. 2014/09/30 (火) 11:45:44
    レフトとライト
    サードとファースト
    ショートとセカンド

    コンバートしてみようか!
    山本監督
  60. 2014/09/30 (火) 12:16:11
    ※60
    人間の思考に近づいた方が(左右反転させた局面の評価値を同じにしない方が)勝率が上がる可能性が高いからグダグダ言っているのでは。
  61. 2014/09/30 (火) 12:36:57
    おっと、かぶった。失礼。

    ※57
    そっち(上下反転)も面白い問題で、将棋は先手必勝と仮定すれば、※53の言うとおり初形の評価値は先手がプラスでなければおかしい(現状は定跡段階で評価値を計算するのは無駄だから±0にしてるんだろうけど)。そして、上下反転すると先手の必勝手順とまったく同じ手順で後手必勝になる。

    もちろん「将棋は先手必勝」などと解明できるレベルでは、もう評価値なんてのは−99999か+99999か0かしかなくなるわけだがw

    よく将棋動画の序盤で「ここまでは互角」とかコメする奴がいるが、数学的には対局を開始した時点ですでに先手有利(どころか必勝)なんだよね。羽生vs森内レベルでは現実に勝率にも現れているが。

    ところで将棋にツークツワンク(パスができれば勝ちだが、手番だから負けてしまう)局面ってあるんだろうか。詰将棋的な、実戦ではありえない局面だったら作れそうだが…

    お互いに「仕掛けると負けになる」局面だったら相矢倉先後同型があるけど、純粋なツークツワンクとなると実戦で到達するのは難しいだろうな
  62. 2014/09/30 (火) 13:32:58
    双玉問題の派生であったと思う。
    王手をかけようと思う駒は、動かすと空き王手になる


  63. 2014/09/30 (火) 13:45:51
    よくわかんないけど、単にプログラムの中の数字を9→1、8→2、7→3、6→4に置き換えるのとは違うの?
  64. 2014/09/30 (火) 13:52:28
    comに右利きと左利き時代が来るか?
  65. 2014/09/30 (火) 13:53:17
    局面の評価値に、それまでの経緯が反映影響されなければ、左右対称の局面でも同じかな。そうでないと、対象局面までの初手からの経緯は変わるから、評価値は違うかも、ということで合ってるかな。で、局面の評価値に経緯を反映させるのが正しいのか、させないのが正しいのか、みたいな。
  66. 2014/09/30 (火) 16:02:38
    みんな熱心やの~(笑)
  67. 2014/09/30 (火) 22:58:06
    ※64
    上下反転問題。Ponanza は初期局面で先手有利と判断するらしい。

    ttp://twitter.com/issei_y/status/451355129472483330
    > Ponanzaは初期局面を読ませるとだいたい先手70点位よいと言ってますよ。
  68. 2014/10/01 (水) 00:44:23
    現行ソフトは盤面だけで分析しているのではなく、
    インプットされた人間の棋譜も大いに参考にしている。
    したがって、人間のバイアスが影響力を及ぼす分、実際には差異が出る。
    プロ棋士の棋譜なし、に今のソフトは存在し得ない。
  69. 2014/10/07 (火) 00:57:42
    NDF は反転しても同じ評価を使うみたいね
    ttp://www.computer-shogi.org/wcsc24/appeal/NineDayFever/NDF.txt
コメントの投稿
  

  


  

 ※禁止ワード「http://」 URLを書き込む場合、「ttp://」でお願いします。
i2chmeijinad.png