盤面を左右反転させてもまったく同じ評価値になるべきだろうか?何年考えてもわからないテーマである。
— 山本 一成@電王 (@issei_y) 2014, 9月 28
将棋のゲームの本質から言えば、左右反転しても同じ点数になるべき(左右で動きに性能の差がある駒がないので) 一方人間は、盤面を左右反転しても同じ評価することは結構むずかしい
— 山本 一成@電王 (@issei_y) 2014, 9月 28
なんで難しいかというとそういう訓練をしてないからであるし、そもそも左右反転した局面が出現したりしないのだ。 囲碁やchess960をするプレイヤーには見られない特徴だと思う。
— 山本 一成@電王 (@issei_y) 2014, 9月 28
左右反転しても同じ評価値を返さないようにすれば、(評価関数の)モデルとしての表現力そのものは上昇するので、左右反転しても同じ評価値を返さなくても良いという結論ももちろんありえる。
— 山本 一成@電王 (@issei_y) 2014, 9月 28
もちろん過学習かもしれないので、結論は実験的に決めるしか無いのだけれども。 #いつもこんなこと考えてます
— 山本 一成@電王 (@issei_y) 2014, 9月 28
@issei_y 素直に同じだろう!とか、心の中でさけんだw
— 大橋拓文 (@ohashihirofumi) 2014, 9月 28
@issei_y 初期局面が左右非対称なので、左右同じにするのは学習のテクニックなだけで、将棋を完璧に評価しようとすれば違う値が付くべきと思ってます。
— 平岡 拓也 (@HiraokaTakuya) 2014, 9月 28
@HiraokaTakuya @issei_y 電王とWCSC覇者はそういう見解ですか…。 僕は左右反転は一致すべきだと思ってましたが…。うーん…。
— かず@なのは (@kazu_nanoha) 2014, 9月 28
@kazu_nanoha @HiraokaTakuya @issei_y 左右対称な局面での最善手は左右対称なだけで同一ですから、評価関数も当然同一であるべきと思いますけどね。
— 棚瀬寧 (@tanaseY) 2014, 9月 28
Togetterまとめ
将棋の評価関数は左右対称であるべき?
http://togetter.com/li/725241
≪ 将棋ウォーズ、本日15時から価格改定 約3年分のパスポートを購入する猛者も | HOME | 【倉敷藤花戦】山田女流三段が挑戦権獲得 25年ぶりのタイトル挑戦 ≫
個人的な意見を言えば、
ひふみんアイってあるけど、あれはプロの解説でも「あれ?後手から見ると意外に…」ってことがあるけど、
それは単に主観がまじってるからだと思う
感情がないソフトからすれば、左右対象でも先手後手反転でも局面は同一だから評価値も同一になるべき。
左右対象とひふみんアイは違うみたいだぞ
初期状態から局面Aの左右反転の局面Bに達するまでの経路は当然違う。
それで、その局面に達するまでの経路が違えば
その局面についての評価も変わるんじゃないか(いわゆる履歴現象、履歴効果)
ということだが
人間の判断には履歴効果が生じるから(履歴を使って形勢判断をしたりもするので)
AとBの局面評価が異なる可能性が少なからずある。
コンピュータは履歴を入れて評価するようにプログラムすれば履歴効果が出て
AとBの評価は変わる可能性があるし
履歴を入れずに評価するようにプログラムすれば履歴効果は出ず
AとBの評価は一致する。
最初の「盤面を左右反転させてもまったく同じ評価値になるべきだろうか?」の
「べきだろうか」という問題の立て方はあんまり意味がない。
「左右非対称な初期状態」と「初期状態」は同じだろ
まさにそこが問題で
コンピュータ将棋は何を目指すのかって思想の問題になる
人間と同じような判断を下せるようなコンピュータ将棋を作りたいって人もいるだろうし
とにかく勝てるようにしたいって人もいるだろうし
表現上「左右非対称な」をもう一度書くとクドイから削っただけで、同じものを指す。
初期局面でも現局面でも左右反転しても評価は変わらない必要があるだろうな
えっ
駒の位置関係のみで同じ評価ができるようになれば
そのソフトの感性はプロ棋士のそれに限りなく近いってことかね
定跡と棋譜抜いて評価させてみれば良い気もするけどそんな単純な話ではないんだろうな
例えば、正負の入り混じった掛け算をするときに、人間の思考プロセスだと答えが+になるか-になるかを一目で判断し、計算の最後にその符合をつけるような計算になりがちだが、電卓は順々に最初から計算し答えを求める。それと同じことじゃゃないか?計算のプロセスの順番を変えても、正負を反転させたとしても、答えは結局同じになる。変わるのは計算効率ぐらい。
人間も左右反転だとやりにくいかもしれないが、上に鏡でも置いて、その反転した像とにらめっこすればいつもと同じだろ?いつもと同じ条件にするというプロセスを一つ踏めば、左右反転は無効化される。
まあ、俺みたいな凡人にはわからない深い意味があるんだろうけどな。
例えば、正負の入り混じった掛け算をするときに、人間の思考プロセスだと答えが+になるか-になるかを一目で判断し、計算の最後にその符合をつけるような計算になりがちだが、電卓は順々に最初から計算し順当に答えを求める。それと同じことじゃゃないか?計算のプロセスの順番を変えたとしても、あるいは正負を反転させたとしても、答えは結局同じになる。変わるのは計算効率ぐらい。
人間らしいプログラムを作りたいなら、上で言ってるような履歴とか手番の概念とか重点的に解析する場所の当たりをつけるアルゴリズムみたいなのもやらなくちゃいけないと思うし、総当り方式とは根本的に水と油だろう。
まあ、俺みたいな凡人にはわからない深い意味があるんだろうけどな。
頭良い人とは会話出来る気がせん。
それよりは横一本マスの増減でどれだけ戦略が変わるかのほうが気になるわ
その時のコンピュータのそれぞれの局面の評価はどうだったんだろうな
実際に評価値にズレが起こるかの結果も分析するけどその結果にいたるソフトの評価過程が肝なのかね
こういうところからソフトのブレイクスルーが起こる可能性ゼロじゃないし面白いと思う
だが実際の棋譜には左右非対称なバイアスがあるから、それの影響を受けて評価関数にも左右のバイアスが残る。
完全解析ができない現状で、完全を目指して無理矢理左右対称にするのか、これまでの実践譜を尊重するのか、どちらを選択するのかというだけの話。
だからチェスで起こる違いは、将棋ではないはず。
でも違いがあるかな…と思うなら、おめーが自分で環境設定して調べろや山本くんよ。
君はすでに君の「巻き込もう」という意思を離れて、巻き込まれてんのよ。
先手、後手がある分
最初の評価は五分五分ではなさそう
同じであるべきだと思うけどなー
ずっと昔渡辺竜王(当時)のブログで似たような話があった希ガス
すべての正解データに左右対称の局面を加えれば、概ね同じ値が出るんじゃね?
特徴量に左右が効くものが入ってたら別だけど
現在のところコンピューターが学習で作る評価関数が完璧になる見込みはない
左右対称という点だけでも完璧にしておくことは簡単にできるが
それが機械学習のノイズになって弱くなる可能性がある
ってとこかね
検証してみて欲しいけど機械学習って時間と金がかかるから
こういうのを山本さんに押し付けるのはちょっとな
GPSチームとかがやってくれるのが一番いいんだけど
検証って具体的に何を調べるのさ
駒の動きが対称である以上、左右反転した動きをする限り局面は左右対称であり続け、詰みもまた同様であることを証明するなら機械学習は関係ないが
どういう形を美だとして正しく評価できるか? みたいな。
それが理論というより、実験で確認している所が面白い。
その場合、はっきり序盤は後手有利に見えるから面白い
自分から角道を止めた先手の振り飛車が不利に見えるって事だけどね
つまり、将棋において相矢倉の先手は本質的に不利なのかもしれない
人間が反転した盤面を見た時に、もしそれらの状況が同じだと直観的に認識できないのであれば、
それは人間の脳による錯覚によって生み出された誤解だと思う(錯視のようなもの)。
恐らく個人個人の「利き脳」によって印象が変わって見えているのではないだろうか。
本質的には、プロ棋士は左右対称な局面図2枚(および、その局面に至るまでの流れ)を見て完全に同等な形勢判断をできるか、という問題ではないかと思う。理論上では同一だが、もしも、自分はこちらの方が勝ちやすいと感じる棋士がいるのであれば、そういった思考の癖がバイアスとなって、すべての棋譜データの中にノイズが存在することになる。
棋譜データを学習に使っている以上、そのバイアスを取り込むのか、無視するのか、選択は必要だが、前者は人にだけめっぽう強くマシンには弱い、というソフトウェアになってしまうだけかもしれない。
議論の趣旨が理解できない
正直偶然を積み重ね数十段飛ばしで進んでも全然時間が足りない研究だから博打していこうぜ。そっちの方が見てて面白いから。
全く同一の意味を持つプ2つのログラムがあったとして、変数名などの違いにより、人が読んだ時どちらを表と捉えるかは変わるだろう。
理論上は左右反転させても評価値は同じになります(これはみんなわかってる、よね?)
だけど実際の将棋ソフトの評価関数をそういうふうに作ったら、むしろ弱くなっちまうんじゃねえか?
というのが山本さんの問題提起です
ttp://monsieur.ddo.jp/blog/archives/2006/06/post_82.html
でもチェスだと左右反転させると結論が変わる局面もあるのかな?
キャスリングとかアンパッサンとか特殊なルールがあるから。
チェスに詳しくないのでいまいちわからない。
・その局面に至る手の流れを無視すると、左右対称は同じ評価値
・手の流れから計算を省略し、有効な手のみ深く考えるソフトが強い
→左右対称が違う評価値だと、手の流れを理解しているソフトなので強い
手の流れが何を指しているのかよく分からない
同一局面であっても一手前の局面が異なっていれば最善手が異なるってことはないでしょ?
どのような局面を経て当該局面に至ったのかが読み筋に影響するとすると
将棋ソフトも人間の大局観に相当するような目的意識が持てることになり
今よりも読みが効率化されより深く読めるってことなのかな
プロ棋士が解説でよく言う「当然の1手」が分かるようになると
でもそれで強くなるのかなあそういう先入観がないってのが売りだったけど
もしかしたら今の技術水準だと正しい思い込みを作れるんじゃないかってことだよね多分
人間の思考にそういう癖があることは分かってきてるから
そういう部分を取り込んだソフトはより人間らしい思考をするかもしれないと思った
議論の本筋とは外れるけど
こう考えるとやはり同じにならないとおかしい
そうでないと鏡の中の将棋が現実の結果と異なることになってしまい矛盾する
・・・と、こんなイメージなんだけど
しかし現在の将棋ソフトで、盤面を反転させて同じ評価値を吐かせるのはかなり大変な作業が必要になるはず
元の局面とそれを反転させた局面の評価値を同じ時間計算して足して割ってそれを局面の評価値ということにすればきっちり同じにはならないけど近似はするよね
これじゃあ手間もかかって本末転倒だけど
将棋ソフトの「中身の話」には、あんまり……
初期配置の形勢が±0なのが問題である、という感じにも取れる
後手の手損分の数値化が上手くいけば解析が進化する可能性はあると思う
とりあえず、何人かが左右対称って言葉を誤用してるので指摘しておきたい。
左右対称ってのは、「i」や「l」や「o」や「v」や「w」や「x」や「pq」のようなもの。
ちなみに、「c」や「l」や「o」や「x」は上下対称。
「p」と「q」が左右対称の関係にある、なんて言い方はしない。
「p」は、線対称性がないので、反転させると違った形「q」,「b」になる。
「i」は、線対称性があるので、反転させても同じ形になる。
で、本題。
「履歴効果」なんて言葉があるんですね。
知りませんでした。
勉強になりました。
「>人間の判断(評価)には履歴効果が生じ」たり、現局面だけ見ても錯覚があったりするので、
その人間が作った棋譜や定跡をデータに入れてるソフトにも、評価のズレが起こる可能性がある。
がしかし、「>そもそも左右反転した局面が出現したりしない」ので、
別個、反転の局面に対して、作為的に評価の差を付けない限りは、起こらない。
で、差を付けるほうが「>モデルとしての表現力そのものは上昇する」と山本さんは言っているわけだが・・・・・、
表現力って何?
また、どんな法則性を元に差を付けるの?
ってゆうか、的外れなこと言ってたらごめんなさいm(_ _;)m。
普通は左右反転なんて考えようとも思わないもんなぁ。鏡の世界の住人かと
それは「あるべき」というか「あるはず」であって
現ルール(主に駒配置)、有限のリソース、計算時間で強くすることを考えるなら
必ずしも遵守されるべきものでもない
と思います
サードとファースト
ショートとセカンド
を
コンバートしてみようか!
山本監督
人間の思考に近づいた方が(左右反転させた局面の評価値を同じにしない方が)勝率が上がる可能性が高いからグダグダ言っているのでは。
※57
そっち(上下反転)も面白い問題で、将棋は先手必勝と仮定すれば、※53の言うとおり初形の評価値は先手がプラスでなければおかしい(現状は定跡段階で評価値を計算するのは無駄だから±0にしてるんだろうけど)。そして、上下反転すると先手の必勝手順とまったく同じ手順で後手必勝になる。
もちろん「将棋は先手必勝」などと解明できるレベルでは、もう評価値なんてのは−99999か+99999か0かしかなくなるわけだがw
よく将棋動画の序盤で「ここまでは互角」とかコメする奴がいるが、数学的には対局を開始した時点ですでに先手有利(どころか必勝)なんだよね。羽生vs森内レベルでは現実に勝率にも現れているが。
ところで将棋にツークツワンク(パスができれば勝ちだが、手番だから負けてしまう)局面ってあるんだろうか。詰将棋的な、実戦ではありえない局面だったら作れそうだが…
お互いに「仕掛けると負けになる」局面だったら相矢倉先後同型があるけど、純粋なツークツワンクとなると実戦で到達するのは難しいだろうな
王手をかけようと思う駒は、動かすと空き王手になる
上下反転問題。Ponanza は初期局面で先手有利と判断するらしい。
ttp://twitter.com/issei_y/status/451355129472483330
> Ponanzaは初期局面を読ませるとだいたい先手70点位よいと言ってますよ。
インプットされた人間の棋譜も大いに参考にしている。
したがって、人間のバイアスが影響力を及ぼす分、実際には差異が出る。
プロ棋士の棋譜なし、に今のソフトは存在し得ない。
ttp://www.computer-shogi.org/wcsc24/appeal/NineDayFever/NDF.txt