>>3-4連投してしまいました。
スレ建てしたので前スレのソフトの古いPCで動くバージョン誰かお願いしますm(_ _)m いい加減、メンテされてないような将棋ソフトはテンプレから外したら?
>>k_ohga
>>本家へのnnueのPRをインターセプト
>>なんとかちゃん情報みたいな事にはならんかった。だいぶ弱いかも。
>>向うのコードがいいのか、なんか失敗したか。。
NNUE-whaleの方、ぜひ連絡を
【コミュニティの一生】
面白い人が面白いことをする
↓
面白いから凡人が集まってくる
↓
住み着いた凡人が居場所を守るために主張し始める
↓←コンピュータ将棋界隈は今、この辺りの状態だね。
面白い人が見切りをつけて居なくなる
↓
残った凡人が面白くないことをする
↓
面白くないので皆居なくなる
>>15
もし、その一つ下の段階だとしたら面白い人ってのは山本一成さんだね
彼がいたころは本当に盛り上がって面白かった
技巧やukamuseでレーティングも恐ろしい速度で上昇したし >>16
もうすぐだよ。
明確な目標が失われた状態では、
人間がモチベーションを長続きさせるのは難しい。
時間、お金、その他諸々を犠牲にするに相応しいと思えるだけの目標がなければね。
現状、どこにそれを見出せるだろうか。 山本はネタの人でヒール
エンタメとしては面白いのは認めるが明らかに「主張し始める」の枠
ヒールやるのはいいんだけど
ムキになんのがイタいんだよなw
ボンクラもそうだったけど
メタゲーでイキる「48」「まふ」※まふは今回何も貢献できてないw
改変でイキる「たま」「まふ」ゴミ環境でキメラだけで成果を我が物顔にする恥ずかしいw
山本さんはひょうきんなキャラだったし、高学歴&将棋高段者のイケメンだった
手法を非公開にしていたのと他との差が圧倒的だったのが悪のイメージを作っただけだと思う
正義の技巧、力を合わせたApery、同じく正義のelmoが巨大な力に挑むストーリーは映画化してもいいくらい面白かった
qhapaq惜しかった
AlphaZero 90 - 2 - 8 elmo_wcsc27 YaneuraOu 2017 Early KPPT 4.73 64AVX2
>>10
それは多分本家のやねうら王が
開発版でNNUE評価関数の読み込みをサポートしたという話だと思います
GPLライセンスなので元々取り込みは自由のはずですが
一応そのあたりを明言する形にして上げなおしました
https://www.axfc.net/u/3911420
whale3以降は思いつく変更は20パターン以上試して
最後の訳の分からない改変以外は全て有意差無しだったのでもうこれ以上の調整はないです
whale3が最終版、whale4は短時間かつTNK評価関数という特殊条件で強いだけな気がするので
他の評価関数に移植してもそれなりの棋力を発揮するwhale3の方が通常利用には向いていると思います >>26
うpあり、早速試させていただきます
画像の下の段、左の名前が使用したevalかな >>15
コンピューター将棋は成績が出なけりゃ声が大きいだけでは
相手されないから凡人が居座る余地ないからその図式は微妙だなあ ライブラリとそれなりのマシン用意すりゃ好成績は取れるだろ
逆に面白いことやろうとしてライブラリに手を入れるほど弱くなる
最強の評価関数はwcsc28不参加の透氏が保有しているから
上のエンジンと合体させたら大会の有意義ゼロやん
そろそろテンプレで「透」をNG推奨にしてもいいかもね
透さんが嘘つく理由もないから鯨よりも強い評価関数を作ってるのは確かだとは思うが、公開されてないものをあーだこーだ言っても仕方がないかと
くじらより強くは結構簡単になるけど、そこそこ差がないと公開するほどでもないから色々やってるんでしょ
透氏の評価関数は
今公開したらアルファゼロを超えるんだから絶対に早く公開した方がいいよ
鯨ベーコンされてから公開しても栄誉全部持っていかれるぞ
>>32
透さんはたまに公開してくれるのでありがたいけど、いろんな評価関数との検証が不十分なまま、すぐに一つのソフトだけの100局〜200局程度の対局数で強いのが出来たと言い出すのはどうかと思う、
wakame1stも結局いろんなソフトと対局した結果aperypaqより総合的なレートは下位になっており、今回のクジラ9との対局100局程度では最強評価関数を保持していることにはなるまい >>39
wakame1stとaperypaqの差は誤差の範囲内だから、下位とはいえない キメラなどはキメラ元には強くなることが多いが、キメラ元以外には相性でキメラ元より弱くなっていることが結構ある、
結局総合的なレートはwakame1stのようにキメラ元より若干下がっている可能性が十分ある
評価関数を配合して、配合元より勝率が上回り強い結果になっても総合的なレートが上がるどころか逆に下がっている可能背が十分ある
例えばクジラ9がたぬきwcsc28に勝率52%(ロタ氏計測)だし、yaselmoがramuより弱いように
初代elmo相手に強ければいいよ
鯨ベーコンでも誰かのタヌキ絞りでもいいから
早くアルファゼロを暫定王者の座から引きずり下ろして欲しい
floodgate初参戦したいけどポート開放上手くいったのに転送接続にデータを書き込めない云々とか出てキレる
結局、やねうら王のソースコードがベストなのか、、。
やねうら王、出来が良すぎて技巧みたいな新しいソフトの登場を阻んでないか?
フルスクラッチでやねうら王ライブラリ勢に勝つのは至難の業だよなもはや
よっぽどの才能か資金力が必要な気がする
現状のソフトに不満があるため、モンテカルロ法のような
一見変わった方法を手当たりしたい試す、もしくは提案するだけでも注目される土壌
ならともかく、現状でも何だかんだ言っても強さ自体がほぼ絶対の評価
になっているから、敢えて新規にやるようなモチベは持ちにくいでしょ。
あんなやる気のない奴がやってんのに勝てんのか
その割にはしっかり作ってあるけどw
>>46
やねうら王が新しいソフトの登場を阻んでいると言うよりは、今のソフトが探索部も評価関数もガチガチにチューンナップされて改良の余地がほとんどなくなってるってだけじゃない? とりあえず再調整をして
3スレ0.1秒の条件付きではあるけどAlphaZeroは超えられたのでバージョンアップ
NNUE-whal5 471(94%) - 29(5%) elmo_wcsc27
AlphaZero 90(92%) - 2 - 8(7%) elmo_wcsc27
長時間でも超えているかは自分のスペックでは測れないから頼んだぞ
googleの計測条件は64スレ1手1分(投了値900)らしい
https://www.axfc.net/u/3911555 >>51
さすがに3スレ0.1秒は駄目だろ。
ノード数が少なすぎて測定誤差が大きそう。 >>51
元々elmoは一手0.1秒で弱かったから捨てられそうになったんだしな だからマシンスペックに余裕がある人は良かったら確かめてくれってことなのでは
qhapaqさんがqzillaの改良評価関数だしたらNNUE WHALE 3と5を戦わせてみるよ
>>52
ノード数が少ないと誤差が大きくなる根拠は? 3スレ0.1秒対局の勝率という意味では誤差は大きくならんだろう。ただ、超短時間の対局での勝率と長時間の対局での勝率は、相関性が高くないといわれている
この手の話が出ると思うのは
現在の短時間対局は過去の長時間対局で
現在の長時間対局は未来の短時間対局であるわけだが
本質的な差異はどこにあるんだろうか
エンジン名に日本語が入っていると
TanukiColiseum.exeを使用時に落ちることが発覚したから
>>51はエンジン名を変更して上げなおし
https://www.axfc.net/u/3911567
それと言い忘れたけど>>26のTNKは設定ミスで2スレになってたかもしれない
手元でqhapaqとTanukiColiseumで対戦させているけど
有意差は出なさそうだから互角3スレ0.1秒の強さではqhapaqとは互角みたい TanukiColiseumは開始手数8では差が出なかったけど
開始手数24にしたらTNKが有意に強かった
自分の環境で計測できるのはここまでだね
あとはハイスペックPC環境の人の報告待ち そろそろ評価関数の分解能(歩の100分の1)が限界なんじゃないかな
10点〜20点で刺し合いしてるときに誤差0.5が50回も積み重なると吹き飛ぶわけだし
>>57
その時代のハードでできるだけ長時間で対局させようってだけの話
未来になってハードが進化してもも無理のない範囲で長時間で対局させるべきでしょう 極限的には評価値は3値でいいわけだから、違う局面で同じ評価値ってのがあっても別にいいわけで、解像度は特に問題にならなくない?
一歩=100はあくまで表示の時の話だからエンジン内部はどんな値でもいいんだよ
実際Aperyと互換性のあるやねうら王系は内部で一歩=100ではないし
内部計算は整数で行われるがオーバーフローとの兼ね合いをみつつスケールされている 分解能は1より小さい
いわゆる固定小数点計算というやつだ
>>59
whale3はTNK_v1.0より強いが、whale5はwhale3より弱くなっているので、whale5の再検証が必要では
設定 16万ノード 定跡なし
TNK_NNUE_whale3 vs TNK_v1.0
対局数200 whale3側の104勝89敗 引分7 勝率53%
TNK_NNUE_whale4 vs TNK_v1.0
対局数200 whale4側の108勝88敗 引分4 勝率55%
TNK_NNUE_whale3 vs TNK_NNUE_whale4
対局数300 whale3側の151勝137敗 引分12 勝率52%
TNK_NNUE_whale3 vs TNK_NNUE_whale5
対局数200 whale3側の104勝85敗 引分11 勝率55% Qhapaq優勝か、これで心置きなくNNUEに移行できるかな
NNUEのような省メモリは対局後でもパソコンがサクサク動くので理想的
>>61
1手10秒の勝率の真値を推定するには、1手10秒それ以上でも以下でもない条件での計測が必要なだけで、
0.1秒なら0.1秒の、持ち時間1時間なら1時間の真値が得られるわけでそれでいいだろ
目的によるとしか言えん >>71
普段0.1秒で検討することあるの?変わってるなあ NNUE-whale5 強いね!
エンジンだけ替えて、これだけ差が出るのはすごい事だと思う
TNK 33-6-61 TNK-NNUE-whale3
TNK 24-6-70 TNK-NNUE-whale5
TNK-NNUE-whale3 121-23-156 TNK-NNUE-whale5
クジラ 79-16-105 KPPT-NNUE-whale5
全部 1手 0.2秒
AVX2 使えないので SSE4.2版 使用
>>73
今クジラとwhale5(評価関数はqzilla9)を一手3秒(nps600万)投了値1500でやらせてるが
57局時点で27-3-27と完全に互角になってる >>74
おお、素晴らしい
結果が出るの楽しみに待ってます バージョンが多くて検証が大変そうですな
短時間ではかなり強くなってる感じなんすね。長時間でも現時点でくじらと互角ならNNUEの未来は明るいな
>>61
探索の理論的技術的な話を問うているのに
いつでも長く検討させればOKみたいなバカは黙ってて。 >>78
そういう話がしたいのなら
『現在の短時間対局は過去の長時間対局で現在の長時間対局は未来の短時間対局である』
この前提が既に間違いね
そしてなぜハードの進化に合わせて対局時間を短くしていかないのかよく考えてみて とりあえずNNUEとaperypaqとで持ち時間1秒で対局してるけど、NNUEが大体7勝3敗くらいのペースで勝ってくね
>>72
改良の効果を見るなら0.1秒でいい
というか0.1秒1000局と10秒10局なら統計的に意味があるのは前者
大会のレギュや検討での予測として使えないというなら、そこに何らかの理論がいるし、1時間の結果に10秒の方が0.1秒より近いという保証は何もない
現状そんなスペックではとかそんな時間ではと勝手な閾値決めて主観でイチャモンつけてるだけ 1秒とかじゃなくて、ある程度長めケースでの実力が知りたかったので、
PC2台使って、3日掛けて、30秒のリーグ戦をやってみたんで、流れを読まずに書き込んでみる。
ファーマットは前スレ443のが見やすかったからパクったけど、443さんとは別人です。
>>84
30秒とはこれまた極端な……有意差出るまでやろうと思ったらきつすぎる所行 一手の消費時間の長さは長くするほど
投了値の大きさは小さめでも効果は同等になりそうだけど
誰か適切な投了値と消費時間の関係を調べたことある?
同じエンジンで評価関数の優劣を比べるなら深さ固定にすればあまり時間をかける必要無いと思うんだが
>>80
ありがとうございます
ダウンロードはできたんですが、動かそうとするとエラーが出るようです elmo絞りが出てきたころの話を知らぬのか
同じエンジンで評価関数を変えるだけで長時間に強い・弱いって差が出てくるのよ
>>89
あら、ダメでしたか、申し訳ない
もし良ければ、お使いのCPUを教えてください elmoの勝敗を考慮に入れたアルゴリズムを他のソフトも取り入れたから
今は短時間でもおkの可能性は?
>>90
それは当然知っているがそれは0.1秒で対局させたからであって、それだと探索深さが変動して安定した結果が出ないから信頼性低いのではと思った。
長時間になればなるほどだと同じエンジンなら探索深さもほぼ同じになるだろうから正確に強さが図れる
だから探索深さを固定すれば探索に影響受けずに純粋に評価関数の性能を比べられるんじゃないかと考えたわけです また羽生がソフトを上回ったね。(ソフトのノードが低い時)
このノードでは▲48玉が最善手としている
しかし10億ノードぐらい読んでようやく
同玉が最善でこの手こそが逆転する手というのに気づく
結局▲同玉 △67馬のあとの37手目の▲56香車を枝切りで見逃してたんだね。
こういうノードが低い時の見逃しは藤井や羽生のときによくおきるね
やはりこの二人は低ノードのときのソフトを上回る読みをする 10秒とか1分程度の低ノードのソフト同士の対局て
意味あるの?
読みぬけ多くて羽生や藤井以下になること多いんだが
また羽生がソフトを上回ったね。(ソフトのノードが低い時)
このノードでは▲48玉が最善手としている
しかし10億ノードぐらい読んでようやく
同玉が最善でこの手こそが逆転する手というのに気づく
結局▲同玉 △67馬のあとの37手目の▲56香車を枝切りで見逃してたんだね。
こういうノードが低い時の見逃しは藤井や羽生のときによくおきるね
やはりこの二人は低ノードのときのソフトを上回る読みをする 某棋士は検討は10秒で十分とか言ってたが個人的にはあり得ない
そんな人の公開したbookは精度が低い
深さ指定は同じ評価関数の学習だけ変えたやつとかなら使えるんだろうけど
エンジンが違うとかNNUEと3コマの評価関数の比較とかには使えないから時間指定がいいよ
あと違うエンジンで短時間は時間制御のマージンとかINFOの出力の違いとかで
違いが出すぎるからあまりおススメせんな
最近はやねうら王系ばっかだからあまり問題にならないけど
てかあのbookって短時間の持ち時間で連続対局で指させて作ってるみたいだけど、5960xのCPUで短時間では精度が低いのでは?
確かに膨大な量だけど一つ一つの変化は精度が低い
>>96
各持ち時間5時間とかでたまにやらせるけど、それでも棋譜の内容見ると「うーん」って感じる場合が多いよ
それくらいいい将棋を作り出すのは難しい 終盤の枝仮りの強弱のパラメータはユーザーが調整できるようにならんの?
やはりこの界隈に詳しくて最高峰のプレイヤーは西尾先生なんだろうなー
まぁc-bookを鵜呑みにする人が増えたらそれはそれで勝ちやすくなる
人造棋士18号、当然だが一般知名度なさすぎw
人気No1将棋系ユーチューバー本日の動画
【将棋倶楽部24実況】先手:クロノ 後手:JKishi18gou
検討ソフト:elmo(去年ver)
「相手は最強のJKですね」(冒頭)
「J棋士18号? JKいし18号じゃないだろうから」(1分5秒〜)
まあ一般の将棋ファンにとっては
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」
ってことだなw 人工知能ブームの特集が組まれた本やテレビ番組で最先端の人みたいな扱いで山本さんがでまくっていたから仕方ない
ボナンザとポナンザが知名度は2強であとは無名なのが実態だろう
30万ダウンロードの技巧は将棋ファンには知られているだろうけどさ
ポナンザが人工知能とかまさに情弱の証 田舎者よりヤバイわ
ポナンザの名前がボナンザのパクリでムカつくわ
まるであの国みたいだな
千田はどれだけ読ましても枝刈りの影響で読めない局面があるからこそ一手10秒程度でもいいということでは?
個人的にソフトの読みがおかしいと思うなら自分の読み筋を入力していって検証すればいいんだからな
ある意味アドバンスド将棋で検討しているようなもの
>>91
CPUはcore i5-3570になります あと総合的に見てソフトが人間の技術を上回っているのは間違いないのだから一部間違った評価を下すのを分かったうえで検討するのは問題ない
終盤力を上げてもレーティング上昇には直結しにくいから開発者は終盤に力を入れない.
だから序中盤力の伸びと比べたら昔のソフトからの終盤力の上昇度は小さい.
Qzilla-Qhapaq-Roll関数が公開されたな
「人工知能の研究をしています。」
「おおっ、どのような分野ですか?」
「コンピューター将棋です」 (ドヤ!!
aperypaqみたいに、しばらくは総合的なレートが高そうなのでQzilla-Qhapaq-Roll関数を使う人が多いだろう、これをキメラして強くなっても、総合的なレートは上回れないと予想する、現にキメラ勢(wakame1st)でもaperypaqと同等だし
そろそろAlpha zeroに挑戦状を叩きつけるレベルの強さになってきたのでは??
人間だって見落とすことがあるし、やたらソフトの見落としが強調されるのはどうもな。
しかし10億ノードもくじらちゃんだと1秒か。10年後くらいはこれが当たり前になってるのか?
>>96
ソフト1手10秒、羽生持ち時間9時間とかで対局したら
いい勝負になるかもね
果たして勝ち越せるだろうか result : qqr = 1.00199 x qzilla9 + 0.0173011(diff ratio)
Apery→aperypaqよりは変わってるけど、やっぱり微差なんだよなあ
>>122
やはり初期化エラーが出てしまうようです 一般の将棋ファンにとっては知名度・実力ともに
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」
ポナンザは対プロ戦でも圧倒的に強かっただろ?
だが他のソフトなら、今でも事前貸出で研究してハメればプロが圧勝できると思われてるよw
ポナンザ以外のソフトなら電王戦FINALでプロが勝ち越しで終わってるイメージが今でも根強く残ってるしなw
ポナなら人間では勝てないと誰もが認めたけど
>>124
うーん、そうですか…
原因が分からないです、ごめんなさい
逆に「動いてる」って方いませんか? QQRは探索やねうら王なのか。
godwhaleの探索はあくまでもqzilla9に最適化されてるってことなのかな
>>126
i5-2400ですが動きました
ありがとう! >>129
いえ、122が初体験
KPPT-NNUE-whale5_SSE42.exeのほうも問題なく動いております >>124
エラーをここに「正確に」転記したら有効なアドバイスがもらえるかもしれない >>131
そうですか
最適化の関係で >>80 のが動くなら
そちらの方がNPSがわずかに高いと思われます
(やねさんのデフォ設定なので) >>58
新しいウェブアドレスに移動したとか言われてDLできない >>124
初期化エラーってShogiGUIかな?
将棋所ではどうなのかな >>83
0.1秒のテスト対局やったせいで技巧が0.1秒だけに強くなる失敗をしたのは開発者の間では有名な話 Rota氏の計測によると、先手勝率60%か、ソフトが強くなるにつれて徐々に先手勝率が高くなっている気がする
>>133
80のほうも動きました、ありがとう
>>124
鵺の評価関数いれてないとか?
KPPT-NNUE-whale5もやってみた?
そっちはelmo等普通のやつでうごく >>107
一般の将棋ファンにとっては実力・知名度ともに
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」だ
他のソフトなら、今でも事前貸出で研究してハメれば間違いなくプロが1億%圧勝できるよw
ポナンザ以外のソフトなら電王戦FINALでプロが見事に勝ち越してるしな
最新のソフトが対人でも強いと認められてれば今頃巷に溢れてるはずだろ?現実は全然違うけどw
ポナなら人間では勝てないと誰もが認めたけどな >>125
またこの荒らしか、こいつスレを荒らすのが好きだな、今時R4200越えのソフトにトッププロが勝てると思っているのは、お前くらいだアホ >>140
R4200だとかR4500だとか全然関係ないねw
ハメて大駒を捕獲すればプロの楽勝だからな
ポナには通用しないが他のソフトなら貸し出しで弱点を研究すれば簡単にハマるよw >>139
数年まえの電王戦のようなハメてなどR4200以上のソフトに通用するわけないわアホ >>141
お前の言っているのは何の根拠もない思い込みや、当時のR3000程度のソフトとはレベルが違うわアホ 羽生さんや藤井聡太君を出すまでもなく、25歳以下のプロはソフトに全勝という事実!
「角ならずw」「28角w」
ポナ以外のソフトなんて単純だからすーぐハメ手に引っかかるよw
俺だけではなく世間の多くがこう認識してる
最新のソフトが一般の将棋ファンからガン無視され、
ニコ生で評価値出してるぽんぽこがまるで信用されてない
なぜならプロより弱いと思われてるからだw
>>146
お前一度 floodgateに参戦してR4300のソフトと対局してみろ人間とはレベルが違うのが分かるから、そしてそれにハメてをして一度でいいから勝ってから大口たたけや どうせなら人工無能とまでは言わんがもうちょっと気の利いたスクリプトでもつくればいいのに
いつも同じでつまらんわ
▲同玉とした直後のたぬきさんの評価
そのあと△67馬 ▲56香車 と指した後の手のひらを返すたぬきさん
こういうのみると
ルール次第ではソフトもまだまだだなと思わせる
ソフト一手10秒 人間持ち時間9時間
事前にソフト貸出あり
だと人間が勝ってもおかしくなさそう ニコ生解説のプロとは異なる予想手をソフトが示した場合の視聴者の反応
例:64歩
ポナンザの場合
「64歩かあ・・・、俺らにはよく分からんがこれが正解なんだろうな、さすがポナ」
ポナンザ以外のソフトの場合
「64歩www 弱っwww このソフトバグってんじゃね?w やっぱプロはすげー」
或いは
「こんな手はプロなら誰でも指せるし、俺だって指せるわw 評価値なんてイラネ」
Qhapaqさんは1位なりたい病ですか
公開してもらえるのはうれしいです
プロ棋士側の負担も考えようや
もうソフトと戦う時代は終わった、競わなくていいそれでいいんだ
逆に言うとプロが横歩取りの終盤の研究にソフトを使うことはリスクもあるっていうことやな
>>135
やはり初期化エラーが出るようです
Error! open evaluation file failed
Error! : read file error , file = eval/KK_synthesized.bin
と表示されます。
evalフォルダを見てみたら、nn.binというのしか入っていませんでした
使い方間違っていますか? ぽんぽこからTNKに乗り換えちゃえばいいのに検討用ソフト。
QQRもTNKも同玉最善手で先手にプラス評価を示せるし
>>155
ぽんぽこも時間かければ同玉最善手になるよ
俺のパソコンだと5億ノードぐらいだと同玉最善先手+にならない
10億ノードぐらいかかる >>151
QQR評価関数なかなかすばらしい
クジラパークといっていいのでは
QQR関数(Qzilla-Qhapaq-Roll関数)が公開されました。
YaneuraOu4.82AVXTとの組み合わせでQzilla9+GW5.0.5に対して
勝率約55%、+34のレートを持った強力な評価関数です。
ROTAさんの対クジラのレートチェックも受けてるので
きっと4200越えは間違いないかな
検討用に使わせてもらいます(uuunuuunさんの結果楽しみ)
おーがさん Qhapaqさん ありがとう
uuunuuunさん 計測追加いただけると幸いです Qhapaqの新しいのはやねうら王じゃなくクジラちゃんで使えばいいよね
正直
結局
一手10秒とかの結果でR4200ごえだーとかいっても
結局一手10秒じゃ
▲同玉とした直後のたぬきさんの評価
そのあと△67馬 ▲56香車 と指した後の手のひらを返すたぬきさん
こういう事が起きるから
なんかなー
R4200だ4300だといっても虚しいのはおれだけ?
結局一手10秒とかの結果じゃあなあ >>159
お前そんなにソフトが嫌ならソフトを使わんかったらええだけやろが ソフトを無償で使わせてもらっていながら、ソフトに文句を言うアホが沸いとる
>>160
なんか最大の弱点はほったらかしにして
R4200だR4300だと競い合ってる様が
馬鹿みたいと言うか
いやソフトすきだからいってるわけで >>162
R4200というのはは何千局とソフト同士で対局させた結果だけど
ソフトには弱点があるから実際には強くなってないみたいなことが言いたいわけ? 勝率最大化と検討用最適化は一致しないっていう毎度の話やろ
一致はしないけどある程度の相関はあるよね。
レーティングよ上がれ上がれと開発されたソフト達だが、10年前5年前と比べれば検討も正確
ソフトを無償で使いながらそのソフトの文句を言うやつや、電王戦のポナンザR3950程度の検討レベルをいまだに崇拝するやつが定期的に沸いとる
>>166
ポナは現役の名人を含み、プロとの公式戦で7戦全勝したからな
ポナ以外のソフトでプロとの公式戦で3勝以上したソフトはゼロ
で、お前の自慢のR4200とやらのソフトは「公式戦で」プロに何勝したの?w
一般の将棋ファンから訳わからんソフトが信用されないのも当然だわな
電王Tで優勝したAWAKEでもハメ手であっくんに負けた訳だしw >>167
お前はほんとアホだな、プロ棋士はボナンザ6.0程度の将棋だが、それに勝って何の価値がある ソフト換算でR2800程度のトッププロや棋士に勝つことに対してはソフトからしたら何の価値もないわ
アマ6級をトッププロとして、タイトルホルダーをR4230のソフトとしたら、タイトルホルダーがアマ6級の7人に全勝したからといって、
何の価値がある、お前の言っていることはこれと同じレベルの話だわ
>>168-170
悔しすぎて3連投かあ、朝っぱらから腹を抱えて笑わせてもらったわ(失礼)w
プロとの公式戦で7戦全勝したポナは、実績と一般ファンからの絶大なる信頼を得たね
まあいつかR4200超えのソフトも公式戦でトッププロに1勝でもできるといいね(無理だろうけど)
期待してるよw >>171
お前みたいな価値が分からないアホは久しぶりや この間千田先生が最新ソフト相手だったらノータイムで指してもらっても勝てないって言ってたんだよなあ
もう平手で同じ持ち時間で人間とソフトがって時代は過ぎ去った
同じ持ち時間なら勝てないのはみんなわかってる。
でもそれでソフトが凄いとは思わないよな
ソフトは人間より非効率な思考を、1億回とか10億回とか
人間じゃ無理な回数重ねて、人間に勝ったとマウントしている。
ただソフト一手10秒 人間持ち時間9時間とかなら
羽生や藤井なら勝てるかもという話
別にいいでしょ
人間も開発者も互いに頑張ってるんだし
それに人間のレートも上がってるんだぜ
人間より効率の良い思考をして
1秒で正しい正解を導き出すソフトがでないかぎり
人間を超えたという気がしないよな
いまは人間より非効率な思考だけど
1億とか数の暴力でそういうのでごまかしてるだけ
ソフトが進化してもプロはすごいし、ソフトが将棋の神様に近づいていくのも面白いってことでいいと思うけどな
いずれにせよまだまだ将棋の奥が深いということが分かった
産業機械が人間のカロリー消費より多いか少ないか考えるか?
ソフト最善手指し続けて更にソフト上回る手指したんならワンチャンあるけどそうじゃないからな
ソフト一手10秒だろうがそんな局面までたどり着けずに撲殺されるだけ
ていうか10億ノードなんて20秒じゃん
クラスタ組んだら5秒以内だし
昔渡辺が1時間で読める手は500手くらいって言ってたな
人間並みの0.15NPSとかにしたらさすがに人間より弱そう
なぜ将棋だけNPSを人間と揃える必要があるんだ?もしかして将棋ソフトは高度なAIで人間の知性が脅かされていると思ってる人がいるのか?
単なる将棋機械なのに
問題無さそうだったので、>>122のファイルは削除しました
>>80のファイルを使ってください
>>154
nn.bin は新しいたぬき用のファイルなので TNK-NNUE-whale5_SSE42.exe を使ってみてください
KPPT-NNUE-whale5_SSE42.exe は従来の三駒評価関数用です カッパ巻き関数をやね4.82とGW5.05でどっちが強いかは見てみたい
有意差ないかもしれないが
昔のソフトが目指してたのはまさにAIだったんだけどな
ハードが進化してAI目指さなくても力技で勝てるようになってしまった
しょうがないね
>>188
ん?評価関数は強化学習で作ってんじゃねぇの? ここからすぐにR4300超えのキメラが現れる
↓
NNUEでR4350超えが現れる
↓
SDT6優勝はR4400超え
くらいが理想のペースかな
でもホントにR4200とかいってるのかね
似たような評価関数と探索部が多いからレーティングが過大になっているのでは?
測れるのは全く違う技巧との対戦成績くらいか?
>>193
そのうち基準を引き上げてGikou2あたりが基準になりそうだね パターン認識の最適化問題という点では将棋も囲碁もAIにちがいない
「人工知能」とかいう言葉のイメージとはおおよそかけはなれているが
それは訳語の問題でしかない
技巧2は入玉が視野に入る戦いではポンコツ化するし
序盤の穴は定跡で塞がないとガバガバだし
基準としては不適格このうえない
>>193
基本的に直近の上位ソフトとばかり指して測定するから、拡散しちゃう傾向はあるね
いざ見かけ上R500差くらいのソフトと対局させてみると、9割もいかないことが多い いよいよ7段昇段をかけた藤井6段の対局が始まった
最新のエンジンで形勢をチェックしよう
>>197
その代わり1年前2年前とかのソフトは押し下げられていくから、
最近のソフトではなく数年前のソフトの値で見てみるのがいいのでは? >>74
>>75
200局一手3秒でやらせたらクジラちゃんのほうが探索部の性能が良さそうな結果になった
>>80
将棋エンジンをupしてくれるのはうれしいのですが
ダウンロードトラブルが多いので出来れば GigaFileか
BitSendでupしてもらえればありがたいです >>159
ニコニコのぽんぽこはiPad並みの低スペックだから、評価値変動しやすいよ >>186
ありがとうございます
tnk-nnueのほうを使ったら正常に動作しました
なぜかkpptのほうを使うべきだと思い込んでいました
お手数をおかけしました 振り飛車沢山指すと聞いてhoney waffle導入したのに全然振り飛車指してくれないんだが、何が原因なんだろうかわかる方いらっしゃいますかね
>>205だが定跡オンに出来てなかったっぽくて、調節したらいけました
ちゃんと定跡オンになってるのかどうかっめどうやって確認できるんですかね >>206
定跡の手は時間を消費しないからONになってたらすぐにわかるよ >>207
成る程、ありがとうございます
ソフト同士の対戦の時に定跡オンだとあまり比較としては宜しくないんですかね?
例えばクジラとクジラより弱い評価関数を対戦させたら、普通はクジラが勝ち越すのにどちらも同じまふ定跡オンにしたら互角の戦いになってしまうなどです >>208
その程度の知識しかないならそれを聞いたって仕方ないだろ 定跡を使わないというのはわかりやすくはあるが
指定局面 初型だけというはいささか疑問だな
どんな手順で勝負が決まっているのか吟味しないと
何を測定しているのかわからんということになりかねない
uuunuuunさんは基本定跡offだが、ハニワとwandreだけは定跡onだそうだ
定跡の有無は勝敗にかなり影響を及ぼしてると思うけどね
検討の信頼性を判断するためにって言われることが多いけど、
個人的にはその理屈にはちょっと懐疑的
そのうちR50とかR100の差とかどうででもよくなる
qqr、gikou2に対して8割しか勝てないんだけど相性問題というやつ?
どなたか、NNUEのスマホ版をアップしていただけませんか?
>>214
低ノードだとuuunさんのとこのレート表で見るよりGikou2は強いよ >>215
UPなんてしなくても、ビルドすればいいだけでは? しかし、aperypaqを超えられたのは結局クジラと河童だけってのは
yaselmoを超えられてたのがぽんぽこと河童だけ、ってのに近いな
SDT5からの伸びしろはあったわけだから、言うほど悲観しなくてもいいのかも
>>217
素人なので、やり方が分からないのです。 >>216
i7 6700kで8スレ一手3秒でやらせてるんだが低ノードってどこまで? >>220
uuunさんのとこは約1500万ノードでやってるからそれより極端に少ないノードって意味だった
その設定なら1000万ノードくらいは出てるのかな、てことは相性もしくは対局数の不足かな 自作ボードゲーム市場に詳しい「ペンとサイコロ」というブログの
「ゲムマ2017秋・アンケート結果 第二弾:2016→2017年比較」の記事によると
ゲームマーケットに出品した人の半分が赤字で半分が黒字でちょうど半々だそうだ
50万以上の儲けが5%いるが逆に50万以上赤字なのも5%いる
そして初参加の人の7割が赤字なのに対して、ノウハウがありや知名度や固定ファン層が居る
中堅サークルの7割が黒字になってる
継続性とブランド力構築とノウハウが大事だという事だと思う
初参加の人は作る個数と需要を見極めツイッターやユーチューブでの宣伝がカギになる
最初は50〜100個ぐらいをいかに金かけないで作って売るかの勝負になる
これがゲムマ2016・2017年(初の二日開催)の販売数
これが販売金額
これがイベントでの利益
>>220
そのノード数からするとやねうら王の設定がおかしいのは間違いない
おそらく技巧より何秒か損していると考えられる、設定が良ければqqrだと技巧に勝率9割以上はいくはず >>222
今76局時点ではqqr(探索部はくじら←これのせい?)の勝率83%だわ >>224
やねうら4.82に変えて設定も見直してみるかな >>223
なんでこのスレに書き込んだのか知らんが半分黒字って凄いな >>225
76局ではまだなんとも言えんな
300局超えてもその勝率ならちょっとおかしいと思うけども >>218
apery_wcsc28+yaneura4.82もaperypaqを超えている >>200
つまりT.N.Kに最適化されている感じか
組み合わせが色々とあって複雑な状況だな QQRは正式にはクジラのかっぱ巻き関数
名前からはとても強く見えないが鬼のように強い
妖怪惑星Qhapaq@Qhapaq_49
私の脳内で「大丈夫、ちょっとだけ(関数の差分は1%くらい)だから」と言いながらクジラちゃんに河童巻きをぶちこんでる画が浮かんできましたが勝ち星を四回も献上してるので多分許されるでしょう。
いやいや澤田さん、くじらちゃんにかっぱ巻きぶち込むのは絵面的に完全にアウトです
>>228
>>224
やねうら4.82+qqrにしたら技巧2勝率が20局時点で95%と大幅に改善しました
くじらちゃんの探索部がqqrに向いてなかった?ようです
ありがとうございました やねうら王のtournament版は通常版よりどれくらい強い?
やっぱりクジラちゃんとやねうら王では相性がありそうか
ところでやねうら4.82は4.80よりは確実に強くなってる感じなの?
最近話題にならないけど、まふ定跡はみんな入れてないの?
藤井6段夕食休憩時 技巧2でチェックしたら後手藤井6段+900ぐらいだった
7段昇段がほぼ確実
島も丸ちゃん二十連敗くらいで相性云々しちゃ行けなかったんだね
何年か前まではソフトに手動で定跡入れてたけど、もはや必要ないかなあ
穴熊とか矢倉とか手数がかかるし、最近のソフトは囲わないし
>>244
ウォーズでも24でも自分の棋譜集めて棋譜結合して解析とかはしないの? >>245
?ソフト用の定跡が必要かどうかという話なんだが、俺が勘違いしてるのか? ▲7六歩 △3四歩 ▲6六歩の出だしでT.N.K.に読ませたら△8四歩が20億ノードくらい読ませても第3候補手までにあがらない
△6四歩 △6二銀 △6二飛とか右四間飛車にするように読んでるけど昔のソフトもそうだった?
>>244
むしろソフトの計算時間短縮のために自身で定跡を整備した方が効率的よな >>248
その定跡整備ってのが中々難しいんだよな
あまり長手数入れると勝敗に直結してしまうし
序盤の10手くらいを広く入れておいた方がこの先良いような気がしてきた >>249
そうだな、安定して10〜20手ぐらいを広く入れておきたいわ NNUE-whale5+QQRで色んなソフトと対戦させてるんですが、今のところApery,elmo,HoneyWaffleと10局ずつして5-5,5-5,4-6でHWには負け越し
どれも探索NNUE-whale5です
上位陣って差を感じるほど強さに違いがないよね
1手3秒で10番勝負の上位陣トーナメントやったらaperypaqが優勝したわ
そりゃあ10番勝負しかしてなければ当たり前だろうがw
>>252
勝率60%位までだと、10局やっても勝ち越したり互角だったり負け越したりするよ、結局勝率60%で10局程度だと、勝敗の差はじゃんけんみたいなもの >>256
いつもありがとうございます。
SSE42とスマホ用のバージョンもアップして頂けると、とても助かります。 勝率6割(+R70)が引き分け無し10局で
勝ち越す確率63.3%
負け越す確率16.6%
5-5の確率20%
>>256
こんばんは
素晴らしい探索部ありがとうございます
0.1秒で100局試したのですが、NNUE-whale +くじらとGodWhale +くじらは48-3-49でほぼ互角
NNUE-whale +QQRとやねうら4.82 +QQRはダブルスコアでNNUE-whaleの方が圧倒してたので途中で途中で切り上げました
他にもaperypaqやQhapaqなどでもNNUE-whalevsやねうらをさせたのですが全てNNUE-whaleがやねうらを圧倒してました
10ソフトで1手1秒の総当たり、各ソフトと10局ずつやらせてるところですが、もしかしたらQQRではなくQhapaqが1番強いかもしれません >>256
ありがたく使わせていただきます
少し深め(一手1000万〜1500万ノードほど)の対局ではどうなるか検証してみます >>259
本来勝ち越すべき方が途中まで圧倒的に負けているなんてことはわりとあるので少ない対局数で打ち切るべきではない
例えば途中8勝25敗だったのが200局終わったら98勝85敗17分なんてことはざら >>261
純粋に質問だけど、200局っていう数字に意味はあるのですか?
1000局指したら、400勝550敗50分とかにならないですかね。 例えば、定跡ガチャで外れを引く回数が多かったらそこでぼこぼこ負けるしな。
統計だけではなく、「どういう負け方をしてるか」は見た方が良い。
その意味で、ナイアガラパターンに着目したPALはいいとこ突いてたと思う。
>>262
200局はただの例で意味は無いよ
ちなみに有意差もないから1000局やればそうなるかもしれないね、その逆も >>263
それが大事だよね、やたら反省させられて負けてるとか色々気づくことはある 教師局面を生成する準備として、Depth8での強さを調査中
NNUE/W6 vs NNUE/YO4.82
524-52-424
NNUE/W6 vs NNUE/W3
446-62-492
>>266
そうなんだよねうちの検証でも、wシリーズ同士を対局させると、シリーズの中ではW3が最強なんだよね
でもwシリーズ以外にはバージョンアップごとに強くはなっているんだよね
結局、どれが最強かっていわれるとW3になってしまう 探索でも三すくみがあるんだな、今まで評価関数だけかと思っていた
QQR/YO4.82 vs QQR/GWasame
368-51-581
NNUE/W3 vs QQR/GWasame
497-14-489
YO.4.82が浅い読みの戦いではダメダメとは恐ろしい
深さの方を固定してるんなら、枝刈り全くしないものが最強ってことになるんじゃないか?
深さ固定で異なるエンジンを比べるのは意味無いのでは
depth8くらいになるように時間設定してるんじゃなくて深さ自体固定対局なのか、そりゃYO4.82大不利
>>261
ということでもう一度NNUE-whaleとやねうらを載せたQQRをもう100局やらせましたが66-3-31でやはりダブルスコアでNNUE-whaleが勝ち越しました昨日は何勝だったか忘れましたが、50局程で中断してその時もダブルスコアでしたのでやはりやねうらより優秀な感じでした
ほかの評価関数でもやねうらが勝ち越したところはまだ見てないです もはや正しい検証が行われてるような気がしないんだが
multi ponder測定?
技巧の方が良さそう
>>274
それはすごいな、やねさんも探索のパラメーターを大幅に見直すことになるのかなこれで >>269
これも、Depth8なんですか?
それから、GWasameもNNUE-whaleのように、くじらのパラメータでいじってるんですか? >>278
GWasameなんだから、くじらのパラメータですね。失礼しました。 >>279
GWの枝刈りを極端に緩くしたらかなり強かった的なものだったかと >>273
AVX未対応マシンで、どっちも動くことを確認したよ
あんがと NNUE-whaleの三駒版ってNNじゃないのにNNUEってネーミングなのはどうなんだろうか
このスレだけで頻出し、ググっても何なのかが全くヒットしない
「NNUE-whale」とは何なのか、バージョンが3,4,5,6とあるが何が違うのか等、解説してくれる優しい方がいらっしゃいましたら嬉しいです。
>>273
ありがとうございます
早速NW5とNW6を評価関数QQRで対局させてみたいと思います >>283
前スレのここらあたりからみると流れがわかりますよ。
741 名前:名無し名人 (ワッチョイ f5a0-fFVh)[sage] 投稿日:2018/05/13(日) 05:56:26.52 ID:5Sivxjbw0
NNUEの2018-otafuku-param.hのパラメータを
全てGodWhaleの数値にした結果 depth固定なら枝刈り少ない方が強いのは自明
後は教師局面つくる費用がどれだけ増えるかの戦い
低depthなら誤差レベルでしかコスト増えない気はするけど
aperyが学習用途で強いのはそこらへんよね
学習用エンジン・定跡作成用エンジン・戦闘用エンジンの3つが要る時代になりそう
このスレの名無しの作品
たくさんバージョンあるしこれからも増えそうなので暇人以外触らなくていいと思う
検証を待てばよい
>>286
『学習用エンジン・定跡作成用エンジン・戦闘用エンジンの3つが要る時代になりそう』
これだよなきっと >>285
ご回答ありがとうございます。
NNUEとは評価関数の形式を示す名前だと思いますが、
NNUE-whaleとはNNUEとは全く関係なく、TNKチームが利用したやねうら王の改造版エンジンを示すという認識でよろしいでしょうか? >>290
前スレ読んでその辺わからないなら正直触らないほうが良いんでは >>290
正直ネーミングのわりにNNUE大して関係ないよなとは思う >>273
とりあえず0.1秒でHW5とHW6をQQR載せて200局させたところ、91-8-101でHW6の勝ち越しでした 名人戦の検討ソフトぽんぽこ、今日も視聴者から酷評されまくりw
羽生さんの指し手とぽんぽこ予想手が違った場合、
視聴者の羽生さんへの信用度100%、ぽんぽこへの信用度0%w
この流れで合ってる?
TNKチームがリリースしたやねうら王改エンジンはAVX2利用版のバイナリしか付属されていなかった
↓
ivy-bridgeのPCを使っている人が、TNKやねうら王改のSSE4.2版使いたいがビルドするスキルが無いので誰かに用意して欲しいとねだった
↓
GodWhale5.0.5のパラメータを適用した「TNKやねうら王改」のSSE4.2版を「NNUE-whale」という意味不明の名前でアップした人が登場
↓
ネーミングセンスの無さに混乱する人が出た
>>294
ぽんぽこは名前からして馬鹿にされそうだし(実際に馬鹿にされている)、elmo_wcsc27とのキメラだしな、Apery_sdt5はキメラじゃないし、
sdt5の最強評価関数なので検討にぽんぽこ止めてAperyを採用すれば、ここまで馬鹿にされずに済んだのにな、ま電王Tの優勝ソフトを採用する決まりなのでしょうがないわな >>297
一般の視聴者はキメラとか全く知らないし気にしてるわけないだろそんなこと
一番の原因は運営が低スペックPCをぽんぽこに与えたことと検討モードの設定がガバガバなことかと >>295
なんか自分が悪い流れになってるけど
元から KPPT版にも NNUE-whale って名前が使われているのでしょうがない
名前の由来は、NNUE-whale はもともと TNK版しかなかったけど
改良した部分のコードを KPPT版にも反映したからだと思う >>297
ポナ以外のソフトは全部馬鹿にされるよ
Aperyだって一般ファンからしたら電王戦で斎藤慎太郎に負けた雑魚ソフトっていうイメージが今でも根強いから >>298
結局はAperyより弱いぽんぽこを採用したこと、低スぺPcを与えたこと、検討モードの設定が悪いことから全て運営側のレベルが低いってこと Aperyって言ってるけど探索がやねじゃなければポンポコ以下なんすけど
一般ファンにとっては、ソフトの「現在の棋力」なんてどーでもいいんだよ
公式戦でプロに勝てば強いソフト、負けたら弱いソフトになる
だから公式戦7戦全勝のポナンザは偉大なんだよ
>>303
お前の文章をそのまま理解すれば一般ファンはソフトの棋力を全く考えないアホだってこと
まともな人間は棋力つまりレーティングを重要視するわ 公式戦7戦全勝のポナンザはぽんぽこより大分弱いときのものなので何の価値もなく、まともな人間からしたら、お前を含めてアホとしか見ていない
>>304
一般ファンはソフトの棋力もレーティングも全く考えないしどーでもいいと思ってる
Aperyの現在の棋力なんて関係ない、斎藤慎太郎に負けた事実は永久に覆らないから
つまり「目に見える結果」がすべてだ >>306
だからお前をアホだっていっているじゃないか >>305
ポナンザに勝てる人間はゼロと誰もが認識してる
だが一般ファンからは、ぽんぽこは羽生さんや藤井聡太より弱いと思われてる
これで十分だ >>308
一般ファンはそんなの無関心だから意味ないよw >>310
だからお前をアホだっていっているじゃないか もしレーティングの重要性が世間に認識されてれば、WCSCや電王トーナメントがガン無視されるわけないからな
現実は真逆だけどw
一般ファンは現在の棋力を考えることも出来ないアホだってこと
>>295
NNUEのパラメータをgodwhaleと同じものに変更したものが意外と強いと有志がUP
↓
当時はAVX2版以外のビルドが失敗していた
↓
後にAVX2版以外のビルドも成功
↓
頻繁に更新されるので混乱する人が出た
NNUE-whaleの名前は「NUUE」+「GodWhaleのパラメータ」という意味だから意味不明ではない
TNKチームは関係ない >>315
KPPT版とかもNNUEネーミングなのが混乱する原因じゃない? > NNUE-whaleの名前は「NUUE」+「GodWhaleのパラメータ」という意味
NUUE?
混乱してる人は、だいたい自覚が無いわな
>>294
羽生が棋士の手を予想して当てたからと言ってその手が最善の手とは限らない
その棋士の棋風から推察される手を予想しているだけかも知れない
当然のことだが将棋エンジンの予想が最善の場合がほとんどでそれが実力差に
なって表れている 候補手が棋力の遥かに劣る人間の手と一致しないのは当然の
ことだと思う >>319
世の中信用が大事なんだよ
公式戦7戦全勝という実績を残したポナ以外のソフトは信用がない
ニコ生で「ぽんぽこに変えてAperyを出せ」なんてコメントは皆無だろ?
真偽はともかく、ポナ以外のソフトは貸し出しで研究すれば今でもプロに勝ち目はあると少しでも思われてる時点でダメなんだよw NNUE-whale5が落とせないので上げなおしてくれないか
バージョン管理のためにもgithub使ってみてはどうだろうか
>>320
少数派のポナ信者(こいつらは棋力を考えることの出来ないアホばっかり)のお前が勝手に思い込んでいるだけだ、うざいからこのスレに来るな、
ポナンザの話題なんかどうでもいいわ、過去2大会で優勝も出来なかった非公開ソフトが 名前をつける価値があるもの以外は無理に名前をつけないほうがいいと思いまーす
>>323
俺はポナ信者ではない
R4200の無名ソフトより、仮にR3500でも実際にプロに勝ったソフトの方が信用される
世間とはそういうものだw ライバルに追い抜かれぶざまに引退したポナより、はるかに強いソフトが出ているので使えもしないポナに興味ないわ
>>325
だからお前をアホだっていっているじゃないか NNUE-whaleシリーズは超短時間対局に最適化されてる感じなのかな?
>>328
実際に1500万ノードで本格的に検証したら、0.1秒の超短時間対局と差がでるのか興味がある
このスレの対局の報告では、ほとんどが超短時間対局の結果なので 105 名無し名人 (スッップ Sdfa-hd0g) 2018/05/19(土) 17:03:22.94 ID:zisz81ojd
髭面で煙草を銜えた問くんを想像してしまった
>>329
検証ってほどじゃないけどKPPT版を16スレ1秒(500~800万ノードくらい)で使ってみてるけどあんまり強くない感じ
NNUE用だしKPPT版ではあんまり強くないってだけでNNUEなら強いのかもしれないが >>299
変に非難したような書き方になってたので気分を害されたかもしれず、すみません
元からNNUEって名前だったということですが、元って何ですか? SSE4.2版あげてくれてる>>299はNNUE-whale作ってる人とは別 >>315
NNUEは検索エンジンじゃないのでGodWhaleのパラメータは適用できません
あなたがNNUEと呼んでいるのは、TNKチームがNNUE向けに用意したやねうら王改のことじゃないんですか? >>331
i7 6700k 8スレ一手3秒(おおよそ一手1500万ノードから1800万ノード)でのqqrとの対局をみると最初自分のほうがいいと思ってあとで反省するパターンがかなり多い
nnue whale6が強いのは超短時間のみな気がする
検証結果が出たらまたお伝えします ロタ様あなたのハイスぺでnnue whale6とやね4.82をqqrで検証して下さいませ
nnue評価関数に最適化されてるのにKPPTで検証しても意味なくね?
実際にnnue評価関数を積めばある程度の持ち時間でもqqrを6割ボコれるのかが一番重要だろ
>>339
超短時間でこれだけ強いと1500万ノードにも興味があるのだが
qqr_whale6 117-5-78 qqr_Y4.82_AVX2 勝率60% 一手0.1秒 (16万ノード) 定跡なし GWasameもNNUE-whaleもYO4.82を使ってる相手に対して勝ち越すはずの評価関数で負け越す感じだわ
本来勝率53~55%くらいあるはずの条件でも勝ち越せない、QQR相手に60%とかいったら面白かったのになー
結局ある程度ノード数がある場合はwhale6-KPPTは弱いってことかな
最初にNNUE-whaleの意味について質問した者です。
皆さんの回答や、前スレの流れを読んだりで大体真相が把握できました。
皆さんご回答ありがとうございました。
混乱の原因を整理しました。
・NNUE関数を使えるように改造したやねうら王に那須氏が「NNUE-v1.0」と名付けたこと
・KPPT最強のQzilla9とNNUE関数を対決させるために「NNUE-v1.0」をGodWhaleと同じパラメータでビルドした「NNUE-whale」エンジンを5ch有志がリリースしたこと
・同有志は、NNUE-whaleは他のKPPT評価関数の強さ比較にも用いたいため、KPPT版をリリースしたこと
・NNUE-whaleは、なぜか最近の流れでは、KPPT版がQQRやApery等の対戦比較にばかり用いられていること
「非現実的な短時間でしか計測して無いこと」も追加で。
leela chessのフォーラムではfacebookがelf opengoの際にalphazeroの再現にチャレンジして失敗したのではって言われてるね。
alphazero自体もかなり疑わしい。
対局数少ないけど、一手500~800万ノード、対YO4.82+QQRの簡易測定結果
エンジンYO4.82
54-3-43(勝率約54%)
エンジンwhale6-KPPT
37-8-55(勝率約40%)
評価関数はどちらも今作成中のやつ
とりあえずKPPT版はノード数少ないときじゃないと力を発揮しないみたい
最近の書き込みで「whale」って記載されているエンジンはNNUE-whaleの略なんですよね?
>>350
文脈からしてそうとしか言いようが有りませんね。
KPPT版のNNUE-whaleは、KPPT-TNKって名前を付けておけば混乱が無かったと思うんです。 最近floodgateで勝ちまくっているhavenの正体に興味がわいてきた
>>348
chessのフォーラムでなぜfacebookの碁の話が? >>353
ここでも色んな話してるし
コンピュータボードゲームの話は話題に上がるでしょ >>354
つまり5chの話題レベルでしかないってことか
alphashogiならともかく囲碁でまだGoogleを疑ってるのはね >>355
AlphaZeroって囲碁だけじゃなく将棋、チェスも指すぞ >>356
いや実績が全然違うじゃん
alphazeroの自己対戦の棋譜である程度担保されてる alphazeroのshogiは棋譜がそもそも出されていない 技巧は探索ノード100のオーダーからきっちり強さが上がっていくが
YaneuraOuエンジンは10万ノード程度ではぜんぜん不足
スイートスポットはもっと高いところからはじまる
>>357
もう一度最初のレスを何回か読み直してきた方がいい
誰も囲碁の実績を疑ってはいない >>359
>348ではelf opengoがalpha zeroの再現に失敗したらしいのを受けてalpha zero自体も疑わしいと言ってるんだから、囲碁のalphazeroを怪しんでるのでは? 強さを疑うわけじゃないけど棋譜出すのが難しい理由があるの?
>>361
棋譜のフォーマットが色々あるからどれで出すか悩んでるらしい お前ら「R4200超えのソフトスゲー!」
一般ファンA「そんな信憑性ゼロの戯言など信用できるかw どうせポナンザより弱いんでしょ?」
一般ファンB「羽生さんや藤井聡太ならそのソフトより良い手が指せるわw 無料でも要らないよ」
Google「AlphaZeroが僅か数時間でelmoを超えました 棋譜は出さないけどね」
一般ファンA「やっぱグーグルはスゲー! 棋譜がなくても絶対信じるよー」
一般ファンB「所詮日本の開発者の技術力なんてその程度だわなw」
棋譜はsfenでいいだろ
cfenの将棋版
stockfishの作者が提唱したんだから知らないわけないだろう
いや、facebookが汎用AIのアピールのためelf opengoを開発する際に、alpha zeroの再現にもチャレンジしたのではないか
そして、あの発表に出てこないってことは囲碁しか再現できずチェスなどはstockfish開発版より強いそれを再現できなかったのではという向こうの議論
囲碁については異論はない
検討用に将棋のソフト入れたいんだけどオススメのソフトとGUIって何?
書き忘れたけど環境はcore-i7 8550Uの16GでSSDは512Gある
普段からfloodgateでR4300レベルの将棋を見ているものとしては、羽生善治や藤井聡太ていうソフト換算でR2800程度の棋譜は、ほんとボナンザ6.0程度の棋力で見れたもんじゃないな、ソフトでは絶対指さないような平気で悪手を指すしな
>>366
メモリが16GBも有るのなら、わざわざNNUEのTNKや技巧2を選択する必要はなく、現在最も強いやねうら王とQQRを使うのが良いのではないでしょうか。
GUIについては、好みで選んでください。
将棋所
長所:動作がサクサクしている
短所:UXでShogiGUIに劣る
ShogiGUI
長所:見た目のわかりやすい。操作がしやすさい。
短所:動作がきびきびしていない
WhaleWatcher
長所:エフェクトがカッコいい。萌え萌えしている。
短所:画面の情報量が少なく、ShogiGUI以上に動作がきびきびしていない >>366
導入の簡単さと言うなら、1位は激指定跡道場4ですが有料な上、弱いです。
次に簡単というなら、ShogiGUI+TNKでしょうか。
TNKはエンジンと関数がセット配布になっており、インストールの手間が少ない上、ダウンロードサイズが24MBしかないのであっと言う間にダウンロードが終わるというのが有りがたい。 所詮プロ棋士の将棋は最新ソフトから見たら、アマ7級程度のお遊びじゃよ
Google 「AlphaZeroの棋力が僅か数時間でelmoを超えました 棋譜は出さないけどね」
一般ファンA 「やっぱグーグルはスゲー! 棋譜がなくても絶対信じるよー」
一般ファンB 「所詮日本の開発者の技術力なんてその程度だわなw」
お前ら 「R4200超えのソフトスゲー!」
一般ファンA 「そんな信憑性ゼロの戯言など信用できるかw どうせポナンザより弱いんでしょ?」
一般ファンB 「羽生さんや藤井聡太ならそのソフトより良い手が指せるわw 無料でも要らねえよ」
普段からfloodgateでR4300レベルの将棋を見ているものとしては、羽生善治や藤井聡太ていうソフト換算でR2800程度の棋譜は、ほんとボナンザ6.0程度の棋力で見れたもんじゃないな、ソフトでは絶対指さないような悪手を平気で指すしな
所詮プロ棋士の将棋は最新ソフトから見たら、アマ7級程度のお遊びじゃよ
最新ソフト「最善手はこれ!」
アマ7級「違う手ビシッ!」
最新ソフト「(長考後)・・・それ最善やな」
こういうことがしばしばあるんだが
プロ貶すと逆にソフト貶してることになるぞ
>>366
Core i7 8550uということは200万〜250万npsくらいのでしょうか。
R4200の実力のクジラちゃんを動かした場合、R4000程度の能力で動作すると思います。 >>374
見れたものじゃないというのは、お手元にあるR4200程度のソフトの評価値を観察しながらですか?
それともあなたの目だけを頼りにですか?
あなたの目だけという回答なら、なぜプロキシにならなかったのですか?という質問が間違いなく寄せられるはずですが。 将棋所はなんか見かけがWindowsフォームアプリに見えて今更感
やねさんが使い勝手もよくデザインも洗練されている
いままでの将棋GUIが全て過去のものとなるような素晴らしい商用将棋ソフトを作ってるから期待して待ってるといいよ
ボナンザ6.0=プロ棋士は、最新ソフトの足元にも及ばない
>>381
NPSがいくつくらい出ていれば、
最新ソフト「(長考後)・・・それ最善やな」
を避けられるのでしょうか? >>382
NPSというか検討時に一手あたりどのくらいのノード数探索させるか
かなり難しそうな局面なら最低でも10億以上は読ませたいところ
例えばNPS100万くらいしか出なければ結構時間かかるね 選手権の本番ではこの戦型で先手が1敗1分だったよね
データだけでは勝ち切ることは難しい.FGのデータはいろいろ偏っているからね
西尾明@nishio1979
横歩取り青野流のこの局面、2018年初頭から昨日までのfloodgateデータベースだと先手が522勝102敗で驚異の勝率83.7%となっています。
ただ、ソフトが搭載している定跡が偏っている面もあり(△2六歩は1局しかない)、現在は人間+コンピュータで色々と模索している状況と言えるかもしれません。
https://twitter.com/nishio1979/status/997838682542424065 現状は、
探索速度
ソフト>>>>>人間
局面評価
人間>>>>ソフト
トータル
ソフト>人間
という感じ
ノード数が足りないって言っても、そりゃノード数に上限がなければ強いのは当たり前
>>381
10万円程度のノートパソコンで3Mnps
20万円程度のハイエンドデスクトップパソコンで7Mnps
50万円程度のハイエンドワークステーションで15Mnps
GCEやAWSのハイエンドクラウドで50Mnps
クジラコミュニティで3Gnps
どこが必要十分な性能の分水嶺なのでしょうか? 所詮プロ棋士の将棋は最新ソフトから見たら、アマ7級程度のお遊びじゃよ
後手の持駒:桂
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・ ・v玉 ・v香|一
| ・v飛 ・ ・ ・v角v金v歩 ・|二
| ・ ・v桂v歩 ・v金 ・ ・v歩|三
| ・ ・v歩 ・v歩v銀 歩 歩 ・|四
|v銀 ・ ・ ・ ・ 歩 ・ 銀 ・|五
|v歩 歩 歩 歩 歩 ・ ・ ・ 歩|六
| ・ ・ 銀 ・ 金 ・ 飛 ・ ・|七
| 歩 玉 金 角 ・vと ・ ・ ・|八
| 香 桂 ・ ・ ・ ・ ・ ・ 香|九
+---------------------------+
先手の持駒:桂 歩二
後手番
この局面とかどのくらい読ませれば正しく評価できるんだろうか?
>>385
お前はアホか、局面評価も最新ソフトの方が圧倒的にすぐれているわ ボナンザ6.0程度の棋力しかないプロ棋士が最新ソフトより優れている部分などあるわけなかろうが
分かりにくかったか
ノード数が同じ前提なら、局面評価は人間が圧倒的に上
言ってしまえば数の暴力。そもそもソフトとはそういうもの
>>385
プロ棋士でトップ20に入る実力の千田六段がノータイム指しのコンピュータに既に勝てなくなっているので、局面評価もソフトの方が人間を上回っているのは間違いないと思います。
ただ、探索速度の優位程の開きはないため、局面によっては人間側の方が正しい判断をすることも有るとは思います。 >>391
それは人間に有利にしたい側の情けない発想でしかないわ、そもそもソフトと人間を同じノード数にする必要などない なんとかしてソフトより人間の方が優れているといいたいアホがおるな
ID:W59ohio10が語るコンピュータの地強く評価は間違っていないと思う。
でも、人を馬鹿にした口調と根拠も示さない書きなぐりのせいで荒らし厨と同程度の扱いしか受けない。
R2500以上同士の対局の指し手の良し悪しなんて自分では判断できないはずなのに、さも出来るかのような書き方は不興しか買わない。
>>388
結局深さ次第だよね、今のソフトはその性質上、細く深くっていうのが苦手だから
中盤の30手後に逆転しますみたいな特殊なシチュがつらい
ただ、この辺もハードウェアでゴリ押せばどうにかなるんだよね 千田六段はは本当にノータイム指しに勝てないのだろうか?
自分はdepthを調節したコンピューターとやるときは相手の速指に手拍子したり
何度でもやり直しできるから真剣になりきれず、+2000くらいになっても簡単に負ける
かつての電王戦みたいな真剣にやれる環境ならさすがにノータイムには簡単に負けないのでは?
という気もする
uuunuuunさんのところを参考にすればGikou2深さ12ですでに激指14より強い。
そして書籍やインタビューの情報をみるに激指14に勝ち越せる人間はいない
従来の三駒だと評価値がバタバタと荒ぶるとほぼ負けだが
勝っちゃうことがあるnnたぬきはなかなか新鮮だわ
長めの時間はKPPT版の検証しかされていないから
もう1手1秒に設定して自分で検証した
ギリギリ有意差がありそうな範囲まで
俺が言いたいのは純粋な評価関数の精度ではT.N.K.が今大会ぶっちぎりに最強だったってこと
その比較用に探索部を統一してT.N.K.と三駒を対戦させられるように
(強化ではなく単なる調整である事が分かりやすくなる手助け)
KPPT版もビルドしたのに
何故か評価関数固定でのエンジンの比較がスタートしただけで全く意味がなかった
検証をして欲しいのは本来の実力を発揮したT.N.K.の強さの方だから!!
更新はもうないので、最後にNNUE評価関数スターターキットとして
評価関数とエンジンを同梱してアップロード(中身はバージョン6のまま)
多分本家やねうら王の次の更新辺りでブチ抜かれるだろうけど
NNUE評価関数の本来の実力を少し早めに体験したい人は是非使ってみてくれ
斧 https://www.axfc.net/u/3912219
bitsend https://1.bitsend.jp/download/a721f09b1dc9a8aebf5997408860b2e2.html 今後の更新ないのは
あの後で約40パターン合計1万局以上を比較検証したけど
200局でも有意差が出るほど強くなる調整箇所がもう見つからなかったのが理由
今回はガチのマジで限界なので今後の更新はないです
>>400
すばらしい! 今回のプログラム提供にあらためて感謝します。 結局、今のソフトの強さは枝刈りと引き換えに得たものなので、
大駒を含めた捨て駒の連続+長手数で成立する筋とかは見落としやすい。
もし、貸し出しありの条件で、人間が最新ソフトに勝つ可能性を求めるなら、
・序盤から一気に終盤になる
・変化の余地のない一本道になりやすい
・大駒を切る(枝刈りされやすい)派手な筋が成立しやすい
の3点から、横歩一択だろうな。
>>403
読んでて思ったんだが、
マルチスレッドで動かしてるんだから、枝刈りするものと枝刈りしないもので合議は出来ないもんなのかな。
詰みルーチンも1スレッドあれば十分だろうから、枝刈りをしないルーチンも1スレッドぐらい入れておけばいいんじゃないかな。 >>404
その計算資源をNPS増やすのに使ったのと大差無い結果になりそうな気がするよ >>400
> 俺が言いたいのは純粋な評価関数の精度ではT.N.K.が今大会ぶっちぎりに最強だったってこと
> その比較用に探索部を統一してT.N.K.と三駒を対戦させられるように
> (強化ではなく単なる調整である事が分かりやすくなる手助け)
> KPPT版もビルドした
上記目的なら、TNK_W-NNUEとTNK_W-KPPTという名称でリリースして欲しかったです
名前のせいで混乱が生じてました 対YO4.82+QQRの簡易測定結果続き16スレ1秒(一手500~800万ノード)
エンジンYO4.82
54-3-43(勝率約54%)
エンジンKPPT-whale6
37-8-55(勝率約40%)
エンジンGW
59-6-35(勝率約62%)
ここまでは作成中の評価関数使用
さらにエンジンに調整を入れたT.N.K.がこの結果を圧倒的に上回ることを期待して次を測定
エンジンNNUE-whale6+評価関数NNUE
36-11-53(勝率約40%)
NNUE-whale6の力を使ってもYO4.82+QQRにT.N.K.が勝ち越すことはなさそうな気配で残念
対局数少ないけどなんだかんだGW+三駒はだいぶ強い印象
これ以上を目指すならQQRに6割以上勝つ三駒評価関数から教師作ってNNUE学習させるのが近道感あるかな
局面単位の評価の正確さは人間>3駒なんだろうが、学習の深さと時間が十分であれば3駒が上回る
可能性も否定できない?
depthがある程度深くなるとDLも3駒も大差なくなるのかね
>>409
100局でも3つに関しては有意差出てるからね、強そうか弱そうかはなんとなくわかるのよ 数の暴力という点は性質上仕方ないだろ
それにソフト側は1秒の思考と言ってもスペックに依るわな
人間からしたらソフトの局面評価はまだまだ、
ソフトからしたら人間の探索速度は圧倒的に下
それぞれ長所があるということはずっと言われて来ていることなのに
>>400
斧ではダウンロードできなかったのでありがとうございます
最強の組合せですね
自分は対局バトルできる環境にないので検討用に試してみました
ソフトに期待していた望み通りの結果が得られました
これまでになかった最高のパフォーマンスです
エンジンの改良も素晴らしかったです
T.N.Kの評価関数が優れものであったことも確認できました
ノートPCでの比較なので低スペックでのパフォーマンスがよいだけなのかも知れませんが、先にQQRで試していたので実感で比較すると、
YO4.82+QQR<NNUE-whale6+QQR<<NNUE-whale6+T.N.K
となります ソフトの局面評価が人間以下なら人間が絶対に悪型だと思ってた良型をソフトが発見するわけないだろうが
ソフトの局面評価のほうが9割9分の場合ではるかに正確
最近は序盤はいかにソフトを使って事前に研究できるかどうか
中終盤は生まれ持っての才能や従来の勉強方法が大事
局面評価ってこの場合探索なしでの評価ってことでしょ。
局面評価自体は人間のほうが上でも探索することではるかに上回るという話で
ソフトの局面評価は人間より、はるかに上だろうが、逆にことを言ってるアホがおるな
プロ棋士でも日々のソフトの研究なしでは生き残れない世界にまでソフトは進化した
ま、昔の玉を完全に固く囲ってから開戦してた将棋からバランス重視に変貌したのと、矢倉や穴熊が大分減少したり、雁木が当たり前のように指されているのもソフトの影響だしな
どう見ても局面評価もソフトが上だろうが
いつまでも古い価値観にこだわってる人や、ソフトを頑なに否定する人はそれはそれでほっとけばいい
そういう人は活躍できなくなるだけ
アマでもかつて全国制覇した人全国の予選で敗退したり、そのかわり急にパッと頭角を現してきた人もいる
どう考えてもソフトの影響
どう読み取ったら否定しているように見えるのか・・・・
1人2人はだいたい分かってるようだけども
昔このスレで話題になった将棋世界の創作次の一手の超難問(をちょっと変えた図)
正解は▲1二金の詰めろ逃れの詰めろだけど指せるようになった?
後手の持駒:歩
9 8 7 6 5 4 3 2 1
+---------------------------+
| ・ 金 ・ ・ ・ ・ ・ ・v香|一
|v玉 ・ ・ と ・ ・ ・ 金 ・|二
|v香 ・v桂 銀 龍 と ・ ・ 桂|三
|v歩v歩 ・ 桂 ・ ・ 歩 ・ ・|四
| 歩 歩 ・ ・v歩 ・v飛 ・ ・|五
| ・ 香 銀 ・v金 ・ ・ ・ ・|六
| ・ ・ 銀vと ・ ・ ・ ・ ・|七
| 香 ・ ・v歩 ・ 銀 ・ ・ 金|八
|v角 桂 玉 ・ ・v馬 ・ ・ ・|九
+---------------------------+
先手の持駒:歩七
べつにソフトの影響を否定してるんじゃないんだけど・・・
局面評価の話ってなんかの開発者もコメントしてたと思うがな。
3駒は粗い評価で早く、DLは正確な評価で遅い
一手のまちがいで勝ち負け交錯するクリティカルな局面ではDLでも正確とはいかない
探索なしのDL将棋では序盤から中盤にうつるときにぶっこける
>>421
改変ほんとにあってる?何か間違ってね? >>425 原図はこれ.詰みに関係ない歩を持ち駒にしてより難問にしたつもり
後手の持駒:歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
| ・ 金 ・ ・ ・ ・ ・ ・v香|一
|v玉 ・ ・ と ・ ・v歩 金 ・|二
|v香 ・v桂 銀 龍 と ・v歩 桂|三
|v歩v歩 ・ 桂 ・ ・ 歩 ・ 歩|四
| 歩 歩 ・ ・v歩 ・v飛 歩 ・|五
| ・ 香 銀 ・v金 歩 ・ ・ ・|六
| ・ ・ 銀vと ・ ・ ・ ・ ・|七
| 香 ・ ・v歩 ・ 銀 ・ ・ 金|八
|v角 桂 玉 ・ ・v馬 ・ ・ ・|九
+---------------------------+
先手の持駒:歩 >>421
スレ違いだろうが、詰将棋専門のスレでやれ まず先手玉が詰めろってことを認識するのが通常探索ではかなり難しいかも.
無駄合を入れるとかなりの長手数の詰みだから
>>421>>426
あー、なる
歩の合駒の機会を増やして超手数にしたのね >>421
原題は知らないがどのソフトでも簡単に正解しましたよ
なかでもwhale6+T.N.Kがピカ一
ノートPCで検討
技巧2は探索深度21手で互角ながらブラス評価に
4.79+yaselmoは22手で互角ながらブラス評価に、23手で先手優勢に
どちらも2分以上消費
4.82+aperypaqは最善手にはなるが、3分以上、23手でもプラス評価にならない
4.82+QQRは40秒、21手でプラス評価に、2分以内に22手で先手優勢評価になる
whale6+QQRは1分以上22手で先手優勢評価
whale6+T.N.Kは数秒20手でプラス評価
10秒21手で先手優勢評価
1分22手で先手勝勢評価 >>431
読み筋は▲1二金になってる?▲7二と なら先手玉が詰んでしまうから間違いっていう問題なんだけど >>432
ちょっとしつこいよ、一瞬で12金になるって その問題は手数自体は長いが変化が少ないのでソフトの実力を測るには向いてないと思う
金駒6枚桂2枚ぐらいの持ち駒で
候補手を進めた上でなのは詰1分回しても詰みか不詰みすらわからない局面が望ましい
うちのNNUE-Whale6じゃ2Gノード超えても駄目だったぞ
もうあてにならん検証するよりフラゲにでも流して測ってくれよ
ていうか浅く深く読むのってソフトが苦手な分野だから当たり前といえば当たり前の話なんだよ
>>426,432
改題のほうが12金を見つけるのが早いよ
72との詰めろは一瞬で30000点越えで後手勝勢とでます
原題のはうは探索深度21手以内で正解したのはwhale6+T.N.Kだけ
2分22手で先手勝勢になった
ともあれ、whale6+T.N.Kがピカ一だろうね >>439
当時のスレに60億ノードってあるからかなり枝仮りの精度も上がったんですね.
長手数の詰みの変化でも変化少ない一直線ならかなり深く読めるようになったってことでしょうか.
857:名無し名人:2015/06/19(金) 09:15:50.98 ID:gHPnbk4S.net
ponaxはノード数60億で初めて▲1二金と出ますが、それまでは7四歩、7四銀、7二銀
を読んでました。他のソフトも長時間読ませれば▲1二金と出るのかもしれませんね >>440
先手勝勢とかは出てくるけどそれは12金じゃなくて他の読み筋だし
何か特殊な設定をしてるか勘違いしてるんじゃねぇかと俺は思ってる
大体、金が絡む変化が起きるのって46手目以降だし深さ22で正解が出るわけがない とはいえ、こんな異常な局面なんて実戦に出てこないんだから無視して良いと俺は思うけどね
>>441
騙されたと思ってNNUE-whale3で読んでみ >>441
最善手ということなら探索19手で▲12金になるよ
21手で▲12金なら先手勝勢
それ以外の手は後手勝勢です
御自身で最新ソフトで検討してみればわかる話ですよ 今後の更新ないのは
あの後で約40パターン合計1万局以上を比較検証したけど
200局でも有意差が出るほど強くなる調整箇所がもう見つからなかったのが理由
今回はガチのマジで限界なので今後の更新はないです
>>445
ソフト同士の強さに最適化?してるだけ?
検討モードで貴方の改良ソフトは有用なの? >>444
深さ19じゃ▲1二金は候補10ですら。かけらもひっかからないな
ついでに深さ21
>>449
候補手1で出てこなかったから増やしたんだぞ >>451
そうなんか
うちではすぐ見つかったけどな >>449
ほらよ候補手3深さ21
そもそも深さ固定なんだから候補手の数、関係無くない?
>>452
何か設定が違うんかもしれんなぁ
どれぐらいのノードかSSあったら見てみたい 何度か試してみたら同じエンジンでもdepth19で気づくときとdepth21でも気づかないときがあるみたいだな
LazySMPとかもあるしこれだけ複雑だと毎回同じくらいのノード数ってわけにはいかないらしい
いい感じに気づくときはこんな感じか >>456
それ4手目△4八馬になってるけど△5八馬(以下▲7九玉△3九飛▲同銀△5七馬)が正しい手順じゃないか? >>448
そもそも▲72とでは後手勝勢というのは技巧2でも瞬時にわかるよ
▲72とで先手優勢の評価値が出るのはあり得ない
あなたのソフトは正しく機能していませんね >>457
正しい手順イマイチわからんけど短時間だとこんな感じっぽいね >>460
読み筋を見る限り、後手が間違えた局面を読んで優勢と判断してるみたいだね あ、違う俺が悪かった。詰めろじゃないんだからそりゃあ違う手さすよな。うん
このスレも詰将棋解答ちゃんねるになってしまったな
だれか、詰将棋解答禁止コンピュータ将棋ちゃんねるを作ってくれ
検討結果
スペックはノートPC
エンジン:NNUE-whale6
評価関数:T.N.K
* 候補1 時間 02:51.5 深さ 22/37 ノード数 205846320 評価値 1002
読み筋 ▲1二金(22) △6九歩成(68) ▲同 玉(79) △5八と(67) ▲7八玉(69) △4八馬(49) ▲8七玉(78) △3九飛成(35) ▲8二金(81) △同 玉(92) ▲7二と(62) △9二玉(82) ▲8二と(72)
△同 玉(92) ▲5二龍(53) △9一玉(82) ▲4一龍(52) △9二玉(91) ▲3二龍(41) △4二歩打 ▲同 龍(32) △6二歩打 ▲同 龍(42) △8二銀打 ▲同 龍(62) △同 玉(92) ▲7二桂成(64) △9二玉(82) ▲8三銀打
* 候補2 時間 02:51.5 深さ 22/43 ノード数 205846320 評価値 -5214
読み筋 ▲3七銀(48) △7七と(67) ▲8二金(81) △同 玉(92) ▲7二と(62) △9二玉(82) ▲8二と(72) △同 玉(92)
* 候補3 時間 02:51.5 深さ 22/45 ノード数 205846320 評価値 -5730
読み筋 ▲4五歩(46) △1三香(11) ▲7八歩打 △6九歩成(68) ▲同 玉(79) △4八馬(49) ▲8二金(81) △同 玉(92) ▲7二と(62) △9二玉(82) ▲8二と(72) △同 玉(92) ▲7二銀成(63)
△9二玉(82) ▲8二成銀(72) △同 玉(92) ▲5二龍(53) △8三玉(82) ▲8四歩(85) △7四玉(83) ▲8五銀(76) △同 桂(73)
1手2秒 6スレッド [i7-8700k] 計200局
NNUE-WHALE3 対 QQR(YO4.82)
92-4-104
95% 信頼区間 [0.4030612244897959, 0.5408163265306123]
NNUE-WHALE5 対 QQR(YO4.82)
75-8-117
95% 信頼区間 [0.3229166666666667, 0.4583333333333333]
NNUE-Whale6は今同じ設定でQQRと対戦させてるけど
NNUE-Whale6から見て100戦の段階で勝率38%
詰将棋など全く興味ないんだが、ほんまスレチのアホが急に増えたな
詰将棋の解答自体は意味が無いけどソフトが読めるかどうかは意味があるだよ
強さ談義がしたいだけならfloodgateとかuuunみてりゃ良いだけだしな
うちで1二金が見つからなかったのはハッシュサイズが小さかったのが原因
16GB(本当はもう少し少なくできるのかもしれないが)使うようにしてみたら見つかったわ
>>466
うちも16スレ1秒で色々やってみたけど勝率40%前後に落ち着くかなって感じだった >>464
詰む実戦例も検討素材として重要だよ
実際の対局で詰みに気付くかどうかは詰将棋を解くのとは別問題
なので「詰み専用ソフトで解けばいい」というほうがスレチでしょ 60手以上の自玉の詰めろを防いで、かつ相手玉に約60手以上の詰めろをかける手を
それよりかなり浅い探索で見つけてしまうってのはどういうメカニズムなんでしょうか?
検討素材として別例も
後手の持駒:角 銀 歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂v銀 ・ ・ ・ ・v桂v香|一
| ・v玉v香 ・ 龍 ・ ・v金 ・|二
|v歩v歩v歩 ・ とv歩 ・ ・v歩|三
| ・ ・ ・v歩 ・ ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ 桂 歩 ・ ・|五
| ・ ・ 歩 ・v歩 銀 ・ ・ ・|六
| 歩 歩 ・ 歩 ・ 歩 ・ ・ 歩|七
|v飛 銀 玉 ・ ・ ・ ・ ・ ・|八
|v馬 桂 金 金 ・ 金 ・ ・ 香|九
+---------------------------+
先手の持駒:歩
後手番
whale6+T.N.Kが、一番早い探索手数で、95角で後手優勢の手順を見つけ出している
NNUE-whale3は6より強い感じなんですか?
sse42版ダウンロード出来るならしたいです
>>471
劣等局面(優等局面)という評価方法を採用しているからでしょうね
局面が同一で持駒が減っているだけの違いなら劣等局面
反対に持駒が増えているなら優等局面 >>474
NNUEってそういう感じの評価なの?
halfKP(自玉と他駒の関係)でってのは見たけど >>474
なるほど.柿木将棋の無駄合排除のアルゴリズムみたいのがやねうら王に実装されたのかな? 深さ以上の読みを出すときは王手延長のせいだって聞いたけどな
王手が続いてるときは要注意だってことで重点的に深めに読むやつ
>>475
NNUEがじゃなくてたぶん最近のエンジンは全部同じ仕様じゃないかな
劣等局面なら即座に枝切りできるから >>478
ああエンジンのほうの話か、NNUEについてイマイチわかってないからちょっと聞いてみたかった
今の探索ってαβの延長だっけどれも 有名になった実戦での29手詰
whale6+T.N.Kは候補手1の設定で瞬時に詰みを読んだ
こんなの始めて
これまでの対局用ソフトはお手上げだったのに
後手の持駒:角 金 銀 歩
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・ ・ ・ ・ 杏|一
| ・v玉v金 ・ ・ ・ ・ ・ ・|二
| ・v銀v桂 馬 ・v歩 とv歩 ・|三
|v歩v歩v歩v歩v歩 ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ ・ ・ 歩 ・|五
| 歩 歩 歩 歩 ・ ・ ・v龍 ・|六
| ・ 銀 桂 ・ ・ 玉 ・ ・ ・|七
| ・ ・ ・ ・ 歩 ・ ・ ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ ・|九
+---------------------------+
先手の持駒:飛 金二 銀 桂二 香 歩三
先手番
技術的なフィードバックがあるならともかく
あの手を読んだ読まなかったとかどうでもいい
>>480
いい加減止めろ、いつまで続けるつもりだ まぁさすがに知見が無いのは俺もどうでも良いとは思う
>>464
もう他にあんまりコンピュータ将棋のネタも無いからな。
もうコンピュータ将棋も終焉の日が近いわ ここはコンピュータ将棋に関して広く扱うスレッドだから
どんどん続けていいぞ、俺は興味がある。
まあ少なくともスレチではないわな
あんまり続けられると鬱陶しいが
まあ金になるならこういうのでもいいのかもね
もちろん高かったら手を出さないけど
ARM版のnpsいじればもうちっとましになる
需要があるなら差分を用意してもよいが
囲碁だとDeepZenGoがネット碁で公開しているから
若手プロががんがん公開で勝負している
若手の碁は年寄りには全然理解できないと治勲が言っていた
もちろん悪手ではないから碁の可能性を広げてくれたと
碁棋士はソフトを完全にリスペクトしているけど将棋は未だにモヤモヤ状態だな
これ誰か詳細わかる?
なぜかQさんが絡まれた
>>492
差分詳しく!!
めっちゃ需要あります!! 本家本元の方がNEON命令のコードを書いてくれたのか。
>>495
そのせいですね
やはり検討用には最適ですね 本家がNEON対応するのなら控えるか
通常のnnueは特に詰みルーチンとかエンジンは動かしてないと思うぞ
それでもMATEは従来の三駒評価より数手早めに出ることも確かにあるようだ
>>501
>出ることも確かにあるようだ
いやぁその程度の差ではなく
どの例でも段違いに早い >>503
スマホ用までありがとうございます
色々使ってみてなんとなくだけど個人的にはwhale3がバランスいいのかなって感じたかな
今のNNUE評価関数はAperyから50億教師だったはずだから評価関数のほうが進化すれば化けそう
まあ学習がなかなか収束しないのとハイパーパラメーターガチャで結構大変らしいけども
それでも既に検討ではNNUEwhaleシリーズが有用なようなのでありがたく使わせてもらってる やねうら王は将棋界にかかわらないで欲しいですね
詐欺師としか思えませんので
>>506
偽善であれ形にできる人間はすごいと思うよ
その対価だってあっても問題ない ビッグマウス過ぎるだけで能力自体はクソ高いから詐欺師ではないだろ
>>503
NNUE-whale3のsse42版を使いたいですが、どこでインストールできますか? QQR+YO4.82対してorくじら9+GW5.0.5に対してどれくらい勝てるソフトなら公開されてほしいと思う?
有意差出てるなら50.1%でも
棋風が違うなら40%でも
やねさんは、ビッグマウスだが、能力もクソ高くて、
もしかしてそのビッグマウス、全部真実じゃないかと
思わせるのがすごく上手い
>>513
同じくらいの強さでも、NNUE評価関数でサイズが小さくて軽ければ、大歓迎!!! >>503
NNUE-whale のスマホ版、待ちに待っていました!
ありがたく使わせていただきます! >>480
その場合は正解がワリと有力候補なので
候補数1でサクサク深く読めてすぐ詰みまで行ける。
しかし候補数2以上で検討すると他の候補が深さ進行の足を引っ張る。
また正解が低位候補の場合、候補数1では正解が枝刈りされてしまう。
例えば実戦例だとこの25手詰め
後手の持駒:金 銀 歩四
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂 ・ ・ ・ ・ ・ ・v香|一
| ・v飛 ・ 龍 ・ ・ ・ ・ ・|二
|v玉v歩v歩v歩v歩 ・v角 ・v歩|三
|v歩 ・ ・ ・v馬 ・ ・ ・ ・|四
| ・ ・ 銀 ・ ・ ・v歩 ・ ・|五
| 歩 ・v桂 ・ ・ ・ ・ ・ ・|六
| ・ 歩 桂 歩 歩vと ・ ・ 歩|七
| ・ ・ 玉 金 ・ ・ 金 ・ ・|八
| 香 ・ 銀 ・ 金 ・ ・ ・ 香|九
+---------------------------+
先手の持駒:銀 桂 歩
あちらを立てればこちらが立たず 48先生調べ
対局数300 先手勝ち173(61%) 後手勝ち109(38%) 引き分け18
Boo13
勝ち149(52%) 先手勝ち91(64%) 後手勝ち58(41%)
GodwhaleChild-5.0.5 KPPT 4.80 64AVX2 TOURNAMENT
勝ち133(47%) 先手勝ち82(58%) 後手勝ち51(35%)
対局数300 先手勝ち155(58%) 後手勝ち111(41%) 引き分け34
shot_gun 0.32 ←(定跡入りPonder無し仕様のやつ)
勝ち176(66%) 先手勝ち100(74%) 後手勝ち76(58%)
Apery_WCSC28
勝ち90(33%) 先手勝ち55(41%) 後手勝ち35(25%)
対局数201 先手勝ち108(55%) 後手勝ち86(44%) 引き分け7
Boo13
勝ち70(36%) 先手勝ち41(41%) 後手勝ち29(30%)
QQR
勝ち124(63%) 先手勝ち67(69%) 後手勝ち57(58%)
勝敗 Boo13 58 Qhapaq_wcsc28 88 レート差 62
先手勝 Boo13 : 32 Qhapaq_wcsc28 : 48
後手勝 Boo13 : 26 Qhapaq_wcsc28 : 40
千日手 15 持将棋 7 平均手数 140 対局数 168
対局数300 先手勝ち114(41%) 後手勝ち162(58%) 引き分け24
Boo13
勝ち160(57%) 先手勝ち67(49%) 後手勝ち93(66%)
elmo_wcsc28
勝ち116(42%) 先手勝ち47(33%) 後手勝ち69(50%)
http://bleu48.hatenablog.com/entry/2018/05/21/104550 候補手1 では読めない例があるのは、承知してますよ
その場合でも他よりwhaleエンジン+T.N.Kのほうが優れていることには変わらないですよ
また、この実戦例の場合はwhaleエンジン+T.N.Kなら候補手1でも探索25/26で25手詰みを見つけてくれますね
低スペックでも1分、ハイスペックなら瞬時ですね
T.N.Kに限らず今ひとつ足りないのは
詰みは読めても詰む手前での最善手を選択できないところかな
とくに候補手1にしていると「詰めろ」になる最善手を見逃すことがあるね
実戦では角が手に入れば詰むとか、あと1歩さえあれば詰むとか、
長手数になるがこの手は詰めろなので一手勝ちとか
こうした発想は人間ならばこそ
そうした欠陥を一手に億単位ノード読ませることでカバーしているわけだけど
そういう発想自体はソフトにもあると思うけどな。
ただ長手数の場合はそれだけ局面履歴を増やさないと学習できないという理屈で
結局計算資源の問題でDLも3駒も学習のコスト単位で比べたら大差なかったりして
やねうら王の探索は意外と寄せの力が強い
詰将棋エンジンはシングルスレッドでしか動かない
ハイスペックほどスレッドの暴力で詰将棋エンジンより早く結論を出してしまうことも多い
>>524
例えばこれなんかは先の実戦局から生じた変化局面図で後手番
ソフトは△58と▲79金を推してくる
実は△58とには▲52とが詰めろなので先手勝ち
ソフトは数手前にこの▲52とを読んでこの変化になるのを避けるべきなのだが、
それができない
後手の持駒:角二 金 銀 歩三
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂v銀 ・ ・ ・ ・ ・v香|一
| ・ ・v玉 ・v金 と ・ ・ ・|二
| ・v歩v歩v歩v歩 ・ ・ ・v歩|三
|v歩 ・ ・ ・ ・ ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ ・v歩 ・ ・|五
| 歩 ・ ・ ・ ・ ・ ・ ・ ・|六
| ・ 歩 桂 歩 歩vと ・ 飛 歩|七
| ・ ・ 玉 銀 ・ ・ 金 ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ 香|九
+---------------------------+
先手の持駒:飛 金 銀 桂二 歩
後手番 >>525
計算資源同等で伸びしろがあるんなら、断然こっちだろw NNUEの学習の話題が全く出てこないのはなんでなんだろう
コードも論文風PR文章も鬼難しい。
もしやねさんが、WCSC28のTNKより強いものを作れたら天才だわ
>>530
合成しかしない奴ばっかだから学習すらできない >>521
技巧2でも飛車落ちで勝ちきれないことがあるのかよ 羽生や藤井(聡)と1000回やって1回負けるかどうかってレベルでしょ技巧2
それに飛車落ちで勝つことがあるとかヤバいな
もう人間は何億回やろうが何兆回やろうがレート4000超えソフトには勝てないよな多分
例えるなら蟻とゾウ
ソフトは人間を超えたが、人間の将棋はソフトにはない魅力があり面白いのは確か、
ソフトは最善手ばかり指すので完璧すぎて面白味がないのは確か
羽生さんや藤井聡太君ならソフトなんかより良い手をさせる
25歳以下のプロはソフトに全勝という歴史的事実
「角成らずw」「28角w」
ポナ以外のソフトなんて単純だからすーぐハメ手に引っかかるしバグだらけ
ポナ以外のソフトなら貸し出しで弱点を研究してハメればプロが圧勝できる
一般ファンが最も信用するソフトは1年経ってもポナに勝ったelmoのまま
進化した最新のソフトでも信頼されず、眼中にもなく、ただでも必要とされてない
これが世間の嘘偽ざる認識だw
大橋拓文@ohashihirofumi
アルファ碁マスターが打った新手を、ティーチでは人間の定石の方が良いと反省しているwww人間強い。
Google 「AlphaZeroの棋力が僅か数時間でelmoを超えました 棋譜は出さないけどね」
一般ファンA 「やっぱグーグルはスゲー! 棋譜がなくても絶対信じるよー」
一般ファンB 「所詮日本の開発者の技術力なんてその程度だわなw」
お前ら 「R4200超えのソフトスゲー!」
一般ファンA 「そんな信憑性ゼロの戯言など信用できるかw どうせポナンザより弱いんでしょ?」
一般ファンB 「羽生さんや藤井聡太ならそのソフトより良い手が指せるわw 無料でも要らねえよ」
>>533
ほんと難しすぎてイマイチ理解できなかったわ >>542
お前 floodgateに参戦してhavenと対局してハメてをして勝ってから大口叩いてこい
haven R4394 49勝 1敗 勝率0.980 将棋俱楽部24 R4081 >>531
どこらへんがネックなんだろう、ハイパーパラメータの多さ? >>544
一般ファンが最も信用するソフトは1年経ってもポナに勝ったelmoのまま
進化した最新のソフトなんて全く信頼されず、眼中にもなく、ただでも必要とされてない
AlphaZeroは僅か数時間でelmoを超えた、日本の開発者は雑魚ばかり
これが世間の嘘偽ざる認識だw >>539
>ソフトは最善手ばかり指すので
「角落ちなら将棋の神に勝てる」と発言した羽生の二番煎じか?
現在のソフトが最善手ばかり指すわけがない
現在のソフトは精々で20手くらい先(詰みを除く)までしか読んでいない
その20手の読みも抜かりが多い
将棋の神は100手以上先まで完璧に読んでいる
数十年後には登場すると思われる50手先までほぼ抜かりなく先読みするソフトも、将棋の神には百戦百敗
浅はかな発言は羽生だけにしてもらいたい 名前も大事だな
アルファベットで短めのシンプルな名前だとスマートで賢そうに見えるんだろう
>>546
お前統計データを取ったわけでもなく、何人がお前と同じ考えか分かってもなく、ええ加減なことぬかすな、
統計データもないお前の戯言など、誰も信用しておらずただの荒らしがまた来たとしか思ってないわ >>540
現在の強豪エンジンにはハメ手に引っかかった局面から始めても人間は
全然勝てない >>535
千田の設定ミスで技巧2が8スレッド、QQRが16スレッドの差はある
uuunuuunさんが技巧1で実験したときは技巧の9-1だったそうだ
yaselmoの飛車落ちが大樹の枝相当で、そこからいきなり技巧1まで上がるとも思えん >>550
公式戦7戦全勝のポナ、ポナに勝ったelmo
これ以外のソフトは最新のソフトであっても全く信用されてないのが現実
羽生さんや藤井聡太君ならソフトなんかより良い手を指せる
25歳以下のプロならソフトなんか敵じゃない
これが世間の嘘偽ざる認識だw >>552
だからお前の言っていることには統計データがないんだよ、お前が勝手に思っているだけ >>553
25歳以下のプロはソフトに全勝という紛れもない事実
一般ファンが最も信用するソフトは1年経ってもポナに勝ったelmoのまま
進化した最新のソフトなんて全く信頼されず、眼中にもなく、ただでも必要とされてない
AlphaZeroは僅か数時間でelmoを超えた、日本の開発者は雑魚ばかり
レーティングなんて全然当てにならない
これが世間の嘘偽ざる認識だw ノイズだらけの人間の棋譜を学習して、人間の手が良いと認識してしまってるMasterや絶芸が
Zero、PhoenixGoに負けるのは当然と言える
>>555
こいつほんまアホだな、アホな言い分をただ述べているだけ、相手にするのはもう止めよう、おしまい >>557
ポナ以外のソフトはプロに負けるのを恐れて電王戦をポナに丸投げして逃亡した腰抜け
引退したポナを除いて5vs5のマッチを再開し、ソフトを貸し出して研究すれば、今でもプロが5戦全勝する Sa02-HRP5
この人の頭は2015年辺りで止まっている
阿久津がアマが考えた対コンピュータ戦法を真似して突いたとか、永瀬がバグを探して突いた辺りまでで止まっている
阿久津や永瀬の相手をしたソフトは、2014年のバージョンで現在のソフトとは比較にならないくらい弱い
>>559
世間の多くが4年経った現在でもそう認識してるから仕方ないねw 昔、「旅人」という頭のおかしいプロ厨がいた
何年も前の低性能PCで何年も前のソフトと対局して、「ソフトは弱い」と結論付けていいた
Sa02-HRP5は、「旅人」の現代版
Sa02-HRP5 → No.2bot No.2botの書き込みの移り変わり
2012年頃
・三浦さんがアイオイユウコやホープライトに負けるわけない
・アイオイユウコやホープライトに最強コンピューターが負けてるうちは羽生さんらトッププロには勝てない
・最強ソフトがアイオイユウコやホープライトのようなアマチュアに負けてる内は トッププロ>最強ソフトは揺るがない
・アイオイユウコやホープライトにコロコロ負けてるソフトが羽生さんより強いわけなかろう
↓
2013年頃 Puella α:2013年に開発が中止された昔のソフト
・所詮はNO2ソフトが塚田さんに勝てずNO5ソフトが阿部君に惨敗するレベル トップ中のトップが出る段階ではない
・並のプロの阿部君や塚田さんで勝ったり引き分けたりするレベル
↓
2014年頃
・コンピュータは阿部君塚田さん船江君豊島君らより確実に強いと証明しないとね
・阿部君豊島君には手も足も出ない負け方をしてるわけだし
・渡辺さんより遥かに格下の阿部君塚田さん豊島君らが負けてないんだから
・わざわざ羽生さんが出なくても豊島君クラスならソフトに楽勝できる
↓
2015年〜2016年 AWAKE:2016年5月のコンピュータ選手権で予選落ち ツツカナ2016年10月の電王トーナメントで予選落ち
・将棋はA級全敗棋士が最新最強ソフトを21手で負かした
・現実は普通にA級全敗棋士が最強コンピュータに楽勝してるんだけどね
・されどA級全敗棋士にはトップソフトが勝てないんだったねw
・MAXの能力なら森下さんクラスでもコンピュータより上だと証明された
・ソフトは所詮はソロバン使った森下さんに勝てないレベルだからね
・森下さんクラスでもMAXの能力なら楽勝だったね
↓
2016年
・山崎さん程度が負けたところでA級全敗棋士が楽勝してるうちは大丈夫
↓
2017年に名人が連敗した後は沈黙
No.2botは10年以上前に活躍していた旅人を大幅に劣化させたような存在
旅人の理論 http://www.geocities.co.jp/CollegeLife-Cafe/8331/comp.html >>555
まぁ、少なからずそういう世間の認識があるというのはわからなくもないが、それがどうかしたか?
開発者たちはきちんとした条件で強さを計測している。
世間の認識がどうあろうが、別に強さは変わらん。測定したとおり。
疑似科学で世間をだましにかかってる奴を批判するならその論法でいいかもしれないが、
コンピュータ将棋は普通の科学やってるから数字はそのまんまの意味。 >>537
確実なのは飛車落ちとほぼ同じ飛香落ちはほぼプロ駄目だろう
二枚落ちもyaselmoの時点で2400だったし、QQRなら2600-700でもおかしくない
そうなるとプロ平均クラスでも負け越すだろう
AWSなんて使った日なら羽生藤井だけやっと勝ち越しとかそういうレベルかな 一般の将棋ファンに
「現在最強のソフトは?」「現在最も信頼できるソフトは?」
って聞いてみたらいいよ
殆どの人が
「elmo」、「ポナ」、「激指」 ←←
って答えると思うから
世間なんてそんなもんw
人とソフトを比べるのはもうやめるべき
プロ棋士に対しても失礼
>>566
百歩譲ってその通りだということにしても、だからなんなんだ?
お前さんは何を主張したいんだ? >>568
>だからなんなんだ?
>お前さんは何を主張したいんだ?
Sa02-HRP5(No.2bot)に代わって答えます
コンピュータ >>> プロ棋士 だと都合が悪い
だから屁理屈で プロ棋士 >>> コンピュータ だとしないと気が済まない
こういうことだろう >>565,568,570
公式戦で実際にプロを負かして証明しない限り、世間からは永久に信用されないよ
レーティングではなく対局結果で示さないと
電王戦を開催しなければ
「プロがソフトに負けるはずない」
電王戦で底辺プロに勝っても
「タイトルホルダーがソフトに負けるはずない」
と盲信されてた過去があったようにねw >>570
それはおかしくないか?
Ponanza信仰ととれるようなことをいってるから。 ね、Ponanza信仰でしょ?
こいつポナ山さんなんじゃないの?
>>572
俺はポナ信者ではない
ポナが公式戦でプロに勝ちまくり実績を作ったのを評価してるだけ
他のソフトに最も欠けてるのは公式戦での実績
世間を納得させるだけの実績はポナ以外のソフトにはないのが現実 >>570
ソフトが強くなるのも都合が悪い
Ponanzaを大きく超えるソフトが次々と登場している
現在開発しているソフトは引退したPonanza以下ということにしないと気が済まないのだろう
要はPonanzaを超えるソフトが次々と開発されて、コンピュータ >>> プロ棋士 であることが更にはっきりすると困るということだ 再掲載
Google 「AlphaZeroの棋力が僅か数時間でelmoを超えました 棋譜は出さないけどね」
一般ファンA 「やっぱグーグルはスゲー! 棋譜がなくても絶対信じるよー」
一般ファンB 「所詮日本の開発者の技術力なんてその程度だわなw」
お前ら 「R4200超えのソフトスゲー!」
一般ファンA 「そんな信憑性ゼロの戯言など信用できるかw どうせポナンザより弱いんでしょ?」
一般ファンB 「羽生さんや藤井聡太ならそのソフトより良い手が指せるわw 無料でも要らねえよ」
2枚落ちでソフトが人間に勝つとか言う奴定期的に出てくるな
レートが無限大まで行ったら裸玉でもソフトが勝つよな。その通り
>>572
ソフトが強くなるのも都合が悪い
Ponanzaを大きく超えるソフトが次々と登場している
現在開発しているソフトは引退したPonanza以下ということにしないと気が済まないのだろう
要はPonanzaを超えるソフトが次々と開発されて、コンピュータ >>> プロ棋士 であることが更にはっきりすると困るということだ 何れは出回ることになるが、現在はスマホで名人に飛車落ちで勝つソフトは出回っていない
そうなっては困るので、スマホ用の名人に飛車落ちで勝つソフトの開発を阻止したいのだろう
>>577は二枚落ちで名人に勝つソフトが登場することを認めたくない
だから「レートが無限大まで行ったら裸玉でもソフトが勝つ」と書く
それにより二枚落ちで名人に勝つソフトを否定したいのだろう
プロ厨(コンピュータ将棋を恐れる連盟関係者)は現在でも生きている ソフト信者はそれはそれでいいけど、2枚落ちでも人間に勝つとか言ったら数字しか見てないのがバレてしまうぞ
QQRは駒落ち定理で想定されるよりも強めの勝敗になるらしい(要検証)
>>581
つい10年ほど前は、将棋の神でも角落ちだと戦力不足で名人には勝てないと書いていた連中がいた
将棋の神には程遠い現在のソフトですら飛車落ちで名人に快勝するレベルにある
対局しない限り証明できないと書いている輩がいるがw 色々書いてきたが、俺が本当に主張したいのは>>571と>>574だ
これらを100回読んでから思う存分批判したまえ プロは自宅でソフトと角落ちや飛車落ちをやっているだろう
それで彼我の実力差はよくわかっている
だから最近ソフトをディスる棋士はいなくなった
大駒の有無の違いは、ある程度棋力があれば分かりそうなものだが
指してみなければ分からない理論なら何でもアリだわな。
さすがに飛車落ちならとひっそりと自宅で挑戦して返り討ちにあった棋士もいるだろうね
去年だったか今年だったか普通に飛車落ちでも勝てないとプロ棋士は言ってるって
読売新聞に書かれてたぞ
>>581 >>587
名人が負けて以降に、角落ちのコンピュータ相手に勝った棋士は1人もいない
飛車落ちのコンピュータ相手に勝った棋士も1人もいない
二枚落ちのコンピュータ相手に勝った棋士も1人もいない
勝つ自信があるなら対局してもらいたいものだ
会長は一泡チャレンジなんてことを言っていた
塚田九段の「開発者はプロ棋士の棋譜を研究できるので、棋士もソフトの棋譜を研究云々」の理屈は通用しなくなった
棋士の棋譜を使わないで開発したソフトなら事前貸し出しなしで対等な関係になる
ソフトの事前貸し出しなしで、飛車落ちで対局
棋士が勝ったら、二枚落ちで対局
棋士が負けたら、角落ちで対局 551<<
それぐらいの設定ミスでは結果的にほとんど影響ないと思う
それよりも技巧2のレベルを普段千田が対局に使用しているまま
元に戻すのをわすれて対局させた可能性がある(自分より少し強いレベル)
千田は最新ソフト相手には飛車落ちで勝ち越せない棋士がいるかもしれないとコメントしてたな
>>566
将棋ソフトに少しでも興味が有れば、WCSCやuuunuuunさんのサイトにアクセスして「現在の最強ソフト」を調べるはずです。
興味が無ければ「知らない」と答えるはず。
あなたの「世間」とはあなたの脳内箱庭に過ぎません。 >>596
こんばんは
来年中には盤面認識機能があるスマホアプリが登場する可能性が高いと考えています
需要がなければ開発されないので微妙なところですが 初歩的な質問で申し訳ないんだけど
将棋GUIとぐじらってのは入れて動くんだけどやねうら王ってやつを入れても初期化エラーが出て動かないんだけどなんか設定しなきゃいけないものとかあるの?
>>579
レートが無限大まで行ったら裸玉でもソフトが勝つ
は命題としては正しいぞ
神様のレートは有限なので 勝敗が正規分布するという仮定が成り立っていないと思われる。
>>593
uuunuuun @uuunuuun1
今の所QQR(飛車落上手) 9-49 技巧2(下手) 上手勝率15% 一応100局くらいやらせる予定。
-----------------------------
レート差にするとおよそ300(だけど1つ勝つだけで勝率が大きく変わるのでまだなんとも)
ただそれでも推定レート3500±だからなあ、yaselmoから280アップしてる
いくらなんでも急に強くなりすぎてるので、技巧2が駒落ち下手で弱い説を推奨 将棋ソフトにおいては駒落ちとレート差正しくないだろ
ほぼ全てのソフトは教師局面を平手で学習させてんだろうし
GCEある程度使ったら無料クレジット残ってても割り当て増加の申請通るね
n1-highcpu-96
Y4.82 QQR
bench 4096 96 19
37083010,38099567,40147234,37763888,38282997,35837319,37742756,36516032,35978130,37860989
bench 128
559124,755735,751427,737757
このスレの詰将棋もどきは大体一瞬で終わる 時間かかっても1分ぐらい
>>606
AWSのm5.24xlargeとは1コアあたりの処理能力が7割ぐらいでちょいと遅いね
n1-ultramem-160(vCPU x 160、メモリ 3,844 GB)
だとnps一緒ぐらいになる
むしろメモリ3.8Tあることにびっくりするが 3.8Tあっても使い方わからんな、半分以上RAMディスクにしそう
hefeweizen600台クラスタと二枚落ちで互角なら奨励会初段以上はある?
NNUEの学習に使う検証データって出来ることなら多い方がいいけど学習にかかる時間とトレードオフって感じ?
ソフト信者は、神様なら裸玉でも人間に勝てるという主張か。将棋は奥深いなあ
駒落ちになると、例えどんなに強い存在であっても、
一定以上のRには達することができないであろう。
その限界値は、昔の想定よりは遥かに高いが、限界があることには変わりない。
>>615
松村になら、羽生さん以外でも裸玉で勝ちそうだけどな。
(レーティングにして、どこまでなら裸玉で負けるのかな。) >>616
例えば飛車を後押しに歩を全てと金にして、スクラム組んで一歩ずつ進んで行けば自然に詰むな
狭義の完全解析とは程遠いが >>616
最短手数は解析するの大変だろうけど、必勝手順なら簡単だから考えてみ 定跡だけ搭載して、探索も評価もせずにQQRにかてるプログラムは簡単に書ける?
藤波辰爾対タナトラ先生の裸玉対決を最近テレビでやったらしい。
もちろん、タナトラ先生の勝ち。
初心者の自分は、指導対局してくれるソフトが欲しい。
(現時点ではぴよ将棋のヒント機能でも十分だけど)
>>625
激指の指導対局やレーティング対局オススメ 先手: 俺氏(24三段) / 後手: QQR
手合割:平手
▲7六歩△3四歩▲2六歩△8四歩▲2五歩△8五歩▲7八金△3二金▲2四歩
△同 歩▲同 飛△8六歩▲同 歩△同 飛▲9六歩△7六飛▲7七角△5二玉
▲5八玉△7四歩▲3四飛△3三角▲8四歩△8二歩▲3八金△4二銀▲2八銀
△7三桂▲3五飛△3四歩▲2五飛△2四歩▲4五飛△7七角成▲同 金
△3三桂▲1五飛△1四歩▲7六金△1五歩▲2一飛△5一金▲2三歩△4九角
▲同 玉△6九飛▲4八玉△7九飛成▲2二歩成△6八龍▲3九玉△6九龍
▲4九角△5八銀▲4八金△4九銀成▲同 金△5八角▲5九銀△4九角成
▲同 玉△5八金▲3八玉△2二金▲同飛成△5九龍▲3九金△4八銀
角2枚ゲットしたところまでは優勢で勝ったと思ったら普通に負けた
後で形勢見たら終始ずっと俺が不利でワロタ
裸玉なら、相手の指し手無視して以下の手順で動かせば良いだけ。
△1六歩△1五歩△1四歩△1三歩成
△1二と△1一と△1八飛
△1六飛△9六歩△8六歩△7六歩△6六歩△5六歩△4六歩△3六歩△2六歩
△1五飛△9五歩△8五歩△7五歩△6五歩△5五歩△4五歩△3五歩△2五歩
△1四飛△9四歩△8四歩△7四歩△6四歩△5四歩△4四歩△3四歩△2四歩
△1二飛成△8三歩成△8二と△4三と△5二竜△3二竜
裸王の最短手詰みを見つけられるくらいにはコンピュータ将棋って進化してんの?
>>626
マカーなんです…orz
仮想環境で動かしても行けるかな?
とりあえず、Amazonのほしい物リストに入れておきます。 >>627
横歩だとCOMはミスらないから勝てる気がしないけど、
逆に一発入れるには水平線とか長い詰みがある横歩が有力なのかなぁ? ソフトの後手番の有力定跡はどの戦型であっても千日手率が高い戦型を選ぶべきだと思う。
極論を言えば序盤で千日手になった棋譜を全部ぶっこむのが一番マシになる。
作戦としてはありだな
後手番はなるべく千日手や引き分けを目指すソフトが増えてくるかもね
コンピューター将棋は先手ゲーになりつつあるらしいから
千日手に出来れば結果オーライなのかな
選手権の先後の勝率を計算した人はまだいない?
印象だけだと後手の勝率も悪くなかった気がするが
エラーやバグがたくさんあったから修正必要だろうが
角道開けて、3間に飛車振って馬と竜が最短手順のばす
最近のソフトって強化学習によって評価関数が最適化されるようにプログラムされてますか?
それとも探索部と評価関数はそれぞれ独立で、いくら学習しても最初に人が入力したデフォのままなのでしょうか?
事前に50億局面を学習して最適化済みなので
対局によって新たにパラメータが調整される事はありませんよ
評価関数を強化学習するね
探索部と評価関数は独立だけど、探索して教師作るから無関係ではないね
>>642
>>643
即答ありがとうございます
理想評価関数に限りなく近い50億局面分の極限評価関数が存在するということですね
その評価関数はインタネット上に公開されてますか?
門外漢なもんで詳しくありません >>635
千日手を成立させるためには、先手が「打開したら千日手の設定評価値を下回る」と
判断しなくちゃいけない。
やねうら王のデフォルト設定のまま千日手=-1にしてくれていたら後手はウマーかもしれないが
先手が千日手絶対拒否の-30000とかに設定してたら、後手番が損しそうだぞ
MaltiPV=1で千日手以外の手を読んでいないのなら、先手番の得を上回るのは大変だ 何に使うの?
理想や極限の定義は知らんが
強いソフトが使いたいならやねうら王+QQR使えばいいよ
おそらくR4200くらいの強さであろうソフトがマイナビから発売されるからそれを買うとか
50億局面分の評価関数といっても、表形式で50億局面分あるのではなくて、関数近似されている。
なので、50億局面の中に入ってない局面もある程度ちゃんと評価できる。
KPP(T)で約2億(+手番ボーナス)、これだけの表現力があってもそれを未だに使いこなせてない感あるからな
線型の時代は終わってこれからはNNの時代になっていくのかなやっぱ
むしろKPPTに正しい値を付けることができるAIを作ろう
プロ公式戦で千日手が成立しやすいのは、手番を変えての指し直しが発生するからで、
かつ、人間にはセンチポーン単位での局面評価はできないから、
「先手番での指し直しが欲しい後手番」と「打開したらどのくらい得か判定できない先手番」の
意思が合致しやすい
他方、電王トーナメントのノックアウトステージを除いて、千日手指し直しのない
コンピュータ将棋のコンペティションでは、千日手の合意が極めて取りにくい
千日手の設定評価値を何点に設定するかにもよるけど、通常は評価値プラスの値に
千日手を設定することはないと思われるので、双方ともに自分が不利と判断している
場合にのみ千日手が生じうる
しかも、人間と違ってセンチポーン単位での評価値を(実際に合っているかは別として)
正確に把握しているので、「よくわかんないから千日手にしよう」ということもない
叡王戦の金井のように「打開すれば優位なのはわかってるけど具体的な手順に自信がない」
ということもない
明らかに自分より強いだろうと思われる相手に後手番引いた時に、千日手の評価値を
自分の+128くらいに設定しておけば、価値のある0.5点を取れる可能性が高まるかも知れないけど
そうでない限り、成立しない千日手を読むのはただの時間の浪費かと
千日手の評価値は対戦相手のみならず対局中にもダイナミックに変化するもので
固定値が無理なのかも
uuun氏のレーティング表ではYO4.82/QQRが首位になっているけど、うちの計測では
TNK-NNUE-whale6がYO4.82T/QQRに勝率75%で圧勝なんだが、評価関数より探索の相性が顕著にあるからだろう
残念ながらYO4.82はwhale6に弱すぎる結果になった、TNKでKPPTではないので念のため
うちの過去の計測では800万〜1000万と1500万での勝率の差はあまり変わらない結果になっている
やねうらおのシェア版が特に特徴ないとするとGUIを買うようなもんか
うーん
うちの計測だと一手500~800万くらいでwhale6の勝率40%くらいだった
100局の結果だから99%信頼区間で考えても勝率55%は超えない計算になるんけど1%を引いたのか?
>>658
そちらの結果とは逆だけど、結果が結果だからどうしようもない >>659
まあ環境も違うしなんともいえんが
ちなみに何局くらいやった? >>658
TNKじゃなくKPPTだと、それ位の勝率になるはずだが、TNKで間違いないの? >>661
KPPT版(qhwcsc28に対して勝率62%程度の評価関数使用)、NNUE両方試したけどどちらも40%程度だったわ 60局だと上振れしてたとしても勝率60%超えかなんでだろうなあ
>>658,662
あり得ない結果
全く別のソフトを対戦しているとしか言えないね
直接確率計算2×2]
観測値1 観測値2
-----------------------------------------
群1 40 60
群2 45 15
-----------------------------------------
両側検定 : p=0.0000 ** (p<.01)
片側検定 : p=0.0000 ** (p<.01) >>665
あり得なくはないけどほぼあり得ないよね、宝くじ当たるようなもんだし
勝率75%ってレート差200近いし何か設定ミスなんじゃないかと思うんだけど ノード数ではなくコア数の違いとか?
LazySMPの働き方に差があるならノード数が同じで結果が大きく変わっても矛盾はしないし
自分もやったけど6スレッド1手2秒200局で勝率はTNK NNUE WHALE6対QQRでwhale6側の勝率40%位だった
確かにLazySMPは確かに多少考慮しないといけないと思うけどそもそもが同ノードじゃないしなあ
あとNNUEって軽くていいってイメージがあるけどPCに結構負荷かからない?
KPPT使ってるときより一割くらい電力もってかれてる気がするし、RAMもCPUも熱くなるような
>>646
いやーどんなプログラミングなんだろうって >>648
ああやっぱり
個人的にはソフトの序盤の評価は不正確だと思ってます
いくら学習させても終盤に比べフィードバックがあまりにも少ないんで ソフトのダウンロード場所聞くレベルなのに
学習させても〜とか意味わからんけど具体的な内容教えてよ
学習や評価や探索の内容知りたいならならやねうら王のドキュメントやソース見るのが一番いいよ
商用版やねうら王2018、レガシーな環境に配慮する割に収録エンジン多くてストレージ食いそう
インストーラで最小構成インストールとか用意するのかな
KPPTじゃなくてNNUE評価関数だからそこまでファイルサイズ大きくならないんじゃね?
>>675
MyShogiのREADME.mdによるとTNK,ぽんぽこ(STD5),Qhapaq,読み太,やねうら王(KPP_KKPT)が搭載されるらしい NUEEの学習してみようと思ったらtargetdirとかetaとかlearnの後に来るもろもろのコマンドを受け付けてくれないんだけどなんでだろう
見た感じやねうら王と同じ感じでコマンド打てばいいのかと思ったけどそういうわけじゃないのかな
わかる方いたら教えてください
学習機能を削除したビルドだからじゃないの
Makefileを書き換えてarmのlinux環境で試したがNNUEもかわりなく動いたぞ
>>679
普通にただのヒューマンエラーだったわ、ありがとう >>645
>「打開したら千日手の設定評価値を下回る」
この文を定式化するのは難しいんだよね
それと
MaltiPV=1で先手が千日手絶対拒否の-30000とかに設定してたら、後手番が損するのではなく、先手番が千日手筋を失って一方的に負けると思うけど
-29999で千日手筋が存在するのはまず想定できないし読めていないMateが存在してもおかしくない
だから現実的に「千日手以外の手を読んでいない」ということはありえないんじゃないかな、-29999となると後手が千日手にしてくれないからね
先手にとっては負けるよりは千日手になる方がマシなので千日手の設定評価値の最適化も必要なんだよ NNUEのお試し学習してみてるけど全然CPUリソース使い切らないわ、メモリがボトルネックなのかな?
先手後手がそれぞれどういう前提で設定されてるかにもよるしね
@ContemptFromBlackがfalseでContemptが正の値になってるとどちらから見ても悪いと判断して回避しやすい
AContemptFromBlackをtrueにしたらContemptが正の値だと後手が積極的に千日手にするけど先手が回避する
先手から見て悪い
後手から見て良い
この場合Contemptの値が同じだとしても@の場合の方が千日手を回避する圧力は高くAの方が千日手になりやすい
とはいえ現実に即しているように感じるのはAの方である
私見で言えばAのContemptは感覚の2倍ぐらいの値にするとちょうどいい動作になる
初期局面が70点先手有利だと考えるのであれば倍の140ぐらいに設定するとちょうどいい
先手後手の千日手の評価値を個別に設定するようにしてみるのも面白いかもね(改造自体は超簡単なはず)
>>684
なんで素直にそのまま70点にしたらダメなの? それだと初期局面での先手後手の評価値差の近似値を出すモデルが必要だから大変だな
70点くらいと人間が決めると限界が来るから正確な数値を出す必要があるわけで
技巧2とQQRで対局したが、技巧が勝ったほとんどが技巧の振り飛車
技巧が振り飛車得意なのか、QQRが振り飛車苦手なのか
QQRが振り飛車をやや低く評価しすぎてるところはあるんだろうね
QQR自体も振り飛車にするんだが、勝率が良くない
ただ、5秒のような短い時間だと弱いが、30秒だと勝率上がるね
もしかして、振り飛車の教師局面が少ないんかね
QQRが振り飛車に弱いと思われる
定跡オンのハニーワッフルに対して殆ど五分五分
かぱっくはハニーワッフルを圧倒してる
elmo以降のソフトは振り飛車に対して変な囲いや攻め方するからそれが原因だと思われる
普通に穴熊やればいいのにな
そうすりゃ勝率10割でしょ
つまりは九段の方の藤井氏なら、QQR勝てる可能性が…!?
なんつーか
もう定跡勝負だなこれ
選択定跡によって全然勝率変わる
いや、究極言うとR4200を超えた今は、定跡なんかいらないのかもしれない
事前にかなり深く探索して定跡を搭載しておくのは結構効果大きいと思うけどな
短い時間の対局では定跡を上回る読みを繰り出すのは至難の業でしょ
ただし定跡におかしな手が搭載されていないことが重要かな
>>694
まぁ同じ手順に陥らない為に深く考えさせて複数候補手を定跡で登録するのはありだね
今自分も一手目からQQRやTNKに考えさせて自動登録してる(対戦相手は適当にやってQQRやTNKの指し手のみ棋譜から登録)
まあ今後出るソフトも考え10手〜15手までしか登録してないがね >>694
そう思うよな
だけど定跡オンオフのQQRを1手0.1秒で100局戦わせたら定跡オフが勝ち越したよ
他のソフトでやっても大体定跡オフが勝ち越した
まふ定跡、やねうら定跡で試したけど定跡オフが普通に強かった印象 >>696
その定跡のいずれもあまり良くない変化が登録されているからそこがよくないわな >>697
かぱっくが出したくそこら定跡角換わりverだっけ?
あれで試しても定跡オンが負け越した気がするよ >>698
定跡の末端のほうは結構微妙な手が含まれていて定跡を抜けた時点で有利ではなかったりするからね
まあそれでも100局で有意差がでるほど負け越しているならちょっとびっくりだけど 後手番なら必勝筋が見つからない限り千日手を狙う手が最善になるんだが殆どの人がそのことに気づいてないね
今のソフトはそのアルゴリズムが抜けている
>>692
レベルが違う 角落ちでも勝てないのに戦型がどうとかという以前の問題 定跡って言わば事前計算結果だから、きっちり整備すれば
定跡オンが定跡オフより不利になる事は理屈の上ではあり得ないはずなんだけどな
まぁ、きっちり定跡を整備するのが難しいというのはわかる
チェスの後を追うことになるのかな、後手番は引き分けをめざす
負け戦だからこそ勝ちに行くのが歌舞伎者だってばっちゃが言ってた
>>700
もしそれが真実だとしても、現行の稲庭排除ルールでいちゃもんつけられる可能性があるから作れない。 >>706
序盤旧藤井が指して終盤は新藤井が指すのが最強だぞ >>703
そうなんだろうけど、実際定跡オフだと同じような手順ばっかになるんだよなあ
欲言うと、三間や四間飛車穴熊なんかも見たいもんだが、振り飛車弱すぎるからな >>709
もしかして最初から最後まで新藤井が指したら強いんじゃね? >>710
Rが上がるほど勝率の低い戦型は淘汰されていくもんな
振り飛車はNNUEの表現力に結構期待してるわ、適切な教師から学習すれば振り飛車指しこなしてくれるんじゃないかと 特定の戦型での勝率が見たければ指定局面からやらせればいいわけで
>>708
稲庭が禁止されてるのはSDTだけで選手権はOKなはずだし
そもそも稲庭は選手権が切れ負けルールの時に切れ勝ちを狙ったソフトであって引き分けは副産物
てかいまのソフトに稲庭効かないし >>713
その結果戦型が淘汰されていっている
澤田さん曰くゴキ中なんて勝率2割くらいらしい
後手番が選択できる戦型がイマイチわからなくなっていてきている状況 QQRの定跡8手くらいで切ったら技巧2相手に10-0だった
なんだかなあ
少し前まで、後手でもまだ指せるのが横歩で、
角換わりの後手番は全然ダメだったんだから、また変わるんじゃない?
将棋はお互いが最善を尽くせば千日手になる
少なくともどちらか一方が間違えると決着が着く
しかしやねうら王のandroid対応エントリーに出ているNexus 6Pのベンチの数値低いな
スペック上から想定される値の半分くらいだ
AVX2とかでうまく高速化してるのができないから思ったより低いのかな
サーマルスロットリングですがな>Nexus6P
nnueを800MHzに制限したCotex-A53がuuunベンチ条件でメインスレッドが約24K
ARM系はだいたい熱のせいでまともなベンチ結果がでないようだが
結局スマホは限界まで使うと廃熱がどうしようもないか
>>503、NPS低すぎない?
公式にあるAperyの30%ほどしか出ない
その分評価関数の精度がいいってこと? >>725
NNUEは低NPSで強いことに定評がある
高NPS代表のaperyとNNUEを比べてどうするんだ 非AVX2ですっとこどっこいに遅いのはsse2以下だと思うが
sse2なら多少は改善できる
>>726
PC版は同じくらいのNPSじゃなかったっけか?
Android版はPCほど最適化出来なくて遅いのでは? うちのスマホでスレッド1だとNPS半分くらいだねNNUEは
>>729
そんなにNPS出る?
PC版でもYO4.82の7割くらいかなって印象なんだけど 予算ごとに最強の構成教えてよ
∞
30万以下
20万以下
10万以下
suimon@floodgate_fan
将棋用途でパソコンの購入を考えている人には希望があれば私で良ければ相談には乗ります。
ただ、本気の本気の人のみでお願いします。
それ以外ならBTOで10万くらいで十分いいのが買えると思います。
>>733
∞ 富士通かNECかHPかIBMに依頼 真面目な話をするとCPUのマルチスレッド性能とRAMに予算内で全ツッパするだけじゃん
パソコンに詳しいと自負しているのだろう
多分プロやアマ強豪から相談が来ると思っているのでは
当たらなければどうということはない みたいな将棋だと参考にしずらいし
自分なりの使い方を確立するまでは高額PCとかいらないような気がしないでもないが
自分で金と時間を投資するよりもC-bookをしっかり研究するほうがいいと思うけどなぁ
終盤検討はソフトが強すぎて、逆に人間にはあまり必要がないレベルだし
NNUEの学習ってtest_cross_entropyのロスが下がらなかったら永遠に終わらない感じ?
>>733
AWSかGCEを使えで結論出てるやろ・・・ 普段のちょっとした検討用途にすらAWSとかGCE使うとか流石に無いだろそれは
ちょっとした検討ならスマホレベルで十分やろ
というか検討レベルの為に10万の無駄金出す意味がわからんけどな
デスクトップレベルの16vcpuなら1時間20円だけど5000時間も検討したらさぞ強くなるでしょうなぁ
PC購入の適正レベル相談してる人にクラウド使えとか返すのは
知識あるだけの馬鹿だろ
>>744
そもそもがバーチャル相談者やぞ
ていうか人間の検討レベルならマジで何でもいい
nnueさえ起動できりゃそれで人外レベルや
自称情弱ならPC買わずにパッケージ版のやねうら王買っとけ 現代では高いAndroidにしておけば間違いない
いいカメラも勝手についてくるから将棋用(笑)にパソコン買うより満足度高いだろw
>>676
それは同一条件で複数回試行できない人間の話だろ。
一勝で何ポイント動かすかとか、
持ち時間やタイトル戦の重みづけとか。
コンピュータ将棋とはほぼ無関係。
相性問題の指摘でなければ。 千日手については、初期状態の先手の得を50〜100として、後手有利のー50〜-100としときゃ良いんじゃないの?
>>746
androidは排熱が弱いから不可。
パッドを暖め過ぎるとリチウム電池が膨張爆発する。
電源容量に余裕持たせた水冷デスクトップが最強だろうな。
自作でメモリやチップセットにもヒートシンクつけて風当てた方がいいかも。
300Wのストーブやな。 >>749
それを気にするとやはりAWSかGCEだな
商用版やねうら王がクラウドに対応するらしいし、それのスマホ版が出れば素晴らしいのだけれど わざわざ将棋用にi9-7980XEとかでPC組んじゃう人っているんだろうか
千日手といえばハニワvsコブラの香車の打ち合いって囲碁の「コウダテ=コウ材、コウを解消」と同じだよな。
将棋である部分的な千日手がコウ材になるなんて見た記憶がないから驚いたわ。
>>749
8700kでocしてるけどVRM温度がヤバいし
NNUEは他と比べてCPU消費電力とCPU温度がヤバいので殻割りした方がいい >>753
Ryzenでも同じだわ
普段は何ともない軽めのOCなのにNNUEはかなり熱くなる、ついでにメモリも普段より熱い気がする NNUEはヤバイ
何がってクロック下がるくらいにヤバイ
温度70°にガンガン冷やしてもクロックダウンしてたわ
NPSが上がらないのもこのせかもしれん
Nexus6Pのsnapdragon810って初期のbig.LITTLEだったっけ?
最高でもbig 4coreしか動かんのならスレッドあたり半分ということになる
サーマルスロットリング説は第二候補に格下げしよう
8bit乗算を並列にこなすSIMDをガンガン回すから動くトランジスタ数はそれなりに増える
GPUに比べればはなくそみたいなもんだが多少熱くなるのはしかたがない
8bit packed整数乗算じゃなくて浮動小数点演算ならもっときつくなるのに
NNUE程度でパフォーマンス維持できんのか 今時のCPUは
インチキ商品ばかり増えるな
最近は自作初心者が簡易水冷でCPUだけ冷やして満足するパターンが多いらしい。
NNUE使うときは、ケースのエアフローしっかりしないとヤバそう。
これから夏だしね。
1〜2畳くらいのマシンルーム用意して、エアコンかけないと。
>>754
nnue自体は軽いせいかDRAMの電圧はやねエンジンと比べると低め ベンチの数字で比較しての話だが
三駒に比べてnnueはマルチスレッドでnpsの落ち込みが若干少ない
NNUEを真夏にガン回しして、
次の日にパソコンがただの箱と化してしまうパターンが続出するのか。
胸熱。
素人だけど、エアコン+PCの電気代とクラウド使って回すの、どっちが安上がりなんだろう?
>>766
クラウドのほうが高いに決まってる
クラウドで得できるのはイニシャルコスト
ランニングコストは数倍高い Nexus 6P
Qualcomm Snapdragon 810
Cores 8
Process 20nm
big.LITTLE HMP (2 clusters)
4x ARM Cortex-A53 @ 1.96GHz
4x ARM Cortex-A57 @ 1.56GHz
Clock Speed 384MHz - 1.96GHz
GPU Qualcomm Adreno (TM) 430
>>768
awsが一時間50円として
エアコン,pcで1000W使うとして一時間27円
パフォーマンス能力でいうと
一般的なコンシューマ向けCPUの5倍以上はパフォーマンス出るから
コスパを含めたランニングコストではAWSのが上になるのでは? エアコンと合わせて1000Wも食うPCの5倍の性能のインスタンスが50円/hで買えんのか
壊れるリスク回避をどう考えるかだな
パソコン買うと地震雷火事suimonのリスクがある
まぁなんにせよ開発者やプロ以外にハイスペック端末は無駄だよ
ツイッターや5chでドヤ顔したいバカ向けなんだろうな
後手の持駒:歩
9 8 7 6 5 4 3 2 1
+---------------------------+
| 馬v桂 ・ ・ ・ ・ ・v桂v玉|一
| ・ ・ ・ ・ ・ ・v金v金v香|二
|v歩 ・ ・ と ・v歩v角v銀 ・|三
| ・ ・v歩 ・v歩 ・v歩 ・v歩|四
| ・ ・ ・ ・ ・ ・ ・ 銀v金|五
| ・ ・ 歩 ・ 歩 ・ 歩 飛 ・|六
| 歩 ・ 桂 ・ ・ ・ ・ ・ 歩|七
| ・ ・ ・ ・ ・ ・ ・ 銀 香|八
|v龍 ・ ・ ・ ・ ・ 金 桂 玉|九
+---------------------------+
先手の持駒:銀 香二 歩五
渡辺対ボナンザ
渡辺は▲2七香だと負けを覚悟したというが、qqrが▲3七馬も候補に挙げてた
この手はどうなのだろう
渡辺対Bonanzaの棋譜を解析したら△1五金の時点で渡辺だいぶ有利なんだなw
depth6の100億教師かdepth8の100億教師でNNUE学習させたときR50くらいの違いは出てくるのかな?
uuun氏のツイッター記事に藤井聡太でも勝ち越せないApery_twig R3250がQQRに惨敗していた
「QQRの飛車落ち、今度はApery_twig(二年前のバージョン)と対局。52-18で勝ち越し。R3250は大きく凌駕している。
この時代(技巧もそうだけど)は飛車落ちに対して穴熊で対抗するのだけど、入玉して手数を伸ばしている間に穴熊を粉砕している。
yaselmoはApery_wcsc25と同じくらいだったので大きく伸びた」
昔話題になってたね
平手以外、自分がコマ落としても、相手がコマ落としても弱くなるっての
大平がGPS先生に平手で敵わないのに、駒を落とすと勝てるという話をしてたりね。
depth6と8って雲泥の差なんだな
depth6同士では7割勝ってた相手をdepth8にしたら逆に7割負けたわ
深さひとつでレーティングは200上がる
200差あると7割から7割5分だから、
3:7からひとつ上がると互角、もうひとつ上がると7:3でだいたい合ってる計算だな
深さひとつでそんなに変わるなら、もっと深く、例えば20ぐらいまで出来ないのかな。
勿論、100億なんて言うのは無理だから、頻出する局面だけに絞って。
(数万になるのか、数億になるのかはわからないけど。)
あ、学習の深さじゃなくて指し将棋の深さだからそのまま適用出来るかは不明だが。
もしも同じ200差くらいなら恐ろしいことだな。
計算機資源次第でとんでもない強さになる……
河童絞りが一応その発想に近いんじゃないかな
elmo絞りは出現回数が少ない局面があるとそこがノイズになるかもしれないから質がよくても1億とかの教師では厳しい気がする
数十億円使っていいならdepth20の200億教師で数回絞れば10年後くらいに到達するであろう強さになるかもね
>>150
羽生さんがポナ常駐後初のニコ生解説?ポナの予想手を見たときの様子、
盲象に怖じずなのか、プライドなのかは分からないが、他の棋士とは違うリアクションだったのを思い出した >>681
>先手番が千日手筋を失って一方的に負けると思うけど
なこたぁないだろう。
今は千日手評価値-1に設定してたら次善手が評価値-2でも千日手を優先するわけで
しかもその場合相手の千日手評価値が-1でも千日手になることはおそらく少ない
だから千日手を読むだけ無駄(もちろん終盤戦で千日手に逃れて0.5点取る可能性が
ないとは言わんが、頻度としては序盤千日手より稀だろう)と言ってる 3駒のdepthってDLでいえば局面履歴に相当するという認識でいいんだろうか。
>>793
depth8でちょっと試したらさすがに枝刈り超少ないからか1.73はKPPT-whale6対して勝率60%だったわ windowsでもwslのubuntu上でコンパイルしたらいいんじゃね
cpu性能ならwslでも変わらんよ
>>799
3つある中だとどれが優秀なんでしょうか? >>801
自分は製作者じゃないので、わからないです >>801
対局時間によってどのくらいの枝狩りがいいのかはかなり変わるからなんとも uuunさんはNNUE-whaleはレート測定する気ないのかな?
それ系測り始めたらキリ無いか
Godwhale5.0.5/QQR 4277 +13/-13 1046
YO4.82/QQR 4234 +17/-10 4733
やねうら王より強くできるのは凄いわ。
長時間だとaperyが強いんだっけ
NNUE-whaleは長時間向きじゃないからuuunさんの所の対局条件では無理
しかしk_ohgaさんはすごいよな、Godwhaleもqzilla9も優秀
Godwhale のアンドロイド版、出ないかなあ。
>>806
1500万ノードぐらいで対戦させて棋譜を送れば載せてもらえるのでは
>>793
のClangがどの位のレートになるか興味がある
ところで>>793の数値をguiに登録するときに
設定するようには無理なんでしょうか? 上位ソフトからキメラと18号コマンドで+R20~30のは出来るからR4300到達だな
負けた理由を時間のせいにするな。
suimon@floodgate_fan
指してる時はあまり持ち時間は見ないのですが、最後見たら相手の方が全然時間を使っていないので愕然としました。
suimon@floodgate_fan
誰かこの方の連勝を止めてください…
将棋クエスト棋譜【2分】 (garnet_crow[2440] 対 luckydog[2693]) http://wars.fm/shogi2/game/os2jwuz4oen4 #将棋クエスト #ShogiQuest
>>811
スレ違い、こっちに投稿した方がいいよ「suimonこいなぎstrategy研応援スレッド14」 投稿先間違えたんだろう、たまに違うちゃんねるに誤爆する人いるな
Aperyからdepth8の50億程度であの強さだからNNUEがあっという間にR4400乗せてきて三駒最後の栄光はQQRのものになりそう
>>804
測ってもらいたければ、まず改名が必要。
NNUE-whaleのKPPT版何て何て略すの?
このソフトは初見だと名前から中身を百パーセント誤解される。本スレの外で使われるためには改名が第一条件。 上で言われてるdepth8っていうのはdepthlimitのこと?bookdepthlimitのこと?どちらでもない?
素人な質問ですまん