compcogneuro 翻訳ページ

compcogneuro/web: bg-ventral-simulation

このページは外部資料の日本語訳です。原文の見出し順と本文順を保ち、コード・URL・出典表記はできるだけ原形のまま残しています。

種別

翻訳資料

更新日

2026-05-20

対象

外部資料を日本語で原文順に読みたい読者

目安

原文量に依存

確認メモ

機械翻訳をベースにした日本語訳です。実装手順や引用は必ず原典も確認してください。

出典とライセンス

原典: https://github.com/compcogneuro/web/blob/main/content/bg-ventral-simulation.md

ライセンス: Text: CC BY 4.0; code: BSD 3-Clause。このページは日本語翻訳であり、変更点は翻訳とサイト内整形です。

+++ Name = “BG ventral simulation” Categories = [“Rubicon”, “Simulations”] bibfile = “ccnlab.json” +++

このシミュレーションは、[[Rubicon]] モデルの中心的なコンポーネントである、目標選択プロセスへの腹側および内側の寄与のコンテキストで、[[basal ganglia]] 関数の PCore モデルの最も単純な調査を提供します。 ネットワークは、評価中の現在の潜在的な目標と行動計画に関連する正味のプラス (利益) 対マイナス (コスト) の値を表す 2 つの皮質領域から入力アクティベーションを受け取ります。これらは、連続するニューロン上の単純なガウス「バンプ」を使用してエンコードされ、レイヤーの左下に低い値があり、右および上 (後方) に値が増加します。初期の重みはランダムであるため、線条体ニューロンはこれらの信号が何を意味するかを知らないため、ランダム探索に基づく [[dopamine]] のような報酬予測誤差 (RPE) 信号を使用して意味を学習する必要があります。 BG モデルは、MD 視床の全体的な脱抑制「ゲート」を駆動し、その結果、検討中の現在の目標を固定する (つまり、ルビコン川を渡って目標に取り組んだ状態に移行する) か、それともこの目標をスキップして別の目標の検討に進むかを決定するために、前頭葉皮質に逆投影します。ドーパミン フィードバックは、入力で表される正の値と負の値のバランスに関連したこのゴール ゲートの関数として (この場合のシミュレーション コード内で -- 生物学に基づくモデルについては [[PVLV simulation]] を参照) 計算されます。このバランスが正味プラスの場合、モデルは脱抑制ゲーティングに対して報酬を与えられますが、バランスが正味マイナスの場合は罰せられます。何も起こらなければ、ドーパミンフィードバックはありません(つまり、「何も賭けられず、何も勝ちません」)。 * ネットワーク変数で [[#sim_vmbg:Wts]] をクリックし、次に [[#sim_vmbg:r.Wt]] をクリックすると、ネットワーク内でニューロンをクリックすると、ニューロンへの受信重みが表示されます。 矢印で示された経路に関連付けられた初期のランダムな重みが表示されるはずです。 CT レイヤーには反復的な自己接続があり、長期にわたって情報をより適切に維持できるため、以前のトライアルよりも前の時点からの情報を活用できます。 TODO: 重みを確認し、いくつかのトライアルを実行してからトレーニングを実行し、約 20 で停止し、ステップを踏んでトレーニングされた動作を確認し、テストを続けます。 {id="figure_bgventral-test" style="高さ:20em"} ![腹側 BG モデルからのテスト結果。報酬予測誤差に基づいてドーパミンでトレーニングされ、入力信号が負のコストに対してより正の報酬が利用可能であることを示す場合は Go ゲーティングを実行し、その逆が真の場合は No を実行します。プロットの下部に示されているように、テストでは、内側のループで負のコストの増分をスイープし、外側のループで正の報酬をスイープします。 Gated ラインは、モデルが Go ゲートを実行した回数の割合を示します。これは、これらの値の全範囲にわたって、正と負の比率によって強く決まります。これは、経路間の相互作用のバランスの取れた性質を示しています。 RT ラインは、Go ゲーティング結果が発生したときにかかった正規化されたサイクル数を示します。これは、ポジティブがネガティブに非常に近い、矛盾が最も大きいケースの処理においてモデルが大幅に遅くなったことを示しています。さらに、全体的な傾向として、正の値が強いほど、RT が全体的に速くなります。これらのパターンは意思決定研究で広く観察されており、規範的なドリフト拡散モデルによって予測されます。これは、決定があいまいな場合、モデルが自然に情報統合のダイナミクスを示し、時間の経過とともにより多くの入力を蓄積することを示しています。](media/fig_bgventral_test.png) </section>