compcogneuro 翻訳ページ
compcogneuro/web: bg-ventral-simulation
このページは外部資料の日本語訳です。原文の見出し順と本文順を保ち、コード・URL・出典表記はできるだけ原形のまま残しています。
出典とライセンス
原典: https://github.com/compcogneuro/web/blob/main/content/bg-ventral-simulation.md
ライセンス: Text: CC BY 4.0; code: BSD 3-Clause。このページは日本語翻訳であり、変更点は翻訳とサイト内整形です。
+++ Name = “BG ventral simulation” Categories = [“Rubicon”, “Simulations”] bibfile = “ccnlab.json” +++
このシミュレーションは、[[Rubicon]] モデルの中心的なコンポーネントである、目標選択プロセスへの腹側および内側の寄与のコンテキストで、[[basal ganglia]] 関数の PCore モデルの最も単純な調査を提供します。
ネットワークは、評価中の現在の潜在的な目標と行動計画に関連する正味のプラス (利益) 対マイナス (コスト) の値を表す 2 つの皮質領域から入力アクティベーションを受け取ります。これらは、連続するニューロン上の単純なガウス「バンプ」を使用してエンコードされ、レイヤーの左下に低い値があり、右および上 (後方) に値が増加します。初期の重みはランダムであるため、線条体ニューロンはこれらの信号が何を意味するかを知らないため、ランダム探索に基づく [[dopamine]] のような報酬予測誤差 (RPE) 信号を使用して意味を学習する必要があります。
BG モデルは、MD 視床の全体的な脱抑制「ゲート」を駆動し、その結果、検討中の現在の目標を固定する (つまり、ルビコン川を渡って目標に取り組んだ状態に移行する) か、それともこの目標をスキップして別の目標の検討に進むかを決定するために、前頭葉皮質に逆投影します。ドーパミン フィードバックは、入力で表される正の値と負の値のバランスに関連したこのゴール ゲートの関数として (この場合のシミュレーション コード内で -- 生物学に基づくモデルについては [[PVLV simulation]] を参照) 計算されます。このバランスが正味プラスの場合、モデルは脱抑制ゲーティングに対して報酬を与えられますが、バランスが正味マイナスの場合は罰せられます。何も起こらなければ、ドーパミンフィードバックはありません(つまり、「何も賭けられず、何も勝ちません」)。
* ネットワーク変数で [[#sim_vmbg:Wts]] をクリックし、次に [[#sim_vmbg:r.Wt]] をクリックすると、ネットワーク内でニューロンをクリックすると、ニューロンへの受信重みが表示されます。
矢印で示された経路に関連付けられた初期のランダムな重みが表示されるはずです。 CT レイヤーには反復的な自己接続があり、長期にわたって情報をより適切に維持できるため、以前のトライアルよりも前の時点からの情報を活用できます。
TODO: 重みを確認し、いくつかのトライアルを実行してからトレーニングを実行し、約 20 で停止し、ステップを踏んでトレーニングされた動作を確認し、テストを続けます。
{id="figure_bgventral-test" style="高さ:20em"}

</section>