compcogneuro 翻訳ページ

compcogneuro/web: pbwm

このページは外部資料の日本語訳です。原文の見出し順と本文順を保ち、コード・URL・出典表記はできるだけ原形のまま残しています。

種別

翻訳資料

更新日

2026-05-20

対象

外部資料を日本語で原文順に読みたい読者

目安

原文量に依存

確認メモ

機械翻訳をベースにした日本語訳です。実装手順や引用は必ず原典も確認してください。

出典とライセンス

原典: https://github.com/compcogneuro/web/blob/main/content/pbwm.md

ライセンス: Text: CC BY 4.0; code: BSD 3-Clause。このページは日本語翻訳であり、変更点は翻訳とサイト内整形です。

+++ Name = “PBWM” Categories = [“Computation”, “Neuroscience”] bibfile = “ccnlab.json” +++ PBWM (前頭前皮質、大脳基底核の作業記憶) モデル ([[@OReillyFrank06]]) は、[[LSTM]] 計算モデルのような ゲート メカニズムが、脳間の興奮性ループに対する [[basal ganglia]] の脱抑制性 (調節的、乗法的) 影響からどのように生じるかを示しています。 [[thalamus]] および [[prefrontal cortex]]。このモデルは、LSTM で使用される信じられない [[error backpropagation]] メカニズムとは対照的に、位相的 [[dopamine]] 信号がどのようにして生物学的に妥当な方法でこのゲート機能を訓練できるのかも示しました。

{id=”figure_pbwm” style=”高さ:25em”} PBWM システムのアーキテクチャ。PFC は脳の残りの部分の感覚運動処理を制御するトップダウンバイアスを提供し、大脳基底核 (BG) は PFC タスク/目標表現の動的ゲートを駆動します。次に、BG は、成功したタスクのパフォーマンスに基づいて、段階的なドーパミン信号を介してトレーニングされます。

[[#figure_pbwm]] は PBWM システムのアーキテクチャを示しており、各コンポーネントが明確に定義された機能を提供し、学習された刺激と反応の関連付けに関連して、行動に対する動的形式の認知制御を生成します。

大脳基底核における動的なゲートシステムの必要性が生じるのは、PFC のような堅牢なメンテナンスシステムが、新しい情報のエンコードと既存の情報の堅牢な維持を同時に更新できないためです。堅牢なメンテナンスができるように調整されていれば、新しい情報に惑わされることはありません。新しい情報をエンコードするために迅速に更新できるように調整されている場合、既存の情報は堅牢に維持されません。

これは基本的なトレードオフであり、迅速な更新と堅牢なメンテナンスの間でチューニングを迅速に切り替えることができる動的変調制御信号によって判断する必要があります。

PBWM の制限

PBWM フレームワークには多くの制限があり、新しい [[Axon]] および [[Rubicon]] モデルで対処されています。

学習能力には限界があります。標準的な [[reinforcement learning]] メカニズムのようなものを介して BG ゲート信号をトレーニングするための相性ドーパミンへの依存は、特に問題空間の次元が増加するにつれて (つまり、[[curse of dimensionality]])、非常に非効率的になります。これは本質的に、いつ更新するか、いつ維持するかについて [[search]] の連続した試行錯誤に相当しますが、次元の増加に合わせて拡張できるのは、専用の並列、勾配ベースの学習メカニズムだけです。
きめの細かいゲート信号は信じられず、非実用的です。 LSTM モデルには通常、個別のメモリユニットごとに個別の入力ゲートと出力ゲートがあり、非常にきめ細かいレベルの制御が可能です。 PBWM は、PFC ユニットのより大きなプールまたはストライプがすべて共通のゲートセットによって制御され、これが生物学的パラメーターとより一致すると仮定しました。しかし、PFC への関連する視床の接続は比較的広範囲かつ拡散しているようであり、これはきめ細かいレベルの制御と一致しません。さらに、よりきめの細かい制御信号は、より多くの独立した自由度を生み出すため、次元学習問題の呪いを悪化させます。

これらの制限は、現在の [[Axon]] および [[Rubicon]] モデルで次のように対処されています。

PFC の目標駆動領域 (つまり、げっ歯類の PFC のほとんど) は、腹側および内側 BG 領域によって駆動される共通の目標関与ゲート信号によってすべて更新されます。これらの信号は、PFC のすべての分散目標領域にわたって広範な接続を提供する MD (背側) 視床を調節します。この低次元信号は、複数の関連する次元にわたる事前学習と、すべての目標 PFC 領域間の双方向 [[constraint satisfaction]] を活用して最適化された選択を行う、慎重な目標選択プロセスのコンテキストで学習されます。位相ゲート信号を駆動するための [[acetylcholine]] および [[dopamine]] を介した広範な神経調節サポートがあります。
関与した目標の影響下で運動行動の実行に関与する PFC および前頭新皮質の運動野は、視床の肺核が [[predictive learning]] で動作する方法と同様に、BG 変調視床信号を並列の段階的学習信号として使用できます。これは、PBWM で想定されているシリアルゲートのような機能ではなく、強力な段階的並列 BG 学習メカニズムに基づいて構築されています。

TODO: PTP は、AM、VA/VM からの BG ゲーティングを持つ IT ニューロンに名前を変更し、予測学習を行い、ゲーティングのために視床と BG に多くの入力を提供します。 [[@ShepherdYamawaki21]]。