One Problem
マインドアップロード(WBE)を「夢の話」で終わらせないために、まず必要なのは共通のルールです。Mind-Uploadでは、データの置き方、評価のしかた、失敗の判定、再現手順を先にそろえて、誰でも同じ基準で確かめられる土台を作ります。
TL;DR(人間向け)
3つだけ覚える
- 主張より先に物差し:「何を満たせば前進か」を固定しないと、成果が比較できない
- データだけでも不足:規格(標準)+置き場(共有)+評価(ベンチ)がセットで必要
- WBEは特に“すり替え”が起きる:decode(相関)を emulation(生成/因果)と混同しない
このサイトで解く「1問」
問い:「何を満たせば“前進”と言えるか?」を事前に固定し、第三者が同じ入力(データ)で同じ結論(評価)に到達できる状態を作る。
Outcome
- 勝利条件の固定:クレーム階段(L0〜L5)を明示し、L1をL4のように語る“すり替え”を防ぐ
- 再現可能な入力:BIDS等の標準+メタデータで、解析対象を第三者に渡せる
- 比較可能な出力:スコア・ログ・失敗例まで含む評価スイートを公開する
- 継続運用:ベンチマーク更新、バージョン管理、監査ログで公共財を積み上げる
これは何ではないか(誤解防止)
このページは「マインドアップロードが可能/不可能」を断言する場所ではありません。Mind-Uploadが作るのは、断言が可能になるための検証基盤です(測定・評価・反証のルール)。
Mind-Upload Commons の成果物(公共財)
Data Standard(入力の固定)
BIDS/EEG-BIDSをベースに、課題・刺激・同期・QC・匿名化のメタデータを拡張し、「解析可能な形」で共有できる規格を整備する。
Benchmark Suite(出力の固定)
デコーディング(相関)だけでなく、反事実・介入予測や閉ループ安定性まで含めたタスク群を定義し、同じ物差しで比較できる状態にする。
Registry & Prereg(“やる前”の固定)
実験・解析計画を事前登録し、探索と検証を分離する。最初にテンプレート化した前提・評価指標・停止条件を提出し、更新時は差分付きで審査ログに追記して報告バイアスを下げる。
Leaderboard & Model Cards(比較の運用)
スコアだけでなく、データリーク対策、失敗例、計算資源、既知の弱点を“カード”として公開し、再現性と安全性を担保する。
具体例:1つの「比較可能な前進」はこう見える
たとえば「EEGから状態を推定するモデル」を例にすると、Commonsとして必要なのは次の4点です。
| 要素 | 最低限の中身(例) |
|---|---|
| 入力(Data) | BIDS準拠のデータ一式、計測条件、同期ログ、QCログ、匿名化/同意の範囲 |
| 手順(Code/Protocol) | 前処理→特徴→学習→評価の固定レシピ、環境情報、乱数シード |
| 出力(Metrics) | スコア(精度/不確実性/頑健性)、失敗例、ベースラインとの差分 |
| 反証(Falsification) | データリーク検査、反事実テスト、刺激条件の変更に対する予測外れの記録 |
これが揃うと「誰がやっても同じ条件で比較できる」ようになり、はじめて進捗が積み上がります。
歴史のケースワークから借りる設計
Mind-Uploadの設計は“新規発明”ではなく、他分野が既に解いてきた「検証の型」の移植です。代表例は ケースワーク集 に整理しています。
PDB(単一アーカイブ)やBIDS+OpenNeuro(規格+置き場)、PhysioNet(データ+評価)、OSF/PROSPERO(事前登録)などの型は、分野が違っても「前進を測れる」構造を作ります。WBEは特に、達成条件と反証条件を先に固定する必要があります。
実装ステータス(透明性報告)
科学的誠実さのため、各成果物の現在の実装状況を明記します。「設計文書の完成」と「実装の完了」を混同しないよう注意してください。
| 成果物 | 設計状態 | 実装状態 | 次のステップ |
|---|---|---|---|
| Data Standard | BIDS/EEG-BIDS準拠の拡張仕様を文書化済み | サンプルデータセットは未公開。バリデータ未実装。 | 1データセット分のBIDS変換パイプラインと検証スクリプトの公開 |
| Benchmark Suite | タスク定義・指標定義を文書化済み | ベンチマークコード・ベースライン結果は未公開。 | L0/L1レベルの最小ベンチマーク1セットの実装と公開 |
| Registry & Prereg | テンプレート設計済み | 登録システム未構築。テンプレートのみ文書内に記載。 | OSF連携またはGitHub Issueベースの簡易登録フローの構築 |
| Leaderboard | Model Card形式を定義済み | 実データによるエントリーなし。 | ベンチマークの実装後に最初のエントリーを登録 |
科学的ギャップ分析
Verification Commonsが「科学に貢献する」ために、以下のギャップを認識し、優先的に対処します。
優先対処事項
- L0の実現:第三者がコード・データ・環境を揃えて同じ結果を再現できる状態を最優先とする。現状、再現に必要な全構成要素を含むリポジトリは存在しない。
- 反事実テストの操作化:「反事実」「介入予測」は概念として定義されているが、具体的な実験プロトコルとしてのテスト手順は未確定。
- 既存ベンチマークとの接続:BCI Competition、MOABB等の既存ベンチマークとの互換性・差分を明確にし、車輪の再発明を避ける。
- 失敗事例の体系化:Commonsの設計にはネガティブリザルトの収集と公開が含まれるが、収集のインセンティブ設計が未着手。
検証の厳密性要件(Technical Critique対応)
Issues #64–#70 で指摘された技術的批判を受け、Verification Commonsの検証基準を以下のとおり強化します。
強化要件
- 不確実性定量化の義務化:Benchmark Suiteに提出されるすべてのESI(EEG Source Imaging)結果には、信用区間(credible intervals)または事後分布の集中度指標を必ず含めること。点推定のみではWBEグレードの検証として不十分である。
- 摂動ベース検証の標準化:同一性検証には、学習済みタスクを超えた摂動ベーステストを必須とする。
- シミュレーションTMS応答が生体脳とエミュレーション間で一致すること
- PCI-STの空間分布比較を複数の摂動部位で実施すること
- 未学習(新規)刺激に対する応答が統計的に区別不能であること
- 適応的前処理の要件:
- ASRカットオフ閾値は静的ではなく適応的とし、リーマン幾何ベースの外れ値検出を用いること
- 周波数追従型ノイズ除去にはZapLine-plusを使用すること
- 除去されたコンポーネントの空間トポグラフィをBIDS監査証跡としてログに記録すること
- 因果指標の検証スイートへの統合:
- Effective Information(EI)およびCausal Densityをコア検証指標とすること
- 有向非線形情報フローにはSymbolic Transfer Entropy(STE)を用いること
- Pearlの因果階梯(観察→介入→反事実)を評価フレームワークとすること
因果的摂動スイート(Causal Perturbation Suite)
Issues #251・#254 を踏まえ、標準的な行動テストを超えてWBE同一性を検証するベンチマークとして「因果的摂動スイート(Causal Perturbation Suite)」を定義します。単なる出力の一致ではなく、摂動に対する応答構造の等価性を検証するテスト群です。
三つのテストカテゴリ
- 1. シミュレーションTMS応答の一致:仮想摂動(virtual perturbation)を印加し、生物学的脳とエミュレーション間のEEG応答パターンを比較する。複数摂動部位での応答伝播の統計的一致を検証する。
- 2. 薬理学的介入シミュレーション:麻酔・薬物効果の伝播をモデル化し、生体脳における実測データと比較する。状態遷移(覚醒↔鎮静など)のパターン再現性を検証する。
- 3. 新規・極端刺激応答:学習中に一度も見せていない新規・極端刺激に対する応答を比較し、KLダイバージェンスを用いた分岐パターンの違いを評価する。
PCI-ST空間分布比較、パーシステンス図のBottleneck distance、生成モデル間距離のFisher Information Metric (FIM) を採用する。反事実等価性については Laukkonen et al. (2025) を参照する。
熱力学的検証要件(Thermodynamic Verification Requirements)
Issues #251・#254 に基づき、NESS(非平衡定常状態)およびEPR(エントロピー生成速度)の観点から熱力学指標を検証スイートに組み込みます。
必須要件
- 熱力学指標の報告義務:ベンチマークへのエミュレーション提出物は、必ず熱力学関連指標を報告すること。既存の情報論的指標を補完する。
実証的EPR測定
- 下界エントロピー生成速度:EEG時系列を用い、時間反転対称性の破れ(time-reversal asymmetry)に基づいてエントロピー生成速度の下界を推定する(Lynn et al., 2021, PNAS; Ishihara & Shimazaki, 2025, Nature Communications)。
エネルギー効率の比較
- 仮想エネルギー流の比率:エミュレーションの仮想エネルギー流と、生物学的脳の約20Wとの比を算出し、効率性を比較する。
- 通信 vs 計算のエネルギー比:Niven & Laughlin (2008) に従い、大脳皮質において通信コストが計算コストの約35倍となる点を考慮し、エミュレーション設計の評価に反映する。
これらの熱力学指標は、既存の情報論的指標(Effective Information、Causal Density 等)を補完する。同一性検証において、非平衡熱力学の観点を欠いた主張は不十分とみなす。
参考文献(主要)
- Gorgolewski, K. J., et al. (2016). BIDS. doi:10.1038/sdata.2016.44
- Pernet, C. R., et al. (2019). EEG-BIDS. doi:10.1038/s41597-019-0104-8
- Markiewicz, C. J., et al. (2021). OpenNeuro resource paper. doi:10.7554/eLife.71774
- Goldberger, A. L., et al. (2000). PhysioBank/PhysioNet. doi:10.1161/01.CIR.101.23.e215
- Nosek, B. A., et al. (2015). Promoting an open research culture. doi:10.1126/science.aab2374
- Jayaram, V., & Barachant, A. (2018). MOABB: BCI benchmark framework. doi:10.1088/1741-2552/aaddc8
- Wilkinson, M. D., et al. (2016). The FAIR Guiding Principles. doi:10.1038/sdata.2016.18