Platform

検証基盤:Mind Uploading Verification Commons

PDB×BIDS×PhysioNet×OSFの発想で、WBEの“勝利条件”と“再現可能な前進”を作る

Mind Uploading Research Project

Open Access Last Updated: 2026-02-10 Operational Specification

One Problem

マインドアップロード(WBE)を「夢の話」で終わらせないために、まず必要なのは共通のルールです。Mind-Uploadでは、データの置き方、評価のしかた、失敗の判定、再現手順を先にそろえて、誰でも同じ基準で確かめられる土台を作ります。

TL;DR(人間向け)

3つだけ覚える

  • 主張より先に物差し:「何を満たせば前進か」を固定しないと、成果が比較できない
  • データだけでも不足:規格(標準)+置き場(共有)+評価(ベンチ)がセットで必要
  • WBEは特に“すり替え”が起きる:decode(相関)を emulation(生成/因果)と混同しない

このサイトで解く「1問」

問い:「何を満たせば“前進”と言えるか?」を事前に固定し、第三者が同じ入力(データ)で同じ結論(評価)に到達できる状態を作る。

Outcome

  • 勝利条件の固定:クレーム階段(L0〜L5)を明示し、L1をL4のように語る“すり替え”を防ぐ
  • 再現可能な入力:BIDS等の標準+メタデータで、解析対象を第三者に渡せる
  • 比較可能な出力:スコア・ログ・失敗例まで含む評価スイートを公開する
  • 継続運用:ベンチマーク更新、バージョン管理、監査ログで公共財を積み上げる

これは何ではないか(誤解防止)

Non-goals

このページは「マインドアップロードが可能/不可能」を断言する場所ではありません。Mind-Uploadが作るのは、断言が可能になるための検証基盤です(測定・評価・反証のルール)。

Mind-Upload Commons の成果物(公共財)

01

Data Standard(入力の固定)

BIDS/EEG-BIDSをベースに、課題・刺激・同期・QC・匿名化のメタデータを拡張し、「解析可能な形」で共有できる規格を整備する。

BIDSEEGMetadataQC
02

Benchmark Suite(出力の固定)

デコーディング(相関)だけでなく、反事実・介入予測閉ループ安定性まで含めたタスク群を定義し、同じ物差しで比較できる状態にする。

CounterfactualInterventionClosed-loop
03

Registry & Prereg(“やる前”の固定)

実験・解析計画を事前登録し、探索と検証を分離する。最初にテンプレート化した前提・評価指標・停止条件を提出し、更新時は差分付きで審査ログに追記して報告バイアスを下げる。

PreregistrationProtocolAudit
04

Leaderboard & Model Cards(比較の運用)

スコアだけでなく、データリーク対策、失敗例、計算資源、既知の弱点を“カード”として公開し、再現性と安全性を担保する。

LeaderboardReproducibilitySafety

具体例:1つの「比較可能な前進」はこう見える

たとえば「EEGから状態を推定するモデル」を例にすると、Commonsとして必要なのは次の4点です。

要素 最低限の中身(例)
入力(Data) BIDS準拠のデータ一式、計測条件、同期ログ、QCログ、匿名化/同意の範囲
手順(Code/Protocol) 前処理→特徴→学習→評価の固定レシピ、環境情報、乱数シード
出力(Metrics) スコア(精度/不確実性/頑健性)、失敗例、ベースラインとの差分
反証(Falsification) データリーク検査、反事実テスト、刺激条件の変更に対する予測外れの記録

これが揃うと「誰がやっても同じ条件で比較できる」ようになり、はじめて進捗が積み上がります。

歴史のケースワークから借りる設計

Mind-Uploadの設計は“新規発明”ではなく、他分野が既に解いてきた「検証の型」の移植です。代表例は ケースワーク集 に整理しています。

移植のコツ

PDB(単一アーカイブ)やBIDS+OpenNeuro(規格+置き場)、PhysioNet(データ+評価)、OSF/PROSPERO(事前登録)などの型は、分野が違っても「前進を測れる」構造を作ります。WBEは特に、達成条件反証条件を先に固定する必要があります。

実装ステータス(透明性報告)

率直な現状

科学的誠実さのため、各成果物の現在の実装状況を明記します。「設計文書の完成」と「実装の完了」を混同しないよう注意してください。

成果物 設計状態 実装状態 次のステップ
Data Standard BIDS/EEG-BIDS準拠の拡張仕様を文書化済み サンプルデータセットは未公開。バリデータ未実装。 1データセット分のBIDS変換パイプラインと検証スクリプトの公開
Benchmark Suite タスク定義・指標定義を文書化済み ベンチマークコード・ベースライン結果は未公開。 L0/L1レベルの最小ベンチマーク1セットの実装と公開
Registry & Prereg テンプレート設計済み 登録システム未構築。テンプレートのみ文書内に記載。 OSF連携またはGitHub Issueベースの簡易登録フローの構築
Leaderboard Model Card形式を定義済み 実データによるエントリーなし。 ベンチマークの実装後に最初のエントリーを登録

科学的ギャップ分析

Verification Commonsが「科学に貢献する」ために、以下のギャップを認識し、優先的に対処します。

優先対処事項

  • L0の実現:第三者がコード・データ・環境を揃えて同じ結果を再現できる状態を最優先とする。現状、再現に必要な全構成要素を含むリポジトリは存在しない。
  • 反事実テストの操作化:「反事実」「介入予測」は概念として定義されているが、具体的な実験プロトコルとしてのテスト手順は未確定。
  • 既存ベンチマークとの接続:BCI Competition、MOABB等の既存ベンチマークとの互換性・差分を明確にし、車輪の再発明を避ける。
  • 失敗事例の体系化:Commonsの設計にはネガティブリザルトの収集と公開が含まれるが、収集のインセンティブ設計が未着手。

検証の厳密性要件(Technical Critique対応)

Issues #64–#70 で指摘された技術的批判を受け、Verification Commonsの検証基準を以下のとおり強化します。

強化要件

  • 不確実性定量化の義務化:Benchmark Suiteに提出されるすべてのESI(EEG Source Imaging)結果には、信用区間(credible intervals)または事後分布の集中度指標を必ず含めること。点推定のみではWBEグレードの検証として不十分である。
  • 摂動ベース検証の標準化:同一性検証には、学習済みタスクを超えた摂動ベーステストを必須とする。
    • シミュレーションTMS応答が生体脳とエミュレーション間で一致すること
    • PCI-STの空間分布比較を複数の摂動部位で実施すること
    • 未学習(新規)刺激に対する応答が統計的に区別不能であること
  • 適応的前処理の要件:
    • ASRカットオフ閾値は静的ではなく適応的とし、リーマン幾何ベースの外れ値検出を用いること
    • 周波数追従型ノイズ除去にはZapLine-plusを使用すること
    • 除去されたコンポーネントの空間トポグラフィをBIDS監査証跡としてログに記録すること
  • 因果指標の検証スイートへの統合:
    • Effective Information(EI)およびCausal Densityをコア検証指標とすること
    • 有向非線形情報フローにはSymbolic Transfer Entropy(STE)を用いること
    • Pearlの因果階梯(観察→介入→反事実)を評価フレームワークとすること

因果的摂動スイート(Causal Perturbation Suite)

Issues #251・#254 を踏まえ、標準的な行動テストを超えてWBE同一性を検証するベンチマークとして「因果的摂動スイート(Causal Perturbation Suite)」を定義します。単なる出力の一致ではなく、摂動に対する応答構造の等価性を検証するテスト群です。

三つのテストカテゴリ

  • 1. シミュレーションTMS応答の一致:仮想摂動(virtual perturbation)を印加し、生物学的脳とエミュレーション間のEEG応答パターンを比較する。複数摂動部位での応答伝播の統計的一致を検証する。
  • 2. 薬理学的介入シミュレーション:麻酔・薬物効果の伝播をモデル化し、生体脳における実測データと比較する。状態遷移(覚醒↔鎮静など)のパターン再現性を検証する。
  • 3. 新規・極端刺激応答:学習中に一度も見せていない新規・極端刺激に対する応答を比較し、KLダイバージェンスを用いた分岐パターンの違いを評価する。
評価指標

PCI-ST空間分布比較、パーシステンス図のBottleneck distance、生成モデル間距離のFisher Information Metric (FIM) を採用する。反事実等価性については Laukkonen et al. (2025) を参照する。

熱力学的検証要件(Thermodynamic Verification Requirements)

Issues #251・#254 に基づき、NESS(非平衡定常状態)およびEPR(エントロピー生成速度)の観点から熱力学指標を検証スイートに組み込みます。

必須要件

  • 熱力学指標の報告義務:ベンチマークへのエミュレーション提出物は、必ず熱力学関連指標を報告すること。既存の情報論的指標を補完する。

実証的EPR測定

  • 下界エントロピー生成速度:EEG時系列を用い、時間反転対称性の破れ(time-reversal asymmetry)に基づいてエントロピー生成速度の下界を推定する(Lynn et al., 2021, PNAS; Ishihara & Shimazaki, 2025, Nature Communications)。

エネルギー効率の比較

  • 仮想エネルギー流の比率:エミュレーションの仮想エネルギー流と、生物学的脳の約20Wとの比を算出し、効率性を比較する。
  • 通信 vs 計算のエネルギー比:Niven & Laughlin (2008) に従い、大脳皮質において通信コストが計算コストの約35倍となる点を考慮し、エミュレーション設計の評価に反映する。
位置づけ

これらの熱力学指標は、既存の情報論的指標(Effective Information、Causal Density 等)を補完する。同一性検証において、非平衡熱力学の観点を欠いた主張は不十分とみなす。

参考文献(主要)

  1. Gorgolewski, K. J., et al. (2016). BIDS. doi:10.1038/sdata.2016.44
  2. Pernet, C. R., et al. (2019). EEG-BIDS. doi:10.1038/s41597-019-0104-8
  3. Markiewicz, C. J., et al. (2021). OpenNeuro resource paper. doi:10.7554/eLife.71774
  4. Goldberger, A. L., et al. (2000). PhysioBank/PhysioNet. doi:10.1161/01.CIR.101.23.e215
  5. Nosek, B. A., et al. (2015). Promoting an open research culture. doi:10.1126/science.aab2374
  6. Jayaram, V., & Barachant, A. (2018). MOABB: BCI benchmark framework. doi:10.1088/1741-2552/aaddc8
  7. Wilkinson, M. D., et al. (2016). The FAIR Guiding Principles. doi:10.1038/sdata.2016.18