Resource

データ & ベンチ:まず何を使って検証するか

「データがある」だけでは足りない。規格・メタデータ・評価がセット。

Mind Uploading Research Project

Open Access Last Updated: 2026-02-10 Curated List (v0)

How To Use

このページは、「最初にどのデータで練習すればよいか」を決めるための実用リストです。まずは公開データで、同じ結果を再現できる状態(L0)を作り、その次に予測できるか・条件変更に耐えるか(L1〜L2)を確かめます。

1) まず押さえる共有基盤(置き場)

A

OpenNeuro(BIDS前提の共有)

BIDS準拠の神経計測データを共有するための基盤。EEG/MEG/fMRIなどを扱う。

Open OpenNeuro
B

PhysioNet(生体信号+評価文化)

生体信号データと関連リソースの公開基盤。EEGの定番データセットが多い。

Open PhysioNet
C

Human Connectome Project(大規模fMRI等)

公開データとツールを通じて、ヒト脳の大規模計測を提供してきた代表例。

Open HCP

2) EEGスターターパック(まずこれでL0〜L1)

以下は、使いやすさと参照の多さを重視したEEG入門用データセットの代表例です。前処理パイプラインの練習とL0〜L1到達を意識し、再現されたベースライン比較にすぐ着手できる範囲へ絞り込んでいます。

データセット 何ができるか(例) リンク
EEG Motor Movement/Imagery 運動/運動想起の分類、前処理の練習、ベースライン比較 PhysioNet
CHB-MIT Scalp EEG てんかん発作検出、イベント検出、長時間EEGの扱い PhysioNet
Sleep-EDF 睡眠段階推定、状態遷移のモデル化、縦断的変動の扱い PhysioNet
TUH EEG Corpus(大規模) スケールするEEG分類、実運用寄りの分布の難しさ、データリーク対策 TUH EEG

3) “データがある”だけで終わらせないチェックリスト

Checklist

  • 再現:取得手順、ライセンス、前処理条件、乱数、環境が書けるか
  • メタデータ:サンプリング、参照、電極配置、イベント定義、同期情報が揃うか
  • QC:ノイズ・欠損・アーティファクトが定量化されているか
  • 比較:ベースラインがあり、同じ指標で比較できるか
  • 反証:データリーク検査、反事実テスト、失敗例の記録があるか

4) Mind-Uploadで「共有できるデータ」にする最短ルート

Mind-Uploadが目指すのは、単にデータを集めることではなく、第三者が検証できる形で残すことです。 そのための最短ルートは BIDS/EEG-BIDS に寄せることです。

Verification Commons

「規格+置き場+評価」の設計図はこちら。

検証基盤を見る →