How To Use
このページは、「最初にどのデータで練習すればよいか」を決めるための実用リストです。まずは公開データで、同じ結果を再現できる状態(L0)を作り、その次に予測できるか・条件変更に耐えるか(L1〜L2)を確かめます。
1) まず押さえる共有基盤(置き場)
A
B
C
2) EEGスターターパック(まずこれでL0〜L1)
以下は、使いやすさと参照の多さを重視したEEG入門用データセットの代表例です。前処理パイプラインの練習とL0〜L1到達を意識し、再現されたベースライン比較にすぐ着手できる範囲へ絞り込んでいます。
| データセット | 何ができるか(例) | リンク |
|---|---|---|
| EEG Motor Movement/Imagery | 運動/運動想起の分類、前処理の練習、ベースライン比較 | PhysioNet |
| CHB-MIT Scalp EEG | てんかん発作検出、イベント検出、長時間EEGの扱い | PhysioNet |
| Sleep-EDF | 睡眠段階推定、状態遷移のモデル化、縦断的変動の扱い | PhysioNet |
| TUH EEG Corpus(大規模) | スケールするEEG分類、実運用寄りの分布の難しさ、データリーク対策 | TUH EEG |
3) “データがある”だけで終わらせないチェックリスト
Checklist
- 再現:取得手順、ライセンス、前処理条件、乱数、環境が書けるか
- メタデータ:サンプリング、参照、電極配置、イベント定義、同期情報が揃うか
- QC:ノイズ・欠損・アーティファクトが定量化されているか
- 比較:ベースラインがあり、同じ指標で比較できるか
- 反証:データリーク検査、反事実テスト、失敗例の記録があるか
4) Mind-Uploadで「共有できるデータ」にする最短ルート
Mind-Uploadが目指すのは、単にデータを集めることではなく、第三者が検証できる形で残すことです。 そのための最短ルートは BIDS/EEG-BIDS に寄せることです。