リソース

データとハンズオン: どこから始めて、どのようにして L0 に到達するか

「`what to use'' and `「再現方法」」を分けずに最短ルートで接続します。

マインドアップロード研究プロジェクト

公開ページ 更新日: 2026-04-04 厳選されたリスト + L0 Practice (EEG レコーディング フレーム コントラクト同期で更新)

このページの使い方

迷わないために最初に読んでください

このページは、「`Which public data should I start validation with first?'' and `「L0 再現性解析を行うにはどうすればよいですか?」の両方に 1 か所で答える実践的なガイドです。データセット名のリストにとどまりません。 BIDS、QC、分割、ベースラインを 1 つのパスで接続します。

  • 最初に共有インフラストラクチャを見て、次にスターター データセットを見ていきます。
  • スターター データは L0 ~ L1 の練習用ボードであり、EEG ソース イメージングのグラウンド トゥルースではありません。
  • このページでは、維持状態ルートのコンポーネント追加 / アブレーション ラダーも修正されているため、グリア基質ルーティング、星状細胞状態、神経血管 / BBB、およびクリアランス増強が、1 つのマルチモーダル ブーストに積み上げられるのではなく、指定されたニューロン優先ベースラインと比較されます。
詳細な注意点を 18 件読む
  • 同じ主題のサポート状態バンドルは自己解釈型として扱われなくなりました。ルート クラス、有効ウィンドウ、数量ブリッジ、共通ドライバー監査、欠落ポリシー、不一致トポロジ、再現性、転送ウィンドウ、および棄権が実用的なフィールドとして固定されました。
  • 直接検証データの内部であっても、刺激のグラウンドトゥルース、同時侵襲的記録、および手術後の結果は、異なる証拠クラスです。
  • 公正な逆問題ベンチマークでは、勝利する方法だけを指定するのではなく、焦点中心とソース範囲のターゲット、逆ファミリ、不確実性オブジェクト、モンタージュ / カバレッジ ポリシー、およびジオメトリ / 導電率の感度を分離する必要もあります。
  • 高密度だけが意味のあるルートではありません。ターゲット密度および DeepSIF のような低密度 ESI は、有界レジームで動作できますが、ゲインは依然としてソルバー、ジオメトリ、およびソース レジームによって条件付けされます。
  • 各スターター データセットには、異なるアノテーション来歴、時間忠実度、および独立した分割ユニットがあります。
  • セッション内 / セッション間 / 被験者間 / 適応は異なる評価ファミリーであり、同じスコアの下に並べて配置すべきではありません。
  • ベンチマーク名はまだ粗すぎます。予測オブジェクト、独立した予測ユニット、ホールドアウト ユニット、適応レジーム、運用予算はすべて、同じスコアの意味を変える可能性があります。
  • メトリクスのセマンティクスはタスクに依存します。不均衡なタスクやまれなイベントのタスクでは、精度や AUROC だけではイベントの感度、誤ったアラーム、少数クラスの障害、またはキャリブレーションを修正できません。
  • クロスセッションラベルとアダプテーションラベルはまだ一時的な有効性を主張するものではありません。状態アノテーションは現在、高速ラベルと低速内部環境開示に分割されており、固定デコーダ間隔、再校正負荷、および転送上限は依然として個別に開示する必要があります。
  • クロック ドメイン、ストリーム アライメント、デジタル トリガ キャプチャ、物理出力オンセット、および制御されていない応答タイミングは、1 つの同期フィールドではなく、異なるタイミング検証クラスです。
  • スコアが数値的に同じであっても、ターゲットの神経変数を眼球運動、筋電図、行動、フィードバックルート、被験者/セッションのフィンガープリント、部位/デバイス/参照/電極レイアウトなどの取得分配ショートカットから分離する必要があります。
  • 基礎/自己教師ありEEGモデルが使用される場合でも、事前トレーニングコーパス、座標ルート/参照ファミリー、省略されたチャネル、およびラベルバジェットの監査が依然として必要です。
  • データセットが `harmonized` として記述されている場合でも、共通チャネルの交差、ターゲット モンタージュへの補間、および REST ベースの変換は、1 つのベンチマーク オブジェクトではなく、異なる記録フレーム ブランチのままです。
  • 公式のチャレンジ ルール、提出の制約、およびその後の事後分析により、ベンチマーク スコアの意味が変わる可能性があるため、ベンチマークの来歴は管理上の詳細ではなく、データセット/ベンチマーク カードの一部となります。
  • BIDS raw レイアウト、BIDS デリバティブ / リネージ、ワークフロー レシピ、ベンチマーク ハーネス、ベンチマーク ガバナンス スナップショット、およびランタイム ピンは、異なる再現性レイヤーです。データセットとツールのみの名前付けは粗すぎるままです。
  • 参照システム、チャネル マップ、電極レイアウト、およびデバイス プロトコルは、表面的なメタデータではありません。スコアを移動したり、データセット カードに属することができます。
  • 最終的な目標は、第三者が同じ条件で結果を再実行できるようにすることです。
  • L0 アーティファクト パックは、このページのより厳格なサイト ルールに従います。イベントの忠実度、ラベルの来歴、取得と配布の概要、派生系統、および停止要求が、バージョン/BIDS/QC/スプリット/ベースラインとともに必要となります。
対象読者
どの公開データから始めようか迷っている人、L0の練習板を探している人
読了時間
12~20分
正確性に関する注記
ここにリストされているデータセットはエントリ候補です。使いやすさや再現性の観点から記載したものであり、WBE の課題をすべて網羅しているわけではありません。

現段階で比較的明確なこと

現在わかっていること

  • 公開 EEG データは、L0 想起分析と L1 ベースラインの練習に役立ちます。
  • 初めてデータを選択するときは、難易度よりもやり直しのしやすさを優先すると先に進みます。
  • スターター EEG データセットは依然としてニューロン優先のベースラインです。メンテナンス状態の主張には、ペアになったサポート状態データまたは調整されたプロキシ ログ、一度に 1 つのファミリーの拡張、および最も強力な単一行とバンドルの比較が必要です。
残り 19 件を見る
  • グリア基質ルーティングとアストロサイト状態は異なる拡張ファミリーです。名前付きアストロサイトオブザーバブルはサプライヤー細胞/ニューロンシンク/燃料オブジェクトを固定せず、グリア燃料サポートルート自体はアストロサイトアンサンブルを識別しません。
  • 同じサブジェクトのサポート状態バンドルでも、共通のドライバー、小さな完全なケースのスライス、および反対符号の行が混在する可能性があるため、独自の拡張カードがなければ、このサイトではファミリー分割拡張は強く認識されません。
  • キューロックイベント、専門家によるインターバル注釈、睡眠催眠計画、医師のレポート由来のラベルは、同じ「公開脳波データ」であっても、異なる意味を持ちます。
  • 同じ精度であっても、どの汎化条件でスコアを取得したかによって、読み取れる主張の強さが変わります。
  • 同じベンチマーク名でも、異なる予測オブジェクト、独立したユニット、グループ化されたホールドアウト ユニット、適応レジーム、および推論バジェットを隠すことができます。
  • クラス不均衡または稀なイベントのタスクの場合は、タスクに一致するメトリクス バンドルが必要です。つまり、1 つのヘッドライン番号ではなく、イベントの感度と発作タスクの誤警報、および睡眠ステージングのマクロ / ステージごとの一致です。
  • クロスセッション精度とクロスセッション適応は、固定デコーダが生き残ったかどうか、どの程度の再キャリブレーションが必要か、またはどの程度の転送上限が残っているかをまだ示していません。
  • 同じタスクとデコーダ ウィンドウは、異なる遅い内部環境環境下でも実行できるため、`state annotation` は移動、覚醒、またはセッション ID だけによって使い果たされることはありません。
  • `events.tsv` または `LSL` のみを示すデータセット カードでは、タイミングが保存データ、トリガー、物理出力、または非制御応答レベルでチェックされたかどうかは未解決のままです。
  • 同日のスコアは、ターゲット信号ではなく、動き / EOG / EMG / フィードバック ルート、被験者 / セッションのフィンガープリント、または取得と配信のショートカットを反映する場合があります。
  • 基礎モデルの改善は、事前トレーニング コーパス、チャネル不一致の処理、取得と配信の概要、および適応レジームが開示されない限り比較できません。
  • ベンチマーク名だけでは十分ではありません。バージョン、分割/ランダム化ルール、非表示グループ化、追加データ ポリシー、事前トレーニング済みチェックポイント ポリシー、および推論段階の制限はすべて、スコアの意味を変更する可能性があります。
  • データセットまたはパイプライン名だけではまだ十分ではありません。生のレイアウト、派生リネージュ、ワークフロー レシピ、およびランタイム ピンはそれぞれ、結果の意味を変更できます。
  • 基準システム、デバイス、電極レイアウト、フィルター チェーンによって、同じ EEG ベンチマークに見えるものが変化する可能性があります。
  • スターター データのみで、個々の MRI や侵襲的なグラウンド トゥルースがないため、ESI の精度が向上したと強く主張することはできません。
  • ソースイメージングの段階 C では、刺激のグラウンド トゥルース、同時 SEEG、および臨床結果が同じエラーの質問に答えないため、名前付き検証クラスが依然として重要です。
  • 低密度またはターゲット密度の ESI は、境界領域では科学的に意味がある可能性がありますが、結果を HD-EEG と比較したり、ポータブルとして扱ったりする前に、モンタージュ設計、ジェネレーターの深さ/方向、および検証クラスを宣言する必要があります。
  • 逆問題の主張の場合、同じ生データではまだ十分ではありません。ソルバー ファミリを比較する前に、同じヘッド モデル、同じ前処理、同じソース レジーム、同じ逆ファミリ/ターゲット オブジェクト、および感度レポートも必要です。
  • L0 では、再利用可能なアーティファクト パックには、バージョン/BIDS/QC/スプリット/ベースラインだけでなく、イベントの忠実度、ラベルの来歴、ホールドアウトの祖先、取得と配布の概要、派生系統、および停止要求も必要になりました。

ここから先でまだ未解決のこと

まだわかっていないこと

  • スターター データセットだけでは WBE のすべての問題を解決できません。
  • 将来の因果関係/閉ループ検証にどのデータが最も効果的であるかはまだ決定していません。
  • どの公開データがアノテーション忠実度ベンチマークのデフォルト ルートになるかはまだ決定していません。
残り 4 件を見る
  • 同じモンタージュ/ジオメトリ制御および不確実性スイープの下で、焦点中心とソース範囲の逆法を比較するためのデフォルトとなる公開ベンチマーク ボードをまだ決定していません。
  • 状態の注釈、固定デコーダ間隔、再調整負荷、および 1 つの共有時間的有効性スキーマの下での転送上限を記録するデフォルトの公開 EEG ベンチマークはまだありません。
  • 迅速なラベルと遅い内部環境の開示を 1 つの一時的有効性に関する補遺の中にまとめて凍結する共有のパブリック テンプレートはまだありません。
  • 1 つの共有欠損と共通ドライバー監査の下で、ニューロン優先のベースライン、ファミリー分割サポート状態の拡張、および最強の単一行とバンドルの比較を共同で修正するデフォルトのパブリック データセット バンドルはまだありません。

使用方法

このページは、最初にどのデータを使用して練習するかを決定するのに役立つ実用的なリストです。まず、公開データを使って同じ結果を再現できる状態(L0)を作り、状況の変化を予測して耐えられるかどうかを確認します(L1~L2)。

選択基準

最初にデータを選ぶ際には、非常に難しいデータではなく、手順や結果が他人にとって分かりやすいデータを選ぶことが大切です。最初からすべてを目指すのではなく、再現しやすい公開データを使って最小のループを作るのが近道です。

このページがどこに当てはまるかを知りたい場合

このページは、どこから開始するか、最小 L0 ループを完了する方法を決定するための実用的なエントリ ポイントです。 検証プラットフォームは進捗としてカウントされる内容を処理し、検証プラットフォーム</a>内のケースワークセクションは他の分野の例を処理します。実践的なページがサイトの他の部分とどのように異なるのかについての 1 ページのガイドが必要な場合は、Wiki: 実践的なページを読むためのガイド を参照してください。 </p> </div>

このページだけで完結したい場合

古い hands_on.md の最小限のループ プロシージャがこのページに統合されました。したがって、データ選択後に別のページに移動することなく、L0 スケルトン、QC、ベースライン、完了条件まで直接読むことができます。

データセットからマインド アップロードの質問に戻る RQ ごとのルートが必要な場合

このページは実用的なデータポータルであり、完全な研究課題マップではありません。ここのデータセット バケットから、特定のマインド アップロード研究の質問、固定された EEG 対応の主張、助成金対応のテーマに移行したい場合は、現在の公開 6 つの RQ 概要 から始めて、RQ60 EEG 実現可能性ページRQ ごとの詳細書類助成金とデータセットのプレイブック現在の資金候補リスト

やりたいこと 最初のデータ
前処理と分類の基礎を練習したい 脳波運動/画像 は簡単に入力できます。問題設定が比較的分かりやすいので、L0~L1の練習に適しています。
長期的なデータやイベントの検出を体験したい CHB-MIT が適切です。ノイズ、長時間録音、イベント検出の処理を一緒に練習できます。
状態遷移を扱いたい Sleep-EDF が適切です。時間の経過とともに状態がどのように変化するかを学ぶのに役立ちます。
大規模データの難しさを知りたい TUH EEG も候補です。ただし、最初のデータセットとしては重いため、最初の 3 つに慣れておく方が安全です。
最初にデータを選択するときに過度の期待をしないでください

スターター データセットは、すべての WBE 問題を一度に解決することを目的としたものではありません。ここで最初に取得したいのは、再現可能な入力組織QC 習慣ベースライン比較 です。同一性や因果的同一性などの長所は、現段階のデータだけでは解決できません。

公開データセットのルートを控えめにしてください

この公開ページは入門レベルにとどまります。 1 つの未解決の質問が EEG 対応ワーク パッケージに積極的に変換されている場合、固定 Dxx + DOI アンカー、ファーストパス KPI、停止ルールなどのより強力なルーティングの詳細は、公開の結論としてここで宣伝されるのではなく、Wiki に保持されます。現在の 1 問ずつのパッケージが必要な場合は、現在の公開 6 つの RQ 概要RQ60 EEG 実現可能性ページ、および RQ ごとの詳細文書 を使用してください。

精度よりも先に見る

データセットの紹介を読むと、すぐに「どのようなスコアが達成されたのか?」というところに飛びつきたくなります。最初の質問は、トレーニング/テスト分割ユニットは何か漏れがチェックされたかどうか結果が単純なベースラインと比較されたかどうかです。これがまだ不明な場合は、最初にWiki: データ分割とデータ漏洩 をお読みください。

スコアが同じでも汎化条件が違えば意味が変わる

MOABB は、within-sessioncross-session、および cross-subject を別個の評価ファミリーとして扱います。つまり、同じ70%であっても、「同日・同じ人・同じ段取り」で得られる70%と、「別の日」「別の人」でホールドアウトして得られる70%では、異なる成果となるのです。まず短期的な状態変動と長期的なドリフトを整理したい場合は、Wiki: state/trait/drift もご覧ください。

データ名の前にラベルの来歴を参照

同じ「公開脳波データ」であっても、キューロックアノテーションチャンネルエキスパートインターバルアノテーション一夜催眠医師レポート由来では比較の意味が異なります。ラベル。したがって、このページでは、データセット名に加えて、ラベルの由来いつの粒度分割の独立単位とみなされているものを必ず含めてください。

L0 で何を買えばいいのか迷ったとき

データ名だけを決めても、入稿形式があいまいだと行き詰まってしまいがちです。 BIDS、バリデーター、QC ログ、分割ルール、ベースライン、実行ステップ、および失敗例を 1 ページで確認したい場合は、Wiki: Minimum L0 アーティファクト パック を参照してください。

EEG から L0 までの順序全体を 1 つの直線で表示したい場合

EEG入門後、このページでデータを選択し、L0練習編で一周し、VerificationでL0であることを確認する流れを見たい場合は、Wiki:EEGからL0への直線パスをご覧ください。

生の脳波検査では不十分

波形ファイルが公開されていても、イベント定義刺激ログ時刻同期不良チャンネル/不良セグメント記録が弱いと、後で再度比較するのが困難になります。さらに、2026-03 年の再監査では、`events.tsv` があるだけではイベント セマンティクスは修正されず、LSL があるだけではハードウェア遅延は監査できないことをサイト ルールに追加しました。この点を最初から理解したい場合は、Wiki: イベント同期の基礎と観測ログ を最初に参照してください。

イベント忠実度カードが必要になりました

将来のデータセット カードには、少なくとも (1) オンセット / 期間 / サンプル(2) クロック ドメインとストリーム アライメント ルール(3) 格納データ アンカー/デジタル トリガー/物理オンセット/非制御応答テストなどのタイミング検証クラス(4) trial_type、HED、スコアリング ルールなどのイベント セマンティクス(5) 来歴 / スコアラー / レポート使用フラグ(6) 独立した分割ユニット、および(7) 明確な停止要求。これらのフィールドのないカードは、再利用可能な L0 ガイドとしては不十分です。

BIDS、デリバティブ、パイプライン、OpenNeuro、およびベンチマークは同じではありません

BIDS は生データ標準であり、BIDS Derivatives は処理された出力リネージュを明示的に保ち、OpenNeuro と PhysioNet はストレージ領域、Validator は正式なチェック、MNE-BIDS はローダー、MNE-BIDS-Pipeline または BIDS App はワークフロー レシピ、Benchmark は比較ルールです。この役割の違いを最初から整理したい場合は、Wiki: Standards/Repositories/Validators/Benchmarks をご利用ください。

将来の拡張計画

開始するには EEG ベースの開始データセットで十分ですが、後で空間情報または構造情報を追加することが必要になる場合があります。まず EEG に何を追加できるかを計画したい場合は、Wiki: マルチモーダル統合の基礎 を参照してください。

グリア、アストロサイト、またはクリアランス変数を追加すると結果が本当に変わるかどうかをテストしたい場合

このページには実際的な弱点が 1 つありました。再現可能なニューロン優先 EEG ベースラインの構築方法が説明されていましたが、maintenance-state / support-state 変数を追加することで予測、安定性、または説明が変わるかどうかをテストするための公開ルールがまだ欠けていました。現在の主要な文献は、1 つの圧縮された support-variable バケットをサポートしていません。 ケイヒルら。 (2024)ウィリアムソンら。 (2025)出羽ら。 (2025)Bukalo et al. (2026) は、分単位のネットワーク エンコーディング、リコール、複数日間の安定化、および恐怖状態のサポートにわたる、明確な astrocyte-state ルートを鮮明にします。対照的に、スズキら。 (2011)Silva 他。 (2022)Pavlowsky 他。 (2025)グレダら。 (2025)グリア基質ルーティング__は、乳酸サポート、飢餓下でのケトン体サポート、学習関連脂肪酸ルーティング、およびグルコース制限下でのapoE/ソルチリン依存性脂質送達を横断するルートを明確にする。 Mai-Morente et al. (2025) は周皮細胞/毛細血管支持ルートを鋭くします。 キムら。 (2025) は、シナプス生理学のための髄膜リンパ管/ミクログリア経路を明確にします。 ヒルシュラーら。 (2025) および Dagum ら。 (2026) 境界のある人間のクリアランスサイドの観測値を鮮明にする。およびChungら。 (2025) は、人間によるグランド トゥルースとテスト再テストを将来の作業に明示的に残しつつ、トレーサー固有の BBB 輸送の定量化を高めます。したがって、このページでは、読者が両方を 1 つのマルチモーダル ブーストにまとめるのではなく、グリア基質ルーティングアストロサイト状態 から分離する コンポーネント追加 / アブレーション ラダー を修正します。

メンテナンス状態のルート用の実用的なコンポーネント追加/アブレーションラダー

ニューロン優先ベースラインの上に追加されたファミリー ペアデータの最小要件 利益が生き残った場合に言えること ここでまだ止めなければならないこと
グリア基質経路 同じ被験者の神経および行動のターゲットに加え、サプライヤー細胞、ニューロンシンク、燃料オブジェクト/キャリア、固定された栄養素または学習体制による名前付きのグリアからニューロンへの燃料サポート観察可能または摂動。 宣言されたグリア基質ルーティングファミリーは、その名前付きの栄養素または学習体制における予測、想起、または限定された記憶サポートの読み出しを改善しました。 アストロサイトのアンサンブル状態が特定されたこと、または 1 つのグリア燃料経路が乳酸、ケトン体、脂肪酸、および apoE / ソルチリン依存性脂質送達にわたって一般化していることが特定されました。
星状細胞状態ルート 同じ被験者の神経および行動のターゲットに加え、同じ想起、安定化、または恐怖状態のウィンドウに調整された名前付きアストロサイト状態の観察可能または摂動。 名前付き星状細胞状態ファミリーは、その宣言されたウィンドウにおける予測、想起、安定化、または恐怖状態の解読を改善しました。 責任ある全脳アストロサイトコントローラーが特定されたこと、またはアストロサイト状態の証拠により、グリア燃料ルーティング、クリアランスコントロール、またはすべてのタスクとタイムスケールにわたる1つの一般的なサポート状態が固定されたこと。
神経血管/BBB/周皮細胞サポートルート 同じ被験者の神経および行動のターゲットに加え、覚醒/血管ドライバーの共有ロギングで観察可能な名前付きの毛細血管、BBB交換、またはBBB輸送。 宣言された血管支持ファミリーは、指定された生理学的レジームの下で 1 つの誤差項を削減するか、1 つの予測スライスを改善しました。 一般的な BBB 状態が測定されたこと、または追加された行が対象のニューロン変数を直接読み出したこと。
クリアランス / 免疫 / リンパ経路 同じ被験者の神経またはバイオマーカーのターゲットに加え、睡眠/時間帯の処理が固定された名前付きのCSF移動性、トレーサー輸送、または睡眠に関連した排出ルート。 宣言された輸送側または免疫側の経路は、増分分散を説明するか、境界のある生理学的測定値を変更します。 その局所的なミクログリア制御、ルートフリーの全脳クリアランスの真実、または1つの普遍的な維持制御装置が特定されました。
バンドル比較ルール 同じサブジェクト、分割ルール、欠落ポリシー、および共通ドライバー監査の下で、ニューロンのみのベースライン、追加された各ファミリー、および完全なバンドルを比較します。 このバンドルは、名前付きの可用性とレジーム制約の下で宣言されたタスクを、最も強力な単一の追加行を超えて改善しました。 完全なバンドルが最小限必要な生物学的構成を証明するか、またはそれ自体で U3 を閉じること。
  1. メンテナンス状態の行を追加する前に、ニューロンファースト ベースライン、ターゲット オブジェクト、分割ユニット、およびメトリック バンドルをフリーズします。
  2. 同じ被験者、同じセッション、同じ欠損ルール、および同じ評価ファミリの下で、一度に 1 つのファミリを追加します
  3. 追加されたファミリごとに、直接観測可能時間ウィンドウ空間ユニット、およびルート クラスに名前を付けます。これは、局所的な因果関係の摂動と有界の人間代理が存在するためです。同じ主張を行っていません。
  4. 最強の単一追加行フルバンドル、および同じ分割におけるそれらの不一致/モダリティの欠落動作を報告します。
  5. 結果がコモンドライバー制御、体制外チェック、および指定された棄権境界にも耐えられない限り、増分予測、安定性、または生理的利得で主張を停止します。
  6. </ol> </section>
    スターター EEG データセットはまだこのラダーのベースライン アームにすぎません

    EEG Motor Movement/Imagery、CHB-MIT、Sleep-EDF、および TUH は、ニューロンファーストのベースライン、分割ユニット、QC 規律、漏洩チェックを修正するのに役立ちます。それら自体は、グリア基質ルーティング、星状細胞状態、周皮細胞/BBB サポート、クリアランス輸送、またはその他の維持状態ファミリーを閉じません。したがって、このサイトで公開されているメンテナンス状態の主張には、ペアになったサポート状態データ、調整されたプロキシ ログ、または名前付き摂動ルートが必要であり、オールイン バンドルだけではなく、最も強力な単一追加ファミリーと比較する必要があります。

    同じ主題のサポート状態バンドルには依然として独自の拡張カードが必要です

    家族が分裂した後も、このページには実際的な弱点が 1 つありました。同じ被験者内で複数のサポート状態行が収集されると、そのバンドル自体がすでに 1 つの整列された生物学的変数に近づいているという印象を残す可能性があります。現在の一次文献はそのショートカットをサポートしていません。 Vafaii ら。 (2024) は、自発的多峰性測定には commondivergent の両方の皮質構造が含まれていることを示しました。 チェンら。 (2025) は、EEG-PET-MRI を同時に行うと、空間的に異なる血行動態および代謝パターン を維持しながら、密接に結合した時間的進化を示すことができることを示しました。 ボルトら。 (2025) は、主要な低周波グローバル fMRI パターンが 自律生理学 と実質的に結合していることを示しました。 (2025)</a> は、重要なタスク BOLD 変化を伴う灰白質ボクセルの約 40% が、反対の酸素代謝変化 を示したことを示しました。バンドルレベルのゲインは実際のものですが、依然として条件付きです: Rohaut et al. (2024) は、マーカーを追加すると予後の不確実性を軽減できることを示しました。Amiri et al。 (2023) は、すべての EEG および fMRI 特徴を備えた直接同一サンプル比較が 48 人の患者 に縮小したことを示しました。 (2026)</a> は、より多くのモダリティでパフォーマンスが向上したにもかかわらず、最低意識の患者または症状が改善している患者において、モダリティ間の不一致 が高いことを示しました。行ローカルの安定性はまた別です: Bøgh et al. (2024) は 3 T 重水素ルートの名前付き再現性ウィンドウを修正し、Wirsich et al. (2021) は、明示的に調和された同時収集下でのみ再現可能な EEG-fMRI コネクトーム関係を示しました。したがって、このページでは、同じサブジェクトのバンドルが行の追加以上のものとして読み取られる前に、実用的なサポート状態拡張カード が必要になります。

    データセット バンドル用の実用的なサポート状態拡張カード

    同じ主題のバンドルを強く読み取る前にログに記録するフィールド このフィールドが必要な理由 オーバーリードされたものをブロック
    ルート クラスとブリッジ タイプ 行が同じ被験者の人間の代理、同じ被験者の摂動、連続的なブリッジ、または混合種の因果関係のサポート行であるかどうかを示します。 げっ歯類の因果関係の裏付けと限定された人間の代理行を、同じ家族ラベルに関するという理由だけで交換可能な証拠として読み取らないでください。
    有効な時間枠と生理学的体制 行が同じ試験期間、睡眠段階、覚醒ウィンドウ、薬理学的状態、または複数日間の安定化レジームをターゲットにしているかどうかを記録します。 あたかも 1 つのサポート状態サンプルが自動的に調整されたかのように、同時取得または同一セッションの文言を読まないでください。
    直接観測可能および量のタイプ 追加された行が密度、輸送、交換、移動度、流束、代謝、または間接分類子/スコアであるかどうかを指定します。 トレーサー輸送、グルコース取り込み、BOLD変動、および有界バイオマーカー流出を1つの解決された維持変数にまとめないでください。
    共有ドライバー/数量ブリッジ監査 血管、呼吸器、自律神経、運動、薬物、および時刻の共変量を明らかにし、バンドルが共有軌道、共通の推進力、または真の量の橋渡しを確立したかどうかを述べます。 カップリングが覚醒または別の共有迷惑源によって引き起こされている可能性がある場合は、相関関係のある行を 1 つの生物学的量として読み取らないでください。
    可用性スライスと欠落モダリティ ポリシー 正確な完全なケースのサブセット、補完または置換ルール、および比較が同じサンプルか最大利用可能データかを報告します。 バンドルの結果は、ヘッドライン コホートよりもはるかに小さい、または特別にフィルタリングされたサブグループに依存する可能性があることを隠さないでください。
    最強の単一行不一致トポロジ 最適な単一追加ファミリーを完全なバンドルと比較し、モダリティが一致するか、分岐するか、符号が変わるかを示します。 最も強力な単一行のみを再パッケージ化する場合、または意見の相違が最も困難な体制に集中している場合は、完全なバンドルを宣伝しないでください。
    行ローカル再現性と転送ウィンドウ 追加された各行が反復可能または移植可能となるハードウェア、シーケンス、前処理、中心、取得ウィンドウに名前を付けます。 1 つの名前付きプロキシ ルートを、1 つの調和されたセットアップで 1 回機能したからといって、現場対応またはクロスセンター安定として扱わないでください。
    棄権および請求の中止 コントローラーのアイデンティティ、セルの特異性、またはレジーム外の障害など、ゲイン後に潜在的に残るものを述べます。 バンドルの改善を、デフォルトで最小生物学的構成の主張や U3 クロージャの主張に変えないでください。
    このカードが実際に変えること

    このページでは、データセット カードが上記のフィールドをログに記録し、ニューロンの最初のベースライン最強の単一追加行、および フル バンドル を比較しない限り、サポート状態の追加はファミリー分割拡張証拠 のままになります。同じスプリット、可用性スライス、および棄権ルール。バンドルに生きている人間のプロキシ クラスが混在している場合は、同時取得で十分であるとして扱うのではなく、Verification: Fusion Card と並行して Verification: Human Proxy複合カード を使用します。

    1) 最初に確立する共有インフラストラクチャ

    A

    OpenNeuro (BIDS ベースの共有)

    EEG、MEG、fMRI などの BIDS 準拠の神経画像および電気生理学データセットを共有するためのプラットフォーム。

    OpenNeuro を開く
    B

    PhysioNet (生体信号およびベンチマーク文化)

    生体信号データセットおよび関連リソース (多くの標準的な EEG コーパスを含む) のためのパブリック プラットフォーム。

    PhysioNet を開く
    C

    ヒューマン コネクトーム プロジェクト (大規模人間イメージング)

    大規模な人間の脳の画像データと分析ツールの代表的な公開リソース。

    HCP を開く
    再現性は完全な実行チェーンに依存します

    OpenNeuro と PhysioNet はエントリーポイントですが、それ自体では再現性が保証されません。まず スナップショット / バージョン を修正し、次に BIDS / EEG-BIDS と調整し、MNE-BIDS などのツールを使用して読み取りおよび変換パスを修正し、最後に次のようなベンチマーク ハーネスを使用して比較設定を定義します。 MOABBセッション内/セッション間/被験者間。リポジトリ、ローダー、ベンチマーク設定を混同した場合、同じデータセット名でも比較できない結果が得られます。

    2) EEG スターターパック (L0 から L1 までこれで始めます)

    以下は、使いやすさと広範な参照を重視した入門用脳波データセットの代表的な例です。前処理パイプラインの練習と L0 から L1 に到達することに重点を置き、再現されたベースラインの比較をすぐに開始できる範囲に絞り込みました。

    データセット できること(例) リンク
    EEG 運動動き/画像 モーター/モーターリコール分類、前処理の実践、ベースライン比較 PhysioNet
    CHB-MIT 頭皮脳波 てんかん発作検出、イベント検出、長期脳波処理 PhysioNet
    睡眠EDF 睡眠段階の推定、状態遷移のモデル化、縦方向の変動の処理 PhysioNet
    TUH EEG コーパス (大規模) 脳波分類のスケーリング、実運用時の配布難易度、データ漏洩対策 TUH EEG
    データセット 良い最初のリリース これが最初のリリースとして適している理由
    EEG 運動動き/画像 2 クラス分類のベースライン精度と前処理ログ タスクの設定がシンプルなので、前処理から評価までの最小限のループを簡単に構築できます。
    CHB-MIT 発作イベント検出の再現ベースラインおよび除外理由ログ これは、失敗例も含め、長時間の録音とイベント検出の実際的な困難を学ぶ良い方法です。
    睡眠EDF 睡眠段階分類の基本ベースラインと状態遷移の混同行列 精度だけでなく、状態遷移がどのように失敗するかも示すため、エラーの解釈が容易になります。
    TUH EEG コーパス 小さなサブセットでの再現実験とデータ分割ルールの明確化 最初から完全なコーパスを処理するよりも、リーク防止と分割ルールを最初にロックダウンすることの方が重要です。

    2.5) 同じスコアでも汎化設定によって意味が異なります

    これは、このサイトの現在の弱点の 1 つです。 `within-session`、`cross-session`、`cross-subject`、および `adaptation` はすべて「分類精度」を報告しますが、一般化に関するさまざまな質問に答えます。 MOABB の公式ドキュメントでも、これらを別個の評価クラスとして実装し、Ma らの 5 日間 MI データセットに実装しています。 (2022) によると、被験者固有の平均精度は、セッション内 68.8% から クロスセッション 53.7% に低下し、その後、少量の対象セッション データが使用された場合には クロスセッション適応 78.9% まで回復しました。したがって、このサイトではスコアのみをリストすることはなくなりました。また、何が差し止められ、何が変更を許可され、何が未解決のままかも記載されます。

    評価ファミリー 提供されるもの これがサポートするもの 読みすぎてはいけないこと
    セッション内 同じ主題および同じセッション内で折り畳まれます。 同日、同じセットアップ条件でクラスが分離するかどうか、また前処理とベースライン モデリングがまったく機能するかどうかを示すことができます。 これを、日をまたぐ堅牢性やデプロイ可能なデコードの証拠として扱わないでください。
    クロスセッション 同じ主題からの別のセッションまたは日。 これは、主題固有の機能が日をまたがってどれくらい持続するか、また状態の変化や再セットアップの影響に対してどの程度敏感かを示すことができます。 これを被験者に依存しない一般化またはゼロ再校正操作として解釈しないでください。
    複数の主題 1 つ以上の主題全体。 人口レベルの共有構造が存在するかどうか、および初期インストール時にコールドスタート デコーダがどこまで機能するかを表示できます。 このスコアを特定の個人向けに最適化されたデコーダーと同一視しないでください。
    クロスセッション適応 別のセッションが開催され、その後、少量のターゲット セッション データが再調整に使用されます。 これにより、再調整によってどの程度のパフォーマンスが回復可能か、また運用上の適応にどの程度の余地があるかを示すことができます。 これを、適応せずに最初から動作する安定したデコーダとして説明しないでください。
    この区別が科学的に重要な理由

    ムサルら。 (2019) は、タスク中の神経活動が指示されていない動きによって強く支配される可能性があることを示しました。 (2024)</a> は、10 時間の脳波検査日 にわたって、運動関連のデコードが適応デコーダーの動機付けに十分な変化を示すことを示しました。しかし、高速ラベルが州のすべてではありません。 ド・ケルバンら。 (1998) および Oei et al. (2007) はグルココルチコイド関連の回収障害とヒトの海馬/前頭前野の回収活動の低下を示しました。Barone et al. (2023) プラス バーニーら。 (2023) は、海馬可塑性の概日およびコルチコステロイド リズム制御を示しました。 (2015)</a> は、記憶に関連する海馬の活動が概日リズムの一貫性によって変化することを示しました。最後に、Wilson ら。 (2025) は、長期的な BCI 運用には依然として 再校正 が必要であることを示しました。言い換えれば、同じ主題であっても、短期解決日をまたぐ許容範囲、および長期操作は異なる障壁であり、状態アノテーション__高速に分割する必要があります。時間的有効性が強く読み取られる前の 遅い内部環境開示 からのラベル

    2026-04-03 追記: 状態の注釈は 1 つのフリーテキスト フィールドではありません

    このページに残っている実際的な弱点は、単純な分割命名よりも微妙なものでした。 クロスセッション適応長期使用はすでに分離されていますが、依然として状態アノテーションは、動き、覚醒、またはセッションIDに関する1つのフリーテキストメモに近すぎます。現在の一次文献はそのショートカットをサポートしていません。 エッガーら。 (2024) は、10 時間の脳波検査 を通じて、運動関連のデコーディングが適応デコーダ を動機付けるのに十分な変化を示した。 (1998)</a>、大栄ら。 (2007)Barone 他。 (2023)バーニーら。 (2023)Sherman et al. (2015) は、同じ目に見えるタスクが、異なる グルココルチコイド概日、およびより広範な 遅い内部環境 体制下でも実行できることを示しています。同時に、Wilson ら。 (2025) および Wairragkar ら。 (2025) は、反復的な再校正負荷と高速同日スループットが再び異なることを示しています。したがって、このサイトでは、仮請求では、時刻/概日位相、最近の睡眠覚醒スケジュール、糖質コルチコイドまたはステロイドへの曝露、および摂食/絶食またはグルコースインスリンなどの関連する遅い内部環境の開示とは別に、運動/覚醒/タスクモードなどの高速ラベルを開示する必要があります。 固定デコーダ間隔再キャリブレーション負担、または転送天井が解釈される前に、

    結果が次のように報告された場合... まだ開示する必要があります 不足している場合は申請を停止
    当日オンライン/ストリーミング利用 運動 / 覚醒 / タスク モード、出力パス / 棄権またはフォールバック ポリシーなどの高速ラベル、および結果が 1 つの同じ日の運用体制内に留まっているかどうか。 日をまたぐ安定性、固定デコーダーの耐久性、または一般的な時間的有効性ベンチマークを宣伝しないでください。
    クロスセッション 高速状態ラベル、時刻/概日位相、最近の睡眠覚醒スケジュール、グルココルチコイドまたはステロイド曝露、摂食/絶食またはグルコースインスリン療法、固定デコーダー間隔、設定が再接続、再参照、またはその他の方法で変更されたかどうかなど、関連する遅い内部環境の開示。 耐久性のあるデコードではなく、指定された条件の下で日をまたぐ許容値としてのみ読み取ります。
    セッション間の適応 上記と同じ時間フィールドに加えて、使用されたターゲット セッション データの量、再調整がいつ行われたか、および事前適応スコアはいくらであったか。 固定デコーダの安定性または低負荷の導入を促進しないでください。
    長期的/慢性的な使用 高速ラベルに加えて遅い内部環境開示、固定デコーダ間隔、再調整負荷、障害/フォールバック モード、および参加者/サイト/タスク転送上限。 一般的な長期的な堅牢性や展開可能性を促進しないでください。
    2026-04-04 修正: 取得配信には録画フレーム契約が必要

    このサイトは以前、setup Effects よりも 件名 / セッション フィンガープリント で明確に停止していました。データセット カードとしては依然として弱すぎました。公式の EEG-BIDS 仕様 は、電極チャネル座標系、および参照スキームをすでに分離しています。 胡他。 (2018) は、測定された頭皮電位自体が参照モンタージュと電極設定によって変化することを示しました。Melnik et al。 (2017) は、脳波記録が被験者やセッションによってだけでなく、記録システムによっても異なることを示しました。Xu et al。 (2020) は、クロスデータセット EEG デコーディングがアンプ、キャップ、サンプリング レート、フィルタリングなどの環境変動によって低下することを示しました。Ceballos-Villegas et al。 (2022) は、研究とデバイスにわたる多国籍バッチ効果を明示的にモデル化しました。 (2024)</a> は、データセットがすでに調和されているという一般的な主張ではなく、クロスロケーション比較には明示的な REST ベースのオフライン変換 が必要であることを示しました。したがって、このサイトでは、サイト / デバイス / 参照システム / 電極配置 / 座標ルート / プロトコル分布 を、無害なメタデータとしてではなく、録画フレーム契約 として扱うようになりました。 これらのソースからの推論: 共通チャネル交差ターゲット モンタージュへの補間REST ベースの変換 は異なるベンチマーク オブジェクトを保持するため、データセット カードは調和ブランチに名前を付ける必要があります。セットアップの違いが処理されたと言うだけではありません。

    2026-03-25 追記: ベンチマーク ガバナンスはベンチマークの一部です

    このページの次の実際的な弱点は、分割 / リーク / 調和 が表示される一方で、ベンチマーク ガバナンス が依然として管理詳細として扱われる可能性があることでした。現在の一次ソースと公式ソースはそのショートカットをサポートしていません。公式 EEG Challenge (2025) ホームページ には、元のチャレンジのプレプリントが実行中に古くなったため、Web サイトとスターター キットを最新のものとして扱う必要があると記載されています。公式のルールでは、追加の事前トレーニングデータセット事前トレーニング済みモデル/微調整方法推論段階でのコード提出、およびシングルGPUの開示が必要です。 20 GB の推論予算。その後、公式の リーダーボード は、チャレンジ 2 サンプルがランダム化されていない ことを明らかにし、連続治験の同じ被験者の構造がランキングの意味に影響を与え、別々の賞を強制することを可能にしました。この警告は、ベンチマーク側の一次情報源 (Xiong ら) と一致しています。 (2025) は、一貫性のない評価プロトコルによりモデル間の EEG-FM 比較の信頼性が低くなると主張し、Liu らは (2025) (2026) は、12 個のオープンソース基盤モデル および 13 個のデータセット にわたって、ランキングが転送体制とベンチマークの選択に大きく依存することを示しました。したがって、このサイトがリーダーボード、チャレンジ結果、または基礎モデル ベンチマークを読み取る場合、カードはベンチマーク バージョン分割/ランダム化ルール隠しグループ構造追加データ/事前トレーニング済みチェックポイントも指定する必要があります。ポリシー適応体制推論段階の制限後の主催者事後分析。これらのフィールドが欠落している場合、結果はポータブル EEG 一般化の安定した測定としてではなく、適格なベンチマーク スナップショットとしてのみ扱われます。

    2026-03-31 追記: ベンチマーク名はまだベンチマーク オブジェクトではありません

    次の実際的な弱点はさらに狭いものでした。ベンチマーク ガバナンスが可視化された後でも、読者は、あたかもベンチマーク名が予測オブジェクト独立予測ユニットグループ化されたホールドアウトユニット適応レジーム、および運営予算。現在の一次ソースと公式ソースはそのショートカットをサポートしていません。公式 EEG チャレンジ (2025) ホームページ は、チャレンジ 1 の応答時間回帰を、チャレンジ 2 の被験者レベルの外部化予測、公式の ルール から分離しています。 提出ページ シングル GPU 20 GB 予算の下に、推論のみのコード提出ワークフロー を追加します。 (2022)</a> は、1 つの 5 セッションの運動画像データセットを使用して、セッション内クロスセッションクロスセッション適応Liu et al. (2026) 1 被験者抜きの被験者間評価被験者内数ショット校正 から分離し、Lahiri et al. (2026) は、6 つのベンチマークの不一致 により、同一のデータセットのランキングが最大 24 パーセント ポイント 逆転する可能性があることを示しています。したがって、このサイトでは、オブジェクト / ユニット / 予算マトリックスが明示的に開示されるまで、データセットまたはリーダーボードの名前はまだ粗すぎます。

    2026-04-02 追記: セットアップの多様性はまだ生理学と同等の転移ではありません

    このページの次の弱点は、ベンチマーク ガバナンスとは異なります。データセットまたはベンチマーク カードは、すでに サイト / デバイス / リファレンス / レイアウトの多様性 を公開していても、設定に依存しない基盤モデルが既に 生理学的保持伝達 を解決しているという印象を読者に残す可能性があります。現在の一次文献はそのショートカットをサポートしていません。 ハンら。 (2025) ターゲット チャネル順列等分散Chen et al。 (2025) ターゲット 異種デバイスと 150 以上のレイアウトにわたる座標ベースの適応El Ouahidi et al。 (2025) 92 データセット および 25,000 人の被験者 から、セットアップに依存しない事前トレーニングを 60,000 時間 以上に押し上げます。これらの論文はレコーディングフレームの互換性を前進させます。彼らは、異なるモンタージュ、座標ルート、および参照ファミリーが 1 つの共有生理学側表現 を既に保存していることをまだ証明していません。 Ma et al. (2026) 次に、追加の適応構造が追加されない限り、被験者レベルの監視が制限されている 場合でも、強力な EEG 基礎モデルは依然として不十分に一般化できることを示します。したがって、このページでは、セットアップの多様性座標ルート参照ファミリー省略チャネルポリシー、およびラベル制限適応負担を扱うようになりました。移植可能な一般化の 1 つの統合された主張ではなく、個別のデータセット/ベンチマーク カード フィールドとして。

    ケース 指定されたベンチマークまたはデータセットが実際に予測するもの まだ個別に凍結する必要があるもの このサイトの安全上限
    EEG チャレンジ 1
    公式ホームページ + ルール
    トライアルレベル CCD タスクからの応答時間の回帰。 トライアルはスコアリング単位ですが、グループ化された主題の構造と推論専用シングルGPU 20 GBの予算は別途開示する必要があります。 一般的な EEG デコーダーの判定ではなく、固定運用予算に基づく名前付き転送ベンチマーク。
    EEG チャレンジ 2
    公式ホームページ + リーダーボード
    被験者レベル 複数のパラダイムにわたる脳波からの外在化因子予測。 件名は本来の独立した単位であり、主催者の事後分析では、隠れた連続トライアルのグループ化によってベンチマークの測定結果が依然として変化する可能性があることが示されています。 サブジェクト不変ベンチマークの試み。その意味は依然としてグループ化ポリシーに依存しており、サブジェクト不変が解決されていることを証明するものではありません。
    Ma et al. (2022)
    5 セッションの運動画像データセット
    同じ生データセットは、セッション内クロスセッションクロスセッション適応評価ファミリーをサポートします。 データセット名だけでは、ターゲットセッションデータが使用されたかどうか、いつ再調整が行われたか、事前適応スコアが何であったかはわかりません。 自動固定デコーダの耐久性ではなく、セッション シフトの練習用ボードとして役立ちます。
    Liu et al. (2026)
    基礎モデル ベンチマーク マトリックス
    複数の転送設定における13個のEEGデータセットおよび9つのパラダイムにわたるモデル間の比較。 この論文では、1 つの被験者を残す 転送と、被験者内少数ショット校正 を明示的に分離しているため、ホールドアウト ユニットと適応レジームは依然として個別に名前を付ける必要があります。 転送体制の比較ボードであり、EEG 一般化のポータブル スコアではありません。
    このセクションのサイト ルール

    このセクション以降、データセット カードとベースライン結果は、少なくとも (1) 評価ファミリー(2) ベンチマーク オブジェクトと独立予測ユニット(3) 独立ホールドアウト ユニット(4) 生記録 / ウィンドウを報告する必要があります。祖先(5) サブジェクト / セッション / サイト / デバイス / リファレンス システム / 電極レイアウトの不整合性とメタデータのみのベースライン(6) チャネル マップ / 座標ルート / リファレンス ファミリ / 省略チャネル / サンプル レート / フィルタ調和ログ(比較で共通チャネル交差を使用したかどうか、ターゲットへの補間を含む)モンタージュ、REST / 別の明示的な変換、またはクロスセットアップ調和なし(7) ターゲット セッション、ターゲット サブジェクト、またはターゲット サイト データが使用されたかどうか(8) 再調整量とタイミング、または追加のラベル予算(9) リーダーボードまたはチャレンジ用クレーム、バージョンを含むベンチマークの来歴、分割/ランダム化ルール、非表示のグループ化、追加データ/チェックポイント ポリシー、推論段階の制限または運用予算、事後開示(10) 停止クレーム。申し立てが複数のセッションまたは日にまたがる場合は、さらにサイトの 時間的有効性 フィールドを開示する必要があります: 状態注釈を高速ラベルと低速内部環境開示に分割固定デコーダ間隔再校正負担、および転送上限。このコンテキストのないスコアは、長期的な安定性や展開可能性の証拠ではなく、限定された L1 デコード結果、フィンガープリント未解決 / 取得配布未解決の分類子、またはベンチマークオブジェクト未解決 / ベンチマークガバナンス未解決のリーダーボードとして扱われます。

    2026-03-25 追記: メトリクスのセマンティクスはベンチマークの一部です

    このページの次の実際的な弱点は、分割 / リーク / 調和 および ベンチマーク ガバナンス が可視化されている一方で、メトリクス セマンティクス が依然として 1 つの見出し番号の背後に隠れている可能性があることでした。一次文献ではそのショートカットはサポートされていません。 斉藤&amp; Rehmsmeier (2015) は、クラスの不均衡が強い場合、precision-recall ビューが ROC サマリーよりも有益である理由を示しました。発作課題では、Roy et al. (2021) および Scheuer ら。 (2021) は、実際の評価では、感度1 時間または 1 日あたりの誤ったアラーム、イベント重複ロジック、単純な精度ではなく遅延が有効であることを示しています。 (2023)</a> は、誤報制御 自体が後付けではなく、発作予測における設計目標であることを示しています。睡眠ステージングでは、Sun et al. (2017)Cohen の kappa を使用し、ステージの比率の不均衡によってパフォーマンスの推定値が変化することを示しました。 Walker (2021)</a> は、プールされたパフォーマンスが依然として特に弱い N1 段階 の一致を隠す可能性があることを示しています。したがって、このサイトでは、データセットまたはベンチマーク カードは、スプリットとスコアだけでなく、タスクに一致するメトリクス バンドル も開示する必要があります。

    タスクファミリー このサイトの最小メトリック バンドル ブロックへのオーバーリード
    キューロック分類/デコード バランスの取れた精度またはマクロ F1、混同行列、被験者ごとの集計、および確率が出力される場合の校正/棄権。 1 つの精度の数値によって、少数派クラスの崩壊や信頼度の誤調整が隠蔽されないようにしてください。
    発作検出/予測 イベントの感度またはリコール、1時間または1日あたりの誤警報、イベント重複ルール、関連する場合の検出/警告遅延、およびしきい値または警報が使用されている場合の調整。 臨床的に使用可能なアラーム動作の代わりに、精度、AUROC、または 1 つのしきい値なしの概要を使用しないでください。
    睡眠ステージング Cohen のカッパまたはマクロ F1、ステージごとのリコール / F1、および少数ステージを表示し続ける混同行列。 プールされた精度によって弱い N1 または移行段階のパフォーマンスが隠蔽されないようにしてください。

    3) 初期データの過大評価を避けるための監査

    上記の 4 つのケースは、L0 ~ L1 の練習ベースとして非常に役立ちますが、EEG ソース イメージングと WBE の強力な主張を直接検証するためのグランド トゥルースではありません。ここで必要なのは、「使える/使えない」という二分法ではなく、どの主張が支持できるかということに固執することです。

    このセクションの最後の 2 つの列は、このサイトの運営ロジックを反映しています

    以下の表の 停止要求 および 最小運用ルール は、公式データセットの説明と一次文献で直接観察され、注釈が付けられているものから導かれた運用上の境界です。言い換えれば、これらはデータセットプロバイダーによって明示的に行われた主張ではありません。これらは、アノテーションの出所と時間忠実度 から派生したサイト ルールです。

    データセット 今すぐ確認できること まだ検証が難しい 最低限の予防措置
    EEG 運動動き/画像 64ch、160Hz、109人のキューロックタスクなので、前処理や被験者ごとの分割、単純なベースライン比較の練習に適しています。 個別の MRI、電極座標、侵襲的グラウンド トゥルースがなければ、ESI の精度の向上や深部再構成の主張を監査することはできません。 このタスクには画面上に左/右/上/下のキューを提示することが含まれるため、視線、筋電、キューロックアーティファクトが含まれているかどうかを確認し、被験者ごとに分割を修正します。
    CHB-MIT 長期のEEG、発作イベントの検出、欠落および除外理由のログの学習に適しています。 小児の臨床状態、難治性てんかん、および薬物離脱に強く依存するため、一般的な認識やソースイメージングのための汎用ベンチマークとして使用することはできません。 レコード間のギャップとモンタージュサマリーを保持しながら、ケース単位に分割して処理します。発作と発作の違いもまず明らかにされます。
    睡眠EDF 終夜 PSG を使用した状態遷移、睡眠段階分類、経時的変動の処理方法を学習するのに適しています。 一次 EEG は Fpz-Cz / Pz-Oz 2 リード、100 Hz であるため、空間解像度やソース イメージングのベンチマークではありません。 ラベルは、Rechtschaffen & に基づいて手動で採点されます。 Kales標準ですので、新しい睡眠ステージ研究と比較する場合には、ラベルの対応を明記いたします。
    TUH EEG コーパス 大規模、臨床ノイズ、繰り返しのセッション、医師のレポートなど、現実世界の配信の難しさを学習するのに適しています。 チャネル数と臨床状態のばらつきが大きいため、管理された生物物理学的ベンチマークではないため、ソース画像の改善を直接検証するのには適していません。 最初にレポートを使用する場合の患者/セッション単位の分割、固定チャネル サブセット、モンタージュ正規化、およびテキスト漏洩防止を修正しました。
    データセット ラベル/イベントの起源 時間忠実度 ここで停止するよう主張してください 最低限の運用ルール
    EEG 運動動き/画像 .event および注釈チャネル T0/T1/T2 は、実際の/想像上の動きのキューロックされたオンセットを示します。 160 Hz 録音のキューオンセットレベル。 自由な思考の解読や主題に依存しない意味論的な読み出しを促進しないでください。 被験者ごとに分割し、視覚的手がかりと筋電/眼球の寄与を個別に実行および監査します。
    CHB-MIT 各症例の概要と .seizure の注釈は、長期記録中の発作間隔をマークします。また、chb21 は、chb01 と同じ主題です。 Expert 間隔の注釈、ファイル間のギャップも残ります。 これをギャップのない継続的なモニタリングとして扱ったり、症例を独立した被験者であるかのようにカウントしたりしないでください。 ファイルごとではなく、件名とケースの時系列ごとに分割し、ギャップ プラス モンタージュの概要をランブックに保持します。
    睡眠EDF 十分な訓練を受けた技術者による R&K ヒプノグラムと 1 Hz イベント マーカーが付属しています。 徹夜ステージの注釈は粗く、EEG が 100 Hz であるにもかかわらず、マーカーは 1 Hz です。 1 秒未満のイベント発生と AASM と同等のラベルが自明であると主張するのはやめてください。 件名の夜で分割し、R&K から AASM にマッピングする場合は、マッピング ルールを指定します。
    TUH EEG / TUSZ TUH には患者/セッション階層と臨床医レポート .txt があり、TUSZ にはレポートのキーワード検索と自動トリアージを含む選択が行われます。 セッション/ファイル レベルでの臨床ラベルと、一部のサブセットでの専門家の発作注釈。 レポート支援ラベルを、純粋な EEG のみのベンチマーク精度であるかのように記述しないでください。 患者/セッション単位の分割と レポート使用フラグ を要求し、レポート テキストを信号のみの評価にフィードしないでください。
    これらの停止線が現場のスタイルではなく証拠に裏付けられている理由

    公式の EEG Motor Movement/Imagery データセットの説明 自体が上限を修正しています: 109 ボランティア64 チャンネル14 キュー主導の実行160 Hz および T0/T1/T2 オンセット コードは、アノテーション チャネルと .event ファイルの両方にコピーされました。キューロックされたデコード、前処理、および件名分割の衛生状態を監査するにはこれで十分ですが、このサイトでは、より強力な読み上げ文言が適用される前に、visual-cueovert-movement、および myoelectric / ocular の投稿を個別に監査する必要がある理由もここにあります。許可されています。

    公式の CHB-MIT の説明 は、異なる上限を修正しています: 22 件の小児対象を 23 件のケースに編成ケース chb21 は chb01 と同じ件名連続番号付き EDF 間のギャップファイル、および事件の概要とともに.seizure ファイルによって保持される発作境界。したがって、対象者の身元 および事件の時系列 が明示的なままでない限り、ファイルレベルのランダム化は独立性を誇張します。

    公式の Sleep-EDF の説明 も同様に解釈を制約しています。PSG は Fpz-Cz / Pz-Oz EEG のみを EOG および顎 EMG とともに使用しますが、イベント マーカーといくつかの補助チャネルは 1 Hz でサンプリングされます。催眠術は手動レヒトシャッフェン&;です。カレスのスコアローゼンバーグ&amp; Van Hout (2013) は、現代の睡眠段階のスコアリングでも全体のスコアラー間の一致率は 82.6% 程度のみ に達し、N1N3 については一致度が低いことを示しました。このため、このサイトでは、ラベル マッピング、スコア体系、および時間粒度が明示的に開示されていない限り、段階的状態の実践で Sleep-EDF の結果を停止します。

    TUH / TUSZの場合は従ってください。 Picone (2016) は、臨床コーパスが EDF 記録と 臨床医の報告 を組み合わせていると説明しています。 (2018)</a> は、レポート キーワード検索 および 自動検出器 を使用した発作の多いトリアージについて説明しています。その後のコーパスメンテナンスノートには、Neureka 2020 の初期リリースには、列車/開発/ブラインド評価にわたる非独占的な主題 および 高周波発作の注釈の問題 があったことが文書化されています。したがって、レポート使用フラグ患者/セッションの祖先、およびベンチマーク事後分析は、このサイトでは脚注ではなく結果の一部として扱われます。

    今追加すべき最も重要なサイト ルール

    スターター データを導入するときは、必ず (1) ラベル来歴(2) 時間粒度(3) クロック ドメインとストリーム アライメント ルール(4) タイミング検証クラス(5) イベント セマンティクス(6) 独立した分割ユニット(7) 取得/配布の概要と調和ポリシー、および(8) クレームの停止。これが含まれていないデータセット カードは、L0 の実用的なガイドとして不十分であると考えられます。

    BIDS は要件ですが、真実ではありません

    BIDS/EEG-BIDS は重要ですが、それだけではソース イメージングの有効性やデータセット間のデコードの比較可能性を証明することはできません。 BIDS 仕様自体も、EEGReferenceSamplingFrequencySoftwareFilters を必要とし、*_electrodes.tsv が発行される場合、 *_coordsystem.json も必要です。ただし、これは第三者が事件を追跡できるようにする条件であり、真の発生源を知ることを可能にする条件や、コホート間の基準の不一致、電極レイアウトの不一致、およびデバイス/フィルターの違いを自動的に調和させる条件ではありません。

    ESI の改善を主張したい場合は、別の一連の証拠が必要です

    少なくとも以下の4点をお知らせください。

    • 個人の解剖学: デジタル化された電極位置と *_electrodes.tsv / *_coordsystem.json
    • を含む個人の MRI/CT または EEG-BIDS 記録
    • フォワードモデル監査: 頭部モデルおよび頭蓋骨伝導率感度分析
    • 外部標準: ファントム、同時侵襲記録、頭蓋内刺激、TMS-EEG などのグラウンド トゥルース
    • 不確実性: 点推定だけでなく、位置推定誤差と区間推定も報告

    4) ソース イメージングをさらに深く掘り下げたい場合は、データを 3 つの段階に分割します

    このページの弱点は、「スターターデータはソースイメージングの直接のベンチマークではない」と言うだけで終わっていて、次に何を選択するかを決めるのが弱かったことです。ここでは、議論の強さに応じてデータを 3 つのレベルに分けます。

    ステージ 代表的なデータ サポートされている引数 まだ言えないこと
    A: 練習台 EEG モーターの動き/イメージ、CHB-MIT、睡眠 EDF、TUH EEG L0-L1 再現性分析、QC、分割設計、ベースライン比較 ESI ローカリゼーション エラーの改善、深いソースの主張、強力な WBE 指向の再構成の主張
    B: 解剖学的制約を伴う再建 個別化された MRI、デジタル化された電極、EEG-BIDS の *_electrodes.tsv / *_coordsystem.json を含むレコード フォワードモデルの監査、皮質表面付近の再構成の比較、電極配置と導電率の仮定の感度分析 直接的なグラウンドトゥルースを使用しない詳細なソース精度保証、一般化された独自の回復主張
    C: 直接検証 Localize-MI (Mikulan et al., 2020)、頭蓋内刺激を伴う頭皮脳波、同時 HD-EEG/SEEG、術後転帰を伴う術前コホート 指定された検証クラスの監査: 既知の刺激部位に対する位置特定エラー、同時侵襲記録との一致、または術後の転帰との臨床的一致 タスク/コホート/モンタージュを超えた普遍的なパフォーマンス保証
    ステージ C は 1 つのボックスではありません

    このサイトでは、どの C ステージ検証クラスを使用したかを記述する必要があります。

    • 刺激のグラウンド トゥルース: は、既知の刺激部位および時間に対する位置推定誤差を求めます (Mikulan et al., 2020; Unnwongse et al., 2023)。
    • 同時侵襲的記録: は、同じイベント体制下での同時 SEEG/ECoG との一致を求めます (Hao et al., 2025)。
    • 術後転帰 / 臨床的一致: は、ソースが独自に観察されたかどうかではなく、ソース推定が臨床的に関連する組織を指しているかどうかを尋ねます (Birot et al., 2014)。
    今最も重要なことは、C ステージの公開ベンチマークです

    Localize-MI (Mikulan ら) (2020) は、256 チャネルの頭皮 EEG およびステレオ EEG による脳内刺激を公開する貴重なデータ リソースであり、ソース イメージングを「既知の刺激位置」に対して直接監査できるようになります。ハオら。 (2025) は、29 件の同時 HD-EEG/SEEG 症例において、発作時 ESI で 14.07 mm、発作間欠期 ESI で 17.38 mm の平均位置推定誤差を報告し、信号源の出力と信号源の深さが精度に大きく影響することを示しています。ヤフロミら。 (2026) その後、3D プリントされた小児ディープソース ファントム を追加し、ディープてんかんソース クラス および geometry が変更されると、ファントムの検証であっても 1 つのユニバーサル ボードではないことを示しました。したがって、ソース イメージングを改善したい場合は、C レベルのベンチマークだけでなく、A レベルのスターター データセットのみではなく、名前付きの C ステージ検証クラスも必要になります。

    高密度はもはや唯一の信頼できるルートではありませんが、それでもソルバー不要の近道ではありません

    このページに残っている簡略化の 1 つは、入口の音を HD-EEG が深刻なルートであり、低密度 EEG が弱いルートである に近づきすぎていることです。現在の一次文献はそれよりも狭いです。 Horrillo-Maysonnial et al. (2023) は、ターゲットを絞った 33-36-electrode モンタージュが 83-electrode HD モンタージュに対して 54/58 サブ葉一致 (93%) に達したが、それでもさらに大きく表示されたことを示しました。 接線ジェネレータのピーク頂点距離。 Rong et al. (2025) は、DeepSIF ベースのアプローチが 75 から 16 電極 まで比較的安定しており、平均空間分散が 7.9/9.0 mm21.9/28.1 であることを示しました。 sLORETA の場合は mm、LCMV の場合は 20.0/28.9 mm。しかし、これらの論文は直接検証の上限を消去するものではありません。 Unnwongse ら。 (2023) は、カバレッジ幾何学と導電率の仮定が直接検証において依然として位置推定誤差を動かすことを示しました。 (2025)</a> は、発作時と発作間欠期の ESI が異なること (14.07 ± 4.62 mm17.38 ± 4.16 mm)、および ソース深さ であることを示しました。 スパイクパワーは依然として重要です。したがって、このサイトでは、高密度低密度 を正しい最初の分割として扱うことはなくなりました。より安全な分割は、という名前のモンタージュ / カバレッジ ポリシー + 逆ファミリ + ソース レジーム + 検証クラス です。

    術後の結果を使用することはできますが、グラウンドトゥルースと同一視すべきではありません

    Mouthaanらによる系統的レビューでは、 (2019) によると、術前てんかんにおける電源イメージングの概要感度は 82%、特異度は 53% でした。言い換えれば、術後の転帰と SOZ の一致は有用な外部基準ではありますが、線源画像そのものを真の値として確定することはできません。 C段階であっても、今言えることは「`How far has the error been reduced with this benchmark?'', not `「ソースを脳内で独自に読み取ることができた」ということです。

    実践的な読書

    データを選択する際の最初の質問は、「何が興味深いのか」ではなく、今回はどのレベルの議論をサポートしたいですか? L0~L1の練習にはレベルAで十分です。ソース イメージングの改善を主張したい場合は、ステージ B でヘッド モデルを監査し、ステージ C で直接検証しない限り、主張を保留してください。ソルバーの比較に進む場合は、次のセクションで、リーダーボードが受け入れられる前に、メソッド間で同一でなければならない点が修正されます。

    4.5) 逆問題ベンチマーク ボード: ソルバー名ではなく、エラーの質問を比較

    2026-03-18 の検証クラス更新後のこのページの弱点は、依然として読者が「`we used C-stage data'' to `__「ソルバー X が勝ちました」からジャンプできることです。それは弱すぎます。 ミシェル&amp; Brunet (2019) では、ESI を単一のアルゴリズムではなくパイプラインとして説明していますが、現在の文献はさらに厳密です。 ルリアら。 (2024) 確率的焦点支持ファミリーTong ら。 (2025) は、スパースの偏り解消推論ファミリーFeng らを公開します。 (2025) ターゲット 拡張ソース再構築。これらの論文は、同じターゲット オブジェクトや同じ不確実性オブジェクトを返しません。 パスカレラら。 (2023) は、生体内焦点源ベンチマークで、10 の方法が最良の位置推定誤差だけでなく、正則化とモンタージュ密度に対する感度も異なることを示しました。 (2023)</a>、ハオら。 (2025)、およびJahromi et al。 (2026) は、直接検証ボード自体が刺激クラス、同時侵襲参照、および深部ソースファントムの形状によって異なることを示しています。 Vorwerk ら。 (2024) および Vorwerk ら。 (2026) は、順モデルの不確実性が、より優れた逆マップから継承された特性ではなく、別個の監査であることをさらに示しています。したがって、このサイトでは、逆問題比較を 5 つの固定軸を持つボードとして扱うようになりました: 検証クラスソース レジーム / ターゲット オブジェクト逆ファミリ / 不確実性オブジェクト同じジオメトリコントロール、および感度スイープ

    逆ファミリは単なるソルバー スタイルのラベルではありません

    このページでは、別のショートカットを明示的に停止する必要があります。 事後サポート マップ偏りのない疎間隔、および拡張ソース重複推定は、1 つの同一の非表示オブジェクトを 3 つ視覚化したものではありません。 ルリアら。 (2024) 焦点代替案に対する事後サポートを返す、Tong et al。 (2025) は、疎な時空間ソースに対する偏りのない推定/推論を返します。また、Feng et al. (2025) は不確実性を考慮した 拡張ソース 再構成を返します。したがって、このサイトのベンチマークでは、ボードの名前だけでなく、どの 逆ファミリ が使用されたか、どの ターゲット オブジェクト が回復を目的としていたか、そしてどの 不確実性オブジェクト が実際に返されたのかも指定する必要があります。

    センターエラーとソースエクステントは異なるベンチマークオブジェクト

    ここでも別のショートカットをブロックする必要がありました。ベンチマークは「直接検証」でき、ソースの 幾何中心 のみをスコアにします。 Feng ら。 (2025) は、焦点中心位置特定ではなく、拡張音源再構築 を明示的にターゲットにしています。 ハオら。 (2025) も同様に、ECD に基づく距離比較では、発作開始ゾーンと刺激性ゾーンの空間範囲が無視されていることに注目し、将来の位置特定作業には幾何学的中心に加えて 音源範囲 を組み込む必要があると主張しています。したがって、焦点サイト距離ボードを獲得したソルバーが、自動的に分散、拡張、または伝播の多いソースに最適な方法になるわけではありません。このサイトの公開ベンチマークでは、スコアが centreextentoverlap、または伝播パターン

    ベンチマークの質問 メソッド間で固定を維持 公開する主要指標 読みすぎてはいけないこと
    既知の刺激部位に対する焦点源の位置特定 同じ生の記録、イベント ウィンドウ、電極座標、頭部モデル、導電率スイープ、ソース空間、および不良チャネル マスク。 既知の刺激部位までの距離/時間、および導電率と正則化設定全体の広がり。 焦点ソース ボードだけから拡張ソースまたは分散ソースのユニバーサル ソルバーを作成しないでください。
    同じイベントにおける同時 SEEG/ECoG との一致 同じイベント定義、同じ参照モンタージュ、同じソース深度階層化、同じ前処理、および同じ一致ルール。 侵襲的基準までの距離または重なり、ソースの深さとソースの電力層。 すべてのジェネレータ、特に低振幅または深いアクティビティの一致を直接のグラウンドトゥルースとして解釈しないでください。
    臨床的一致/術後の転帰 同じ SOZ/切除定義、同じ結果ウィンドウ、同じ盲検ルール、および同じ患者包含基準。 臨床転帰に対する感度/特異度または一致。ローカリゼーションエラーから明確に分離されます。 外科的一致を正確な音源位置特定のグラウンドトゥルースとしてラベル付けし直さないでください。
    拡張ソース再構成またはマルチモーダル事前再構成 ソース範囲の同じ定義、同じ以前のソース、同じ解剖学的制約、および同じ焦点評価と拡張評価の分割。 分散ソースの範囲のオーバーラップまたは再構成エラーと、追加された事前のゲインからのゲイン。 拡張ソース メソッドをフォーカル ソース リーダーボード上でのみ比較し、一般的に劣っていると判断しないでください。
    1 つの名前付きボードでの逆ファミリ比較 同じ検証クラス、同じ生データ、同じジオメトリ、同じソース領域、および各メソッドが事後サポート、疎な偏り除去間隔、焦点中心、またはソース範囲/オーバーラップを返すかどうかの明示的なステートメント。 ファミリー型の結果テーブル: ターゲット オブジェクト、不確実性オブジェクト、プライマリ ボード メトリック、および導電率/ハイパーパラメータ スイープによって引き起こされる広がり。 確率的焦点ファミリー、疎な偏りのないファミリー、および拡張ソース ファミリを、1 つの共有勝者または 1 つの一般的な「より良い ESI」主張にまとめないでください。
    MNE / ビームフォーマー / シャンパンが同意しない場合 今公開すべき内容 このサイトの安全な読み方
    頭蓋骨の導電性、頭部モデル、または電極の形状が乱れると、ランキングが反転します。 最良の実行のみではなく、フル感度スイープの下でファミリー固有のランキングを表示します。 有界ジオメトリ領域におけるメソッド条件付きの改善であり、一般にソルバーの勝者ではありません。
    メソッドは、手動で調整された 1 つの正則化ポイントでのみ成功します。 テストされたハイパーパラメータ範囲にわたるローカリゼーションエラー曲線または間隔を公開します。 最良の場合のパフォーマンスのみ。堅牢性は未解決のままです。
    高密度のモンタージュは分散を軽減しますが、ローカリゼーション エラーは軽減しません。 ローカリゼーション エラーと空間分散を個別に報告します。 真のソース精度の自動改善ではなく、推定の集中度が向上します。
    深いソースと表面的なソースは異なる動作をします。 結果を 1 つの平均値にプールするのではなく、ソースの深さによって階層化します。 条件付きの検出のみ。全体として深いソースに一般化しないでください。
    フォーカル ソース ボードと拡張ソース ボードは、異なるファミリに適しています。 焦点、スパース、および拡張ソース タスク用に個別のリーダーボードを保持します。 ソース体制固有の強みであり、1 つの数値にまとめられる矛盾ではありません。
    確率的焦点サポート、スパース偏り解消推論、範囲を意識した再構成は、さまざまな不確実性オブジェクトを返します。 ファミリー ラベル、ターゲット オブジェクト、不確実性オブジェクトをメソッドで非表示にするのではなく、メイン スコアの横に公開します。 理事会固有、家族固有の証拠のみ。意見の相違を、1 つの共通の真実に関する一般的なノイズとして解釈しないでください。
    このセクションのサイト ルール

    このサイトの公開逆問題比較では、少なくとも (1) 検証クラス(2) ソース レジームとターゲット オブジェクト (焦点中心 / スパース / 拡張 / 伝播認識)(3) 逆ファミリとそれが返す不確実性オブジェクト、を開示する必要があります。 (4) モンタージュ/カバレッジポリシーを含む同一ジオメトリ制御(5) 導電率および主要なハイパーパラメータの感度スイープ(6) メソッド間の不一致の概要(7) 停止すべき主張ここ。これらのフィールドがないと、結果は再利用可能なベンチマークとしてではなく、メソッドの図またはラボ固有のパイプライン ノートとして扱われます。

    5) 「データがある」だけでは終わらないチェックリスト

    チェックリスト

    • 修正されたバージョン:OpenNeuro スナップショット、PhysioNet バージョン、DOI、取得日は残りますか?
    • 転載:取得手順、ライセンス、前処理条件、乱数、環境を書いていただけますか
    • メタデータ:サンプリング、リファレンス、電極配置、イベント定義、クロック ドメイン、および名前付きタイミング検証クラスはありますか?
    • アノテーションの出所:ラベルがアノテーション チャネル、手動スコアリング、またはレポートから派生したルールから来たものであるかどうか、また、既知のスコアラーの合意またはレポートから派生した上限によって依然として解釈が制限されるかどうかを明確に示しましたか?
    • QC:ノイズ、欠陥、アーティファクトは定量化されていますか?
    • 比較:ベースラインはありますか?評価ファミリーと同じ指標を使用して比較できます
    • メトリクス バンドル:タスクが不均衡またはイベントベースの場合、イベントの感度、誤報、段階ごとの合意、またはキャリブレーションが、1 つのヘッドライン番号ではなく開示されていますか?
    • ベンチマークの来歴:結果がチャレンジまたはリーダーボードから得られた場合、ベンチマークのバージョン、分割/ランダム化、非表示のグループ化、サブジェクトの排他性、追加データ ポリシー、事前トレーニング済みチェックポイント ポリシー、推論段階の制限、およびその後の事後検証は修正されていますか?
    • 逆問題ガバナンス:ソース イメージングが比較される場合、勝者を宣言する前に、検証クラス、ソース レジーム、逆ファミリ/不確実性オブジェクト、ジオメトリ/制御スイープ、およびメソッド間の不一致が開示されますか?
    • 反論証拠:データ漏洩テスト、セグメント/ウィンドウの祖先チェック、反事実テスト、障害の記録はありますか
    公式ベンチマーク事後検証は脚注ではなく再現性の一部です

    実際の作業では、ベンチマーク ページ、ルール ページ、提出制限、および最終リーダーボードのそれぞれが、スコアの意味の異なる部分を修正できます。 ブルックシャーら。 (2024) は、トランスレーショナル EEG におけるセグメントベースの相互検証により、トレーニング セットとテスト セットの間で被験者の情報が漏洩し、見出しのパフォーマンスが水増しされる可能性があることを示しています。後の TUH/TUSZ 保守記録には、下流での使用がすでに開始された後に 主題の独占性 および 注釈の品質 を修復する必要がある公開リリースのケースも文書化されています。そのため、このページでは、EEG 基礎モデルのベンチマークを、スプリット/リークの衛生状態だけでなく、ベンチマークの来歴 を通じてもルーティングするようになりました。ベンチマークで進化するチャレンジ操作が使用されている場合は、ランキングを移植可能な一般化の証拠として扱う前に、Wiki: EEG 基礎モデルと事前トレーニング および 検証: 事前トレーニング カード に直接進んでください。

    6) ここで L0 最小ループを実行します

    ここでの目標は、高精度を競うことではなく、第三者が同じ方法でたどることができる最小のループを作成することです。このサイトの最小パックは、バージョン + BIDS + QC + スプリット + ベースライン だけではなくなりました。また、イベント忠実度ラベル来歴取得配布概要派生系統a 要求の停止 も必要となるため、その後の精度でも正しく読み取ることができます。

    L0 ループ

    • バージョン:OpenNeuro スナップショット / PhysioNet バージョン / DOI / 休暇取得日
    • 入力:BIDS / EEG-BIDS (データ + メタデータ + リファレンス / チャネル / 電極 / イベント) に配置できる形式を作成します
    • イベント忠実度:レコードのオンセット/期間/サンプル、クロックドメイン、ストリームアライメントルール、タイミング検証クラス、遅延/ジッターの証拠、およびイベントセマンティクス
    • ラベルの来歴:ターゲットがアノテーション チャネル、専門家のスコアリング、臨床医のレポート、またはその他のルールからのものであるかどうかを記述します
    • 品質: 欠落、ノイズ、アーティファクト、除外理由を数値形式で記録
    • 処理:前処理条件、乱数、ソフトウェア バージョン、生から出力までの派生系統を修正
    • 評価: 独立したホールドアウト ユニットと未加工記録/ウィンドウ祖先とともに、最初にセッション内/セッション間/被験者間のうちの 1 つを修正します
    • 出力:単純であっても、後で比較できるように少なくとも 1 つのベースライン指標を公開し、ここでどの主張を終了する必要があるかを述べます
    • 監査:障害ケース、リークテスト、調和ログ、保留中の状態も結果とともに記録されます
    2026-03-20 追記: パブリック L0 パックが同期されました

    このページの弱点は、公開チェックリストが、Wiki ページの読者が L0 提出を組み立てる際に実際に使用するものよりも厳格になっていることでした。そのギャップは今では埋まっています。このページのルートだけでなく、提出シェイプ自体が必要な場合は、Wiki: L0 の最小アーティファクト パックに直接アクセスしてください。同期されたパックは、データセットのアイデンティティイベント忠実度ラベル来歴評価ファミリー + ホールドアウト祖先取得分布を修正しました。概要派生系統、およびを第一級の成果物として主張停止します。

    詰まりやすい 最初にカットする
    同じデータセット名で再現できると思います 最初に OpenNeuro スナップショット タグと PhysioNet バージョンを修正し、取得日と DOI を Runbook に残します。
    BIDS の形式で停止 実際のデータを入力する前に、まずディレクトリ スケルトン、dataset_description.jsonparticipants.tsv、および events.tsv を作成します。
    どのくらいの QC を残せばよいのだろうか 欠落、ノイズ、アーティファクト、除外理由の 4 つの項目だけを修正し、後で項目を増やす方が安全です。
    ベースラインを決定できません 複雑なモデルよりも、モーターリコール 2 クラスやスペクトル要約などの、シンプルで再現しやすいモデルを好みます。
    電車/試験で道に迷った まず、比較がセッション内、セッション間、または被験者間であるかどうかを決定し、次に被験者またはセッションごとに分割ユニットをロックします。
    ステップ 0: バージョンを凍結する

    データセット名だけでは十分ではありません。 OpenNeuro はセマンティック バージョンの Git タグを使用してスナップショットを管理し、PhysioNet はプロジェクトごとにデータセットのバージョンを表示および引用します。したがって、最初の Runbook では、データセット名 だけでなく、スナップショット / バージョン / DOI / 取得日 を記録する必要があります。

    ステップ 1: 最初に BIDS スケルトンを作成する

    最初は中身がずれていても、配置を修正するだけで手戻りが減ります。バリデーターに通すことを前提にファイル名とメタデータのテンプレートを作成すると、その後のQCや比較が非常に楽になります。

    ステップ 2: まず Validator を使用して標準違反を排除します

    機械に発見された問題を早期に解決します。 BIDS Validator に合格することは研究のための十分条件ではありませんが、共有のための最低条件に近いです。

    ステップ 2.5: ローダーとベンチマークを分離して修正する

    MNE-BIDS は、BIDSPath の処理、データの読み込み、メタデータの抽出を支援するツールであり、MOABB はパラダイムと評価ファミリーを修正します。データを読み取るできることと、公正な比較できることの間には違いがあります。特に、MNE-BIDS は変更されたデータまたはプリロードされたデータのライトバックを例外として扱うため、前処理されたデータを明示的なリネージを持つ派生データとして扱う方が安全です。

    ステップ 3: QC ログを波形ではなく数値として残す

    生の波形だけでは、何が問題で何が取り残されたのかを第三者が再構築することは困難です。 L0の本体は不良チャネル、不良セグメント、イベント同期、刺激ログ、反応ログを数値と閾値で記録します。

    ステップ 4: ベースラインを 1 つだけ修正する

    SOTAを使うのではなく、まず再現しやすい比較軸を置きます。初期ベースラインがあると、前処理を更新したりモデルを更新した後でも、何が改善されたかを比較できます。

    項目を確認してください L0 の最下位ライン 体力がなくなったときに戻る場所
    データバージョン スナップショット / バージョン / DOI / 取得日は固定です Wiki: 標準/リポジトリ/バリデータ/ベンチマーク
    データ構造 BIDS 形式で保存可能 共有可能なデータへの最短ルート
    品質管理 QC ログと除外基準は残ります Wiki: イベントの同期と観察ログ
    比較性 1 つのベースラインと評価ファミリ/トレーニング/テスト ルールが修正されています Wiki: データ分割とデータ漏洩
    共有の準備 実行手順、環境、失敗例はサードパーティに渡すことができます 検証インフラストラクチャ

    7) Mind-Upload

    による「共有可能なデータ」への最短ルート

    Mind-Upload の目標は、データを収集するだけではなく、第三者が検証できる形でデータを残すことです。 そのための最短ルートはBIDS/EEG-BIDSに近づくことです。

    検証コモンズ

    「標準 + ストレージ + 評価」のブループリントについては、ここをクリックしてください。

    検証プラットフォームを表示 →

    8) 参考文献と公式ページ

    </article> </main>