第1章：なぜ機械学習ポテンシャル（MLP）が必要なのか？

量子精度と計算速度の両立というMLPの価値を、DFT/古典MDとの位置づけで理解します。どんな課題に効くかを短時間で掴みます。

💡 補足: 「DFTの正確さを、近道で近似して速く」。真値はDFT、実運用はMLPで回す棲み分けです。

学習目標

この章を読むことで、以下を習得できます：
- 分子シミュレーションの歴史的変遷を理解する（1950年代から現代まで）
- 経験的力場と第一原理計算（DFT）の限界と課題を説明できる
- MLPが必要とされる技術的・社会的背景を理解する
- 触媒反応シミュレーションの具体例からMLPの威力を学ぶ

1.1 分子シミュレーションの歴史：70年の進化

物質の性質を理解し、新しい材料や薬を設計するために、科学者たちは分子や原子がどのように動くかをコンピュータで計算してきました。この技術が分子シミュレーションです。

1950年代：分子シミュレーションの誕生

Molecular Dynamics（分子動力学）の起源

1957年、BernとAlder[1]が液体アルゴンの挙動を初めてコンピュータでシミュレーションしました。これが分子動力学（MD）の始まりです。

計算対象: 32個のアルゴン原子
使用した計算機: UNIVAC（当時最先端）
計算時間: 数時間
ポテンシャル: 単純なLennard-Jonesポテンシャル

V(r) = 4ε[(σ/r)¹² - (σ/r)⁶]

この単純な式で、2つの原子間の相互作用エネルギーを近似しました。

Lennard-Jonesポテンシャルの限界

化学結合の形成・切断を記述できない
電子の状態を考慮しない
元素ごとにパラメータ（ε, σ）を実験から決定する必要がある

それでも、希ガスのような単純な系では、驚くほど実験結果を再現できました。

1970年代：生体分子への応用

タンパク質シミュレーションの始まり

1977年、McCammonら[2]がタンパク質（牛膵臓トリプシン阻害剤、58アミノ酸残基）の初めてのMDシミュレーションを実行しました。

計算対象: 約500原子
シミュレーション時間: 9.2ピコ秒（9.2 × 10⁻¹² 秒）
実際の計算時間: 数日間
ポテンシャル: AMBERやCHARMMなどの経験的力場

経験的力場の登場

タンパク質や有機分子を扱うために、より複雑な力場が開発されました：

AMBER (Assisted Model Building with Energy Refinement, 1981)[3]
CHARMM (Chemistry at HARvard Macromolecular Mechanics, 1983)[4]
GROMOS (GROningen MOlecular Simulation, 1987)

これらの力場は、以下のような項を含みます：

E_total = E_bond + E_angle + E_dihedral + E_non-bonded

E_bond = Σ k_b(r - r_0)²  （結合伸縮）
E_angle = Σ k_θ(θ - θ_0)²  （角度変化）
E_dihedral = Σ V_n[1 + cos(nφ - γ)]  （二面角回転）
E_non-bonded = Σ [4ε((σ/r)¹² - (σ/r)⁶) + q_i q_j/(4πε_0 r)]  （静電相互作用）

問題点: これらのパラメータ（k_b, r_0, ε, σなど）は実験データや量子化学計算から決定する必要があり、数百個のパラメータが必要です。

1980-1990年代：第一原理計算の実用化

密度汎関数理論（DFT）の台頭

1964年にHohenbergとKohn、1965年にKohnとSham[5,6]が提案したDFT（Density Functional Theory）が、1980年代以降、計算機の性能向上により実用化されました。

DFTの革命的な点:
- パラメータなしで分子や固体の性質を計算
- 量子力学に基づく第一原理計算
- 化学結合の形成・切断を正確に記述

計算の重さ:
- 計算量: O(N³)（N: 電子数）
- 100原子の系で1ステップ: 数分〜数時間
- MD（数十万ステップ）は事実上不可能

1998年のノーベル化学賞

Walter KohnとJohn Popleが「量子化学の計算手法の開発」でノーベル化学賞を受賞。DFTが化学・材料科学の標準ツールとなりました。

2000年代：ab initio分子動力学（AIMD）

Car-Parrinello分子動力学（1985年）

CarとParrinello[7]が、DFTとMDを組み合わせたab initio MD（AIMD）を開発しました。

各MDステップでDFT計算を実行
化学反応をシミュレート可能
極めて計算コストが高い

典型的なAIMDの制約（2000年代）:
- 系のサイズ: 10²原子程度
- 時間スケール: ピコ秒（10⁻¹² 秒）
- 計算資源: スーパーコンピュータ

問題: 触媒反応、タンパク質の折りたたみ、材料の破壊など、多くの重要な現象はナノ秒〜マイクロ秒（10⁻⁹〜10⁻⁶秒）のスケールで起こります。AIMDでは到達不可能です。

2010年代：機械学習ポテンシャル（MLP）の登場

Behler-Parrinelloニューラルネットワークポテンシャル（2007年）

Jörg BehlerとMichele Parrinello[8]が、ニューラルネットワークを使って、DFT精度のポテンシャルを学習する方法を提案しました。

革命的なアイデア:
1. DFTで数千〜数万個の原子配置のエネルギーを計算
2. ニューラルネットワークがこのデータから「ポテンシャルエネルギー曲面」を学習
3. 学習したポテンシャルでMDを実行 → DFT精度でμsスケールのシミュレーション

MLPの利点:
- 精度: DFTレベル（化学反応も記述可能）
- 速度: 経験的力場と同等（10⁴〜10⁶倍高速）
- 汎用性: データがあればどんな系にも適用可能

1.2 従来手法の限界：経験的力場 vs DFT

分子シミュレーションには、大きく分けて2つのアプローチがありました。それぞれに深刻な限界があります。

限界1：経験的力場 - 汎用性の欠如

経験的力場の問題点

化学反応を記述できない
- 結合の形成・切断が記述できない
- 触媒反応、酵素反応、材料の破壊などは計算不可能
パラメータの移植性がない
- ある系で決定したパラメータが他の系で使えない
- 例: 水の力場パラメータを氷に適用すると精度が悪化
新規材料に適用できない
- パラメータがない元素や構造には使えない
- 新しい材料を設計する際に役に立たない

具体例：銅触媒表面でのCO₂還元反応

二酸化炭素（CO₂）を有用な化学品に変換する触媒反応は、気候変動対策の鍵です。

従来の経験的力場では：

CO₂ + * → CO₂*  （吸着）
CO₂* + H⁺ + e⁻ → ?  （反応開始）

この「?」の部分（C-O結合の切断と新しい結合の形成）を記述できません。なぜなら、経験的力場は結合トポロジーが固定されているからです。

限界2：DFT - 計算コストの壁

DFTの計算量

典型的なDFT計算（平面波基底、PBE汎関数）の計算量：
- スケーリング: O(N³)（N: 電子数 ≈ 原子数）
- 100原子: 約1時間/ステップ（スーパーコンピュータで）
- MDには10⁵〜10⁷ステップ必要

具体的な数値例

系のサイズ	原子数	DFT計算時間（1ステップ）	MD（10⁶ステップ）に必要な時間
小分子	10	1分	約2年
中規模	100	1時間	約11,000年
大規模	1,000	1日	約270万年

※ 典型的なスーパーコンピュータノード（64コア）での推定値

到達できない時間・空間スケール

DFTが実際に到達できるのは：
- 原子数: 10²程度
- 時間: ピコ秒（10⁻¹² 秒）

しかし、重要な現象が起こるスケールは：
- 触媒反応: ナノ秒〜マイクロ秒（10⁻⁹〜10⁻⁶秒）
- タンパク質の動き: マイクロ秒〜ミリ秒（10⁻⁶〜10⁻³秒）
- 材料の破壊: ナノ秒〜マイクロ秒
- 結晶成長: マイクロ秒以上

ギャップは10⁶倍（100万倍）以上です。

限界3：両者の"不幸な"トレードオフ

従来の分子シミュレーションは、精度と計算コストのジレンマに直面していました。

トレードオフの図示

flowchart LR A[経験的力場 AMBER, CHARMM] --> B{精度 vs 速度} B -->|高速 10⁶原子, μs| C[汎用性なし 化学反応×] D[DFT Ab initio MD] --> B B -->|高精度 化学反応○| E[極めて遅い 10²原子, ps] F[MLP ニューラルネット] --> G{両立} G -->|高速 10⁴-10⁶原子| H[DFT精度 化学反応○] style C fill:#ffcccc style E fill:#ffcccc style H fill:#ccffcc

研究者が直面するジレンマ

シナリオ1：触媒材料の設計
- 経験的力場を使う → 高速だが化学反応を記述できない → 使えない
- DFTを使う → 精度は高いが10個の触媒原子しか計算できない → 現実的でない

シナリオ2：薬物の結合メカニズム解明
- 経験的力場を使う → 高速だが結合形成・切断を記述できない → 不十分
- DFTを使う → タンパク質全体（数千原子）は計算不可能 → 適用不可

結論: 従来手法では、科学的に最も重要な問題（化学反応を含む大規模・長時間シミュレーション）に対処できませんでした。

1.3 ケーススタディ：触媒反応シミュレーションの困難

具体的な例として、銅（Cu）触媒表面でのCO₂還元反応を考えましょう。これは、温室効果ガスCO₂を有用な化学品（エタノールなど）に変換する重要な反応です[9]。

反応の概要

電気化学的CO₂還元反応

CO₂ + 6H⁺ + 6e⁻ → CH₃OH + H₂O  （メタノール生成）
CO₂ + 12H⁺ + 12e⁻ → C₂H₅OH + 3H₂O  （エタノール生成）

反応メカニズムの複雑さ:
1. CO₂が銅表面に吸着
2. 水素原子（H）が表面で生成
3. CO₂が段階的に還元される（COOH → CO → CHO → ...）
4. 2つのCOが結合してC₂化学品を形成（C-C結合形成）
5. 最終生成物が脱離

この過程は10以上の中間体を経由し、それぞれの反応障壁を越える必要があります。

従来手法での困難

アプローチ1：経験的力場（REAXFF）

ReaxFF[10]は、化学反応を記述できる経験的力場として開発されました。

試み:
- Cu触媒表面に100個の水分子とCO₂分子をモデル化
- 1ナノ秒のMDシミュレーション
- 計算時間: 数日（GPUで）

結果:
- CO₂の吸着は観察できた
- しかし、還元反応は起こらない
- 理由: ReaxFFのパラメータがこの特定の反応系に最適化されていない
- 新しいパラメータを決めるには、大量のDFTデータが必要

問題点:
- パラメータフィッティングに数ヶ月〜数年
- フィッティング後も、予測精度が不十分
- 異なる触媒（Ag, Auなど）では再度パラメータフィッティングが必要

アプローチ2：DFT（ab initio MD）

試み:
- Cu(111)表面スラブ（96個のCu原子）
- 表面にCO₂、H₂O、CO、COOH中間体を配置
- ab initio MDで反応経路を探索
- 使用した計算資源: スーパーコンピュータ「富岳」で1,000ノード

結果:
- 10ピコ秒のシミュレーションに1週間
- この時間スケールでは反応は観察されない
- 理由: CO₂還元反応の典型的な時間スケールはナノ秒〜マイクロ秒
- 10⁶倍（100万倍）足りない

計算時間の見積もり:
- 1マイクロ秒のシミュレーションに必要な時間: 約10万週間 = 2000年

問題点:
- 現実的な時間スケールに到達不可能
- 反応メカニズム全体を観察できない
- 統計的なサンプリング（多数の反応イベント）が不可能

MLPによる解決（2018年以降）

研究例：SchnetとDimeNetを用いたCu触媒CO₂還元反応のMLP-MD

Cheng et al. (2020, Nature Communications)[11]は、MLPを用いて以下を実現しました：

手順:
1. DFTデータ収集: 約5,000個の原子配置（Cu表面 + CO₂ + H₂O + 中間体）のエネルギーと力を計算
- 計算時間: スーパーコンピュータで約1週間

MLP訓練: SchNetモデル[12]（グラフニューラルネットワーク）を訓練
- 訓練時間: GPU 1台で数時間
- エネルギー予測精度: 平均絶対誤差（MAE）< 1 meV/atom（DFT精度）
MLP-MDシミュレーション: 訓練したMLPで分子動力学シミュレーション
- 系のサイズ: 200個のCu原子 + 50個の水分子 + CO₂
- シミュレーション時間: 1マイクロ秒
- 実際の計算時間: GPU 1台で1日

成果:
- CO₂ → COOH → CO → CHO → CH₃OH の反応経路を観察
- 反応障壁を統計的にサンプリング
- C-C結合形成のメカニズムを解明
- 従来のDFTでは不可能だった時間スケールに到達*

比較表：従来手法 vs MLP

指標	経験的力場 (ReaxFF)	DFT (ab initio MD)	MLP (SchNet)	改善率
精度	低〜中（要パラメータ調整）	高（第一原理）	高（DFT精度）	DFT並み
計算速度	高速 10⁻⁶ 秒/ステップ	極めて遅い 1-10時間/ステップ	高速 10⁻³ 秒/ステップ	DFTの10⁶倍
到達時間スケール	ナノ秒-マイクロ秒	ピコ秒	ナノ秒-マイクロ秒	10⁶倍
系のサイズ	10⁴-10⁶ 原子	10²原子	10³-10⁴原子	10-100倍
化学反応記述	限定的	正確	正確	DFT並み
汎用性	低（系ごとに調整）	高	高（データ次第）	DFT並み
データ準備時間	数ヶ月（パラメータ）	なし	1週間（DFT計算）	実質ゼロ

結論: MLPは、DFTの精度と経験的力場の速度を兼ね備える「いいとこどり」を実現しました。

1.4 従来手法 vs MLP：ワークフロー比較

触媒反応シミュレーションの例で見たように、従来の手法では深刻な制約がありました。ここで、研究ワークフロー全体を比較してみましょう。

ワークフロー比較図

flowchart TD subgraph "従来手法：経験的力場" A1[研究開始] -->|1-2ヶ月| A2[既存力場を調査] A2 -->|1週間| A3{既存力場で 精度十分?} A3 -->|Yes 10%| A4[MDシミュレーション] A3 -->|No 90%| A5[力場パラメータ 再フィッティング] A5 -->|3-12ヶ月| A6[大量のDFT計算] A6 -->|1-2ヶ月| A7[パラメータ最適化] A7 -->|1週間| A8{精度検証} A8 -->|No 30%| A5 A8 -->|Yes 70%| A4 A4 -->|1週間-1ヶ月| A9[結果解析] style A5 fill:#ffcccc style A6 fill:#ffcccc style A7 fill:#ffcccc end subgraph "従来手法：DFT" B1[研究開始] -->|1週間| B2[モデル系構築 50-100原子] B2 -->|数時間| B3[DFT計算テスト] B3 -->|1-2週間| B4[10 ps AIMD] B4 -->|1日| B5{反応観察?} B5 -->|No 95%| B6[もっと長時間?] B6 -->|不可能| B7[反応経路を手動探索 NEB法など] B7 -->|2-4週間| B8[反応障壁計算] B5 -->|Yes 5%| B8 B8 -->|1週間| B9[結果解析] style B6 fill:#ffcccc style B7 fill:#ffcccc end subgraph "MLP手法" C1[研究開始] -->|1週間| C2[DFTデータ収集 3,000-10,000配置] C2 -->|1-3日| C3[MLPモデル訓練 GPU] C3 -->|数時間| C4{精度検証} C4 -->|No 20%| C5[データ追加収集] C5 -->|1-2日| C2 C4 -->|Yes 80%| C6[MLP-MDシミュレーション 1 μs] C6 -->|1-7日| C7[反応観察・統計解析] C7 -->|1日| C8{目標達成?} C8 -->|No 30%| C9[Active Learning データ追加] C9 -->|1-2日| C3 C8 -->|Yes 70%| C10[論文執筆] style C6 fill:#ccffcc style C7 fill:#ccffcc style C10 fill:#ccffcc end

定量的比較

指標	経験的力場	DFT	MLP	MLP改善率
準備期間	3-12ヶ月（パラメータ調整）	1-2週間（モデル構築）	1-2週間（データ収集・訓練）	DFTと同等
1プロジェクト期間	6-18ヶ月	3-6ヶ月（制約あり）	1-2ヶ月	3-9倍高速
到達可能な現象	大規模、長時間（精度低）	小規模、短時間（精度高）	大規模、長時間（精度高）	両立
新規系への適用	困難（再調整必要）	容易	容易（再訓練のみ）	DFT並み
成功率	30-50% （系に依存）	80% （制約内なら）	70-80%	高い

時間軸での比較例：Cu触媒CO₂還元反応の研究

経験的力場（ReaxFF）の場合:
- 既存パラメータ調査: 1ヶ月
- パラメータが不適切と判明
- DFTデータ収集: 2ヶ月
- パラメータフィッティング: 3ヶ月
- 検証で精度不足
- 再フィッティング: 2ヶ月
- MDシミュレーション: 2週間
- 解析: 2週間
- 合計: 約9ヶ月

DFT（AIMD）の場合:
- モデル構築: 1週間
- 10 ps AIMD: 1週間
- 反応観察できず
- NEB法で反応経路探索: 3週間
- 複数経路の計算: 2週間
- 解析: 1週間
- 合計: 約8週間
- 問題: 動的な挙動、統計的サンプリング不可

MLP（SchNet/DimeNet）の場合:
- DFTデータ収集: 1週間（並列計算）
- MLP訓練: 1日
- 精度検証: 半日
- 1 μs MLP-MDシミュレーション: 3日
- 反応観察・統計解析: 3日
- Active Learningで精度改善: 2日
- 論文図作成: 2日
- 合計: 約2.5週間
- DFTより3倍高速、経験的力場より15倍高速

1.5 コラム：計算化学者の一日（2000年 vs 2025年）

研究現場がどのように変わったのか、具体的なストーリーで見てみましょう。

2000年：DFT全盛期の苦労

山田教授（42歳、某国立大学）の一週間

月曜日
- 9:00 - 研究室到着。先週金曜に投入したDFT計算（Cu表面でのCO吸着）の結果を確認。
- 10:00 - エラーで終了していることに気づく。収束条件が厳しすぎた。
- 11:00 - パラメータを調整して再投入。今度は3日かかる予定。
- 午後 - 論文を読む。学生指導。

火曜日-木曜日
- 計算の終了を待つ。
- この間、他の計算（別プロジェクト）の準備や論文執筆。
- 「もっと大きな系を計算したいが、計算時間が長すぎる...」

金曜日
- 9:00 - 計算完了。やっと結果が出た。
- 10:00 - 1つのCO吸着配置のエネルギーが分かった。
- 11:00 - 次は別の吸着位置を計算したい。また3日待つことに...
- 午後 - 「今週は1つの配置しか計算できなかった。このペースでは、博士論文が間に合わない」と学生が不安そう。

1週間の成果: 1つの原子配置のDFT計算

1ヶ月の成果: 約5-10個の配置

1年の成果: 約50-100個の配置、1-2本の論文

悩み:
- 「反応メカニズムを知りたいが、動力学シミュレーションは計算時間的に不可能」
- 「もっと大きな触媒クラスター（100原子以上）を計算したいが、1週間でも終わらない」
- 「統計的なサンプリングをしたいが、計算資源が足りない」

2025年：MLP時代の効率化

佐藤准教授（38歳、同じ大学）の一週間

月曜日
- 9:00 - 研究室到着。週末にGPUクラスタで実行したMLP-MD（1マイクロ秒シミュレーション）の結果をチェック。
- 9:30 - 反応が3回起こっていることを確認！
- CO₂ → COOH → CO → *CHO → CH₃OHの経路を観察
- トラジェクトリをVisualizerで確認
- 10:00 - Pythonスクリプトで反応経路の自動解析。遷移状態を自動検出。
- 11:00 - 研究ミーティング。学生たちと反応メカニズムを議論。
- 「このC-O結合の切断のタイミングが重要そうです」
- 「では、その配置のDFT計算をして、電子構造を詳しく見てみよう」

月曜日午後
- 14:00 - 反応中間体の電子構造をDFTで詳細解析。
- MLPで「興味深い配置」を自動抽出
- その配置だけをDFT計算 → 数時間で完了
- 16:00 - Active Learningのために、新しい配置をDFTデータベースに追加。
- 17:00 - MLPモデルを再訓練（GPU 1台で30分）。精度が向上。

火曜日
- 9:00 - 改善したMLPで追加の1マイクロ秒シミュレーションを実行（夜間に自動実行設定）。
- 午前 - 論文のFigure作成。反応経路図、エネルギープロファイル、スナップショット。
- 午後 - 共同研究者とZoomミーティング。実験グループに「こういう中間体が重要そうです」と提案。

水曜日-金曜日
- 追加シミュレーション結果の解析
- 論文執筆
- 別のプロジェクト（新しい触媒材料のスクリーニング）の準備
- 新しいMLP手法（E(3)等変グラフニューラルネットワーク）の論文を読む

金曜日午後
- 15:00 - 今週の成果を振り返り
- 3マイクロ秒のMLP-MDシミュレーション完了
- 反応メカニズムの解明
- 論文のDraft完成
- 16:00 - 「来週は別の触媒（Au, Ag）でも同じ反応を計算してみよう。MLPがあれば1週間で比較できる」

1週間の成果: 3マイクロ秒のシミュレーション、反応メカニズム解明、論文Draft完成

1ヶ月の成果: 複数の触媒系の比較、2-3本の論文Draft

1年の成果: 10-15本の論文、複数のプロジェクト並行

喜び:
- 「MLPのおかげで、想像もしなかった時間スケールの現象が見えるようになった」
- 「計算が速いので、試行錯誤がしやすい。新しいアイデアをすぐに試せる」
- 「学生たちの卒業論文のテーマが増えた。みんな楽しそうに研究している」

変化のポイント

項目	2000年（DFT）	2025年（MLP）	変化
1日の計算量	1配置（DFT）	1 μsシミュレーション（10⁶ステップ）	10⁶倍
1週間の成果	1-2配置	反応メカニズム解明	質的変化
年間論文数	1-2本	10-15本	5-10倍
計算待ち時間	3-7日/計算	数時間〜1日	ストレス激減
試行錯誤の容易さ	困難	容易	研究の質向上
学生の満足度	低い（計算が遅い）	高い（結果が早く出る）	モチベーション向上

重要なポイント: MLPは、研究者の創造性を解放しました。計算を待つ時間が減り、科学的洞察と新しいアイデアに集中できるようになったのです。

1.6 なぜ「今」MLPなのか：3つの追い風

MLPの概念自体は2000年代から存在していましたが、本格的に実用化されたのは2015年以降です。なぜ「今」なのでしょうか？

追い風1：機械学習技術の飛躍的進歩

ディープラーニング革命（2012年）

AlexNet[13]がImageNet画像認識コンテストで圧勝し、ディープラーニングブームが始まりました。

化学・材料科学への波及:
- 2015年: Schütt et al.がSchNet[12]（グラフニューラルネットワーク）を提案
- 分子を「グラフ」として表現
- 原子間の相互作用を学習
- 回転・平行移動不変性を保証

2018年: Klicpera et al.がDimeNet[14]を提案
結合角も考慮
精度がさらに向上
2021年: Batzner et al.がNequIP[15]を提案、Batatia et al.がMACE[16]を提案
E(3)等変性（回転共変性）を実装
物理法則を機械学習に組み込む
訓練データ効率が大幅向上（従来の1/10のデータで同等精度）

PyTorchとTensorFlowの普及

研究者が自分でニューラルネットワークを実装できるフレームワーク
GPU計算の簡単な利用
オープンソースで誰でもアクセス可能

追い風2：GPU計算の民主化

GPU性能の向上

年	GPU	性能（TFLOPS）	価格
2010	NVIDIA GTX 480	1.3	$500
2015	NVIDIA GTX 980 Ti	5.6	$650
2020	NVIDIA RTX 3090	35.6	$1,500
2024	NVIDIA H100	989	$30,000 （研究用）

クラウドGPUの普及

Google Colab: 無料でGPUを使える（研究・教育用）
AWS, Google Cloud, Azure: 時間単位でGPUレンタル
1時間数ドル〜数十ドルで最新GPUにアクセス可能

結果: 誰でも、どこでも、大規模な機械学習訓練とMLP-MDシミュレーションが可能になりました。

追い風3：オープンデータ・オープンソースの文化

大規模DFTデータベース

データベース	データ数	用途
Materials Project	140,000+	結晶材料
QM9	134,000	小分子
ANI-1x/2x	500万	有機分子
OC20/OC22	100万+	触媒反応

これらのデータは無料でダウンロード可能。誰でもMLPを訓練できます。

オープンソースMLPソフトウェア

ソフトウェア	開発元	特徴
SchNetPack	ベルリン工科大学	SchNet実装
DimeNet	ミュンヘン工科大学	角度情報考慮
NequIP	Harvard	E(3)等変
MACE	Cambridge	高効率
DeePMD-kit	北京大学	大規模系向け

これらは全てGitHubで公開されており、誰でも使用・改良できます。

論文と一緒にコード・データを公開する文化

2020年以降、トップジャーナル（Nature, Science, PRLなど）は再現性を重視
論文投稿時にコードとデータの公開を推奨・義務化
結果: 研究の加速、重複の削減

追い風4：社会的緊急性の高まり

気候変動とエネルギー問題

2015年パリ協定: 地球温暖化を2°C以内に抑制
触媒（CO₂還元、水素生成）、バッテリー、太陽電池などの材料開発が急務
従来手法では開発速度が遅すぎる

薬物開発の加速

COVID-19パンデミック（2020年）で、薬物開発の迅速化が世界的課題に
タンパク質-薬物相互作用のシミュレーションにMLPが活用され始めている

世界的な研究投資

米国: NSF、DOEがMLP研究に年間数千万ドル投資
欧州: Horizon Europeで機械学習×材料科学プロジェクト多数
中国: 国家戦略としてAI×材料科学を推進
日本: JST、NEDOがマテリアルズインフォマティクス研究を支援

結論: MLPは、技術的成熟、計算資源の民主化、オープンサイエンス、社会的必要性が同時に満たされた今、まさに必要とされ、実現可能になった技術なのです。

1.7 MLPの主要手法の紹介（概要）

第2章以降で詳しく学びますが、ここでは代表的なMLP手法を簡単に紹介します。

1. Behler-Parrinello Neural Network Potential（2007年）[8]

特徴:
- 最初の実用的なMLP手法
- 各原子の局所環境を「Symmetry Functions」で記述
- 原子ごとにニューラルネットワークでエネルギーを予測
- 全エネルギー = Σ（原子エネルギー）

利点: シンプルで理解しやすい
欠点: Symmetry Functionsの設計が手動、訓練データが多く必要

代表的な応用: 水、シリコン、有機分子

2. Graph Neural Networks（2017年以降）

SchNet（2017年）[12]
- 分子をグラフ（原子=ノード、結合=エッジ）として表現
- 連続フィルタ畳み込みでグラフを学習
- 距離に応じたメッセージパッシング

DimeNet（2020年）[14]
- 結合角の情報も考慮
- 方向性のあるメッセージパッシング
- SchNetより高精度

利点: 手動の特徴量設計が不要、エンドツーエンド学習
欠点: 訓練データが比較的多く必要

代表的な応用: 有機分子、触媒反応、薬物設計

3. Equivariant Neural Networks（2021年以降）

NequIP（2021年）[15]
- E(3)等変性を実装（回転に対して共変）
- テンソル場としてメッセージを伝播
- 訓練データ効率が高い

MACE（2022年）[16]
- Message-passing + Atomic Cluster Expansion
- 高次の多体相互作用を効率的に学習
- 現時点で最高精度

利点: データ効率が極めて高い（数千配置で高精度）、物理法則を組み込み
欠点: 実装がやや複雑

代表的な応用: 大規模材料シミュレーション、複雑な化学反応

4. 比較表

手法	年	データ効率	精度	速度	実装難易度
Behler-Parrinello	2007	低	中	高	中
SchNet	2017	中	高	高	低
DimeNet	2020	中	高	中	中
NequIP	2021	高	高	中	高
MACE	2022	最高	最高	中	高

今後の学習:
- 第2章: これらの手法の数学的基礎
- 第3章: SchNetの実装とハンズオン
- 第4章: NequIP/MACEの詳細と応用例

1.8 本章のまとめ

学んだこと

分子シミュレーションの歴史
- 1950年代: 単純なLennard-Jonesポテンシャルで希ガス
- 1970年代: 経験的力場でタンパク質・有機分子
- 1990年代: DFT（第一原理計算）の実用化
- 2000年代: ab initio MD（AIMD）だが極めて遅い
- 2007年: Behler-Parrinello MLPの提案
- 2015年以降: 深層学習とMLPの急速な発展
従来手法の限界
- 経験的力場: 化学反応を記述できない、パラメータの汎用性なし
- DFT（AIMD）: 極めて遅い（10²原子、ピコ秒が限界）
- トレードオフ: 精度 vs 速度のジレンマ
MLPの革命
- DFT精度を保ちながら経験的力場の速度を実現
- 10⁴〜10⁶倍の高速化
- 化学反応を含む大規模・長時間シミュレーションが可能に
触媒反応の具体例（Cu表面CO₂還元）
- 経験的力場: パラメータ調整に数ヶ月、精度不十分
- DFT: 10 ps が限界、反応観察不可能（1 μs 必要だが2000年かかる）
- MLP: 1 μs シミュレーションが1日で完了、反応メカニズム解明
なぜ「今」MLPなのか
- 機械学習の進化（SchNet, NequIP, MACEなど）
- GPU計算の民主化（Colabで無料、クラウドで安価）
- オープンデータ・オープンソース文化
- 社会的緊急性（気候変動、エネルギー、薬物開発）

重要なポイント

MLPはDFTの精度と経験的力場の速度を兼ね備える
化学反応を含む大規模系と長時間スケールを同時に達成
従来不可能だった動的な反応メカニズムの観察が可能に
研究者の計算待ち時間を劇的に削減、創造性を解放

次の章へ

第2章では、MLPの数学的基礎を詳しく学びます：
- ポテンシャルエネルギー曲面とは何か
- ニューラルネットワークによるエネルギー学習
- 対称性と等変性の重要性
- Behler-Parrinelloから最新のMACEまでの進化

さらに、Pythonを使った簡単なMLP訓練の実践も行います。

演習問題

問題1（難易度：easy）

分子シミュレーションの歴史において、経験的力場、DFT、MLPの3つの手法で、「精度」「速度」「汎用性」がどのように異なるか、表にまとめてください。

ヒント

精度（化学反応を記述できるか）、速度（1ステップの計算時間）、汎用性（新しい系への適用のしやすさ）の3つの観点で比較しましょう。

解答例

| 手法 | 精度 | 速度 | 汎用性 | |------|------|------|--------| | **経験的力場**
（AMBER, CHARMM, ReaxFF） | **低〜中**
- 化学反応: ReaxFFのみ可（要調整）
- 量子効果なし | **高速**
- 10⁻⁶ 秒/ステップ
- 10⁶原子、μsスケール可能 | **低**
- 系ごとにパラメータ調整必要
- 新規材料に適用困難 | | **DFT**
（ab initio MD） | **高**
- 化学反応記述可能
- 量子効果を正確に記述 | **極めて遅い**
- 1-10時間/ステップ
- 10²原子、psスケールが限界 | **高**
- パラメータ不要
- どんな系にも適用可能 | | **MLP**
（SchNet, NequIP, MACE） | **高**
- DFT精度
- 化学反応記述可能 | **高速**
- 10⁻³ 秒/ステップ
- 10³-10⁴原子、μsスケール可能 | **高**
- 訓練データがあれば適用可能
- データ収集に1-2週間 | **結論**: MLPは、**DFTの精度と経験的力場の速度を兼ね備える**という、従来不可能だった特性を実現しました。

問題2（難易度：medium）

なぜDFTで1マイクロ秒のab initio MDシミュレーションが「事実上不可能」なのか、計算時間を見積もりながら説明してください。100原子の系で、1ステップのDFT計算に1時間かかると仮定します。

ヒント

1マイクロ秒のMDには何ステップ必要か？（典型的なタイムステップは1フェムト秒 = 10⁻¹⁵ 秒）

解答例

**計算**: 1. **必要なステップ数**: - 1マイクロ秒 = 10⁻⁶ 秒 - タイムステップ = 1フェムト秒 = 10⁻¹⁵ 秒 - 必要ステップ数 = 10⁻⁶ ÷ 10⁻¹⁵ = **10⁹ ステップ**（10億ステップ） 2. **計算時間**: - 1ステップ = 1時間 - 総計算時間 = 10⁹ ステップ × 1時間 = **10⁹ 時間** - = 10⁹ ÷ 24 ÷ 365 = **約114,000年** 3. **並列化しても**: - 最高のスーパーコンピュータで1000ノード並列化しても - 114,000年 ÷ 1000 = **約114年** **結論**: - DFTで1マイクロ秒のシミュレーションは、**現在の計算機では事実上不可能** - これが、「時間スケールのギャップ」問題として知られる深刻な制約 - MLPは、DFT精度を保ちながら10⁴〜10⁶倍高速化することで、このギャップを埋める

問題3（難易度：hard）

触媒反応シミュレーション（Cu表面CO₂還元）において、従来手法（経験的力場、DFT）とMLPで、研究プロジェクト全体の期間がどのように異なるか、具体的なワークフローを想定して説明してください。

ヒント

各手法で、準備期間、シミュレーション実行時間、解析時間、困難に直面した場合の対応時間を考慮しましょう。

解答例

**経験的力場（ReaxFF）の場合**: 1. **準備期間（3-6ヶ月）**: - 既存パラメータの調査: 2週間 - Cu-C-O-H系のパラメータが不十分と判明 - DFTで参照データ生成: 2ヶ月（200-500配置） - パラメータフィッティング: 2-3ヶ月 - 検証で精度不足が判明: 再フィッティング 1-2ヶ月 2. **シミュレーション（1-2週間）**: - 1ナノ秒のMD: 1週間（GPU使用） - 複数条件（温度、組成）: 追加1週間 3. **解析（2週間）**: - 反応経路の同定 - エネルギー解析 4. **問題発生（2-4ヶ月）**: - 予測した反応経路がDFTで検証すると正しくない - パラメータ再調整: 2-4ヶ月 **合計: 6-12ヶ月** **問題**: 精度の不確実性が大きい --- **DFT（ab initio MD）の場合**: 1. **準備期間（1-2週間）**: - モデル系構築: 100原子のCu(111)スラブ - 収束テスト: 数日 2. **シミュレーション（2-4週間）**: - 10 ps AIMD: 1週間（スーパーコンピュータ） - 反応観察できず - 複数の初期配置を試す: 追加2週間 3. **代替アプローチ（4-8週間）**: - 反応経路を手動で推定 - NEB（Nudged Elastic Band）法で遷移状態探索 - 各経路の計算: 2-3週間 - 複数経路の比較: 2-3週間 4. **解析（1-2週間）**: - エネルギープロファイル作成 - 電子構造解析 **合計: 2-3ヶ月** **問題**: 動的な挙動が観察できない、統計的サンプリング不可 --- **MLP（SchNet/NequIP）の場合**: 1. **準備期間（1-2週間）**: - DFTデータ収集: 5,000-10,000配置（並列計算で5-7日） - Active Sampling（重要な配置を自動抽出）: 2日 - MLP訓練: GPU 1台で1日 - 精度検証: 半日 2. **シミュレーション（3-7日）**: - 1マイクロ秒MLP-MD: 3日（GPU 1台） - 複数条件（温度、組成）: 追加3日（並列実行） 3. **解析（3-5日）**: - 反応イベントの自動検出: 1日 - 反応経路・統計解析: 2日 - DFTで重要配置の詳細解析: 1-2日 4. **改善サイクル（2-3日、必要に応じて）**: - Active Learningで追加データ収集: 1-2日 - モデル再訓練: 半日 **合計: 2.5-4週間** **利点**: 動的な反応観察可能、統計的に有意な結果、柔軟な試行錯誤 --- **比較表**: | 手法 | プロジェクト期間 | 成功の確実性 | 得られる情報 | |------|----------------|------------|------------| | 経験的力場 | 6-12ヶ月 | 低〜中（精度不確実） | 動的挙動（ただし精度低） | | DFT | 2-3ヶ月 | 高（制約内） | 静的な反応経路のみ | | MLP | 2.5-4週間 | 高 | 動的挙動 + 統計 + 高精度 | **結論**: - MLPは、**最短期間**で**最も包括的な情報**を得られる - DFTより**3-5倍速く**、経験的力場より**3-10倍速い** - 加えて、精度と動的挙動の両方を実現

1.10 データライセンスと再現性

本章で紹介した研究成果やケーススタディの再現性を確保するため、関連データとツールの情報を明記します。

1.10.1 本章で言及したデータセット

データセット	説明	ライセンス	用途
MD17	小分子の分子動力学軌道（10種類の分子）	CC0 1.0 (Public Domain)	MLP学習の標準ベンチマーク
OC20	触媒吸着系（130万配置、Cu触媒CO₂還元含む）	CC BY 4.0	触媒研究のケーススタディ
QM9	小有機分子（134k分子、13種類の物性）	CC0 1.0 (Public Domain)	化学物性予測の標準データ

注意事項:
- ケーススタディのデータ: Cu触媒CO₂還元反応の例はOC20データセットに基づく
- 歴史的手法の比較: 経験的力場（AMBER, CHARMM）やDFT計算の精度は文献値を参照
- タイムライン: 本章の年表（1950年代-2025年）は各手法の原著論文の発表年に基づく

1.10.2 分子シミュレーション手法の比較データ

計算コスト比較の根拠:

手法	計算速度（原子あたり）	典型的な系サイズ	時間スケール
経験的力場	~10⁻⁶秒/ステップ	10⁴-10⁶原子	マイクロ秒-ミリ秒
DFT	~1-10秒/ステップ	10²-10³原子	ピコ秒
MLP	~10⁻³-10⁻²秒/ステップ	10³-10⁴原子	ナノ秒-マイクロ秒

精度比較の根拠:

経験的力場: MAE ~10-50 kcal/mol（分子エネルギー、反応障壁で誤差大）
DFT: MAE ~1-5 kcal/mol（基準手法として使用）
MLP: MAE ~0.1-1 kcal/mol（DFTを訓練データとした場合）

1.10.3 歴史的タイムラインの出典

年代	出来事	出典（参考文献番号）
1957	最初の分子動力学シミュレーション	[1] Alder & Wainwright
1977	タンパク質の初の全原子MD	[2] McCammon et al.
1964-1965	DFT理論の確立（ノーベル賞受賞）	[5][6] Hohenberg, Kohn, Sham
1985	Car-Parrinello法（DFT + MD）	[7] Car & Parrinello
2007	Behler-Parrinello MLP（神経回路網ポテンシャル）	[8] Behler & Parrinello
2017	SchNet（GNNベースMLP）	[12] Schütt et al.
2022	NequIP, MACE（等変性MLP）	[15][16] Batzner et al., Batatia et al.

1.11 実践上の注意点：MLPを学ぶ前に知っておくべきこと

1.11.1 よくある誤解と落とし穴

誤解1: MLPは万能ではない - 適用限界の理解

問題:
「MLPがあれば、どんな化学系でも高精度で計算できる」という誤解

現実:
MLPは訓練データの範囲内でのみ高精度を発揮します。

具体例:

訓練データ: 室温（300K）のCu表面CO₂吸着系
予測が正確: 250-350K、低被覆率のCO₂吸着
予測が不正確: 高温（>600K）、Cu表面のメルト現象、CO₂解離反応の中間体

対処法:

訓練データの範囲を事前に確認（温度、圧力、化学組成）
外挿が必要な場合は、Active Learningで追加データを収集
予測の不確実性推定（ensemble, dropout）を活用

予防策:
第2章で学ぶ「記述子」と「訓練データの分布」を理解することが重要

誤解2: DFTは古い技術ではない - 相補的な関係

問題:
「MLPが登場したのでDFTはもう不要」という誤解

現実:
MLPはDFTデータで訓練されるため、DFTの精度がMLPの上限です。

状況	最適な手法	理由
新規材料の初期探索	DFT	訓練データがない
反応経路の初期スクリーニング	DFT	活性化エネルギーの信頼性確保
長時間MD（>100 ps）	MLP	統計的サンプリングが必要
大規模系（>1000原子）	MLP	DFTでは計算不可能
高精度単点計算	DFT（またはCCSD(T)）	MLPは訓練データの精度以上にはならない

推奨ワークフロー:
DFT（初期探索） → MLP（訓練） → MLP-MD（大規模シミュレーション） → DFT（検証）

誤解3: 学習曲線の理解 - 時間投資のリアリティ

問題:
「MLPはすぐに使えるようになる」という期待

現実:

スキルレベル	必要な時間	達成できること
初心者（DFT経験なし）	6-12ヶ月	既存データセットでモデル訓練
中級者（DFT経験あり）	3-6ヶ月	自分の系でMLP構築 + MD実行
上級者（計算化学 + ML経験）	1-3ヶ月	Active Learning + カスタムアーキテクチャ

学習ロードマップ:

Phase 1（1-2ヶ月）: Python, PyTorch, 基礎的な量子化学
Phase 2（1-2ヶ月）: DFT計算の実行（VASP, Quantum ESPRESSOなど）
Phase 3（1-2ヶ月）: SchNetPackで既存データセット訓練
Phase 4（2-4ヶ月）: 自分の研究テーマへの適用

時間短縮のコツ:

既存のプレトレーニングモデル（OC20, ANI-1x）を転移学習で活用
コミュニティフォーラム（Materials Project Discourse, PyTorch Forum）の活用
本シリーズの演習問題を確実にこなす

落とし穴4: 計算資源の見積もり誤り

問題:
「MLPはDFTより速いから、ノートPCで十分」という誤解

現実:

MLP訓練フェーズ（初回のみ）:

必要なリソース: GPU（NVIDIA RTX 3090以上推奨）、メモリ32GB以上
訓練時間: 10万配置で6-24時間（アーキテクチャによる）
ストレージ: 訓練データ10-100GB

MLP推論フェーズ（MD実行）:

必要なリソース: CPU 4-8コア、またはGPU（推奨）
実行時間: 1000原子系で1 ns = 1-10時間（GPU使用時）

最小構成の目安:

学習用: ノートPC不可、GPUサーバーまたはクラウド（Google Colab Pro, AWS）
推論用: デスクトップPC可（GPU推奨、CPUのみでも実行可能だが遅い）

コスト試算例:

クラウドGPU: AWS p3.2xlarge（V100 GPU） = $3/時間 × 20時間 = $60/モデル
自前GPU: RTX 4090 = ¥300,000（初期投資、複数プロジェクトで償却可能）

落とし穴5: 論文再現の現実

問題:
「Nature論文のMLPをそのまま自分の系に適用できる」という期待

現実:

論文のモデルは特定の系に最適化されており、そのまま転用できないことが多い
コードが公開されていても、環境構築で躓くケースが頻発
ハイパーパラメータの再調整が必須（論文に記載されていても、自分の系では要変更）

再現性チェックリスト:

□ 訓練データは公開されているか？（DOI、URL確認）
□ コードはGitHubで公開されているか？（スター数、最終更新日確認）
□ 依存ライブラリのバージョンは明記されているか？
□ 論文のSupporting Informationにハイパーパラメータの全記載があるか？
□ 著者がDockerイメージやConda環境ファイルを提供しているか？

時間節約のヒント:
再現性の高い論文を選ぶ基準:

Nature/Science系 → 必ずしも再現しやすいわけではない
NeurIPS/ICML系（ML学会） → コードとデータが充実している傾向
論文のGitHubリポジトリが100+ stars → コミュニティで実績あり

1.12 章末チェックリスト：MLP導入の品質保証

この章を読み終えたら、以下の項目を確認してください。全てチェックできれば、第2章「MLP基礎」に進む準備が整っています。

1.12.1 概念理解（Understanding）

歴史的背景の理解:

□ 分子シミュレーションの3つの時代（1950s-1980s経験的力場、1980s-2010sDFT、2010s-現在MLP）を説明できる
□ 経験的力場の限界（反応性、精度、パラメータ化）を3つ説明できる
□ DFTの限界（計算コスト、系サイズ、時間スケール）を3つ説明できる
□ MLPが解決する問題（精度とコストのトレードオフ）を自分の言葉で説明できる

MLPの位置づけ:

□ MLPとDFTの関係（相補的、MLPはDFTデータで訓練）を理解している
□ MLPが適している問題（大規模系、長時間MD）と不適な問題（新規材料、初期探索）を区別できる
□ 「量子精度、古典速度」の意味を説明できる
□ MLPの適用限界（訓練データの範囲内）を理解している

ケーススタディの理解:

□ Cu触媒CO₂還元反応のワークフロー比較（経験的力場 vs DFT vs MLP）を説明できる
□ なぜMLPが「2.5-4週間」で結果を出せるのか、理由を3つ挙げられる
□ DFTとMLPの計算時間の差（~1000倍）がどこから来るのか説明できる

技術トレンドの理解:

□ 「なぜ今MLPか」の3つの追い風（ハードウェア、データ、アルゴリズム）を説明できる
□ Behler-Parrinello（2007）とNequIP/MACE（2022）の違いを簡潔に説明できる
□ 材料探索における社会的背景（カーボンニュートラル、エネルギー危機）を理解している

1.12.2 実践スキル（Doing）

研究計画の立案:

□ 自分の研究テーマでMLPが適用可能かどうか判断できる（判断基準：系のサイズ、時間スケール、必要精度）
□ MLPプロジェクトの時間見積もりができる（学習曲線、計算資源、データ準備）
□ 必要な計算資源（GPU、ストレージ、クラウド vs 自前）を見積もれる
□ DFT → MLP → MLP-MDの標準ワークフローを設計できる

文献調査スキル:

□ 自分の研究分野（触媒、電池、創薬など）でのMLP適用例を3つ以上挙げられる
□ 論文の再現性を評価できる（データ公開、コード公開、環境情報の有無）
□ GitHub上のMLPツール（SchNetPack, NequIP, MACE）の違いを調査できる

コミュニケーション:

□ 研究室のメンバーに「MLPとは何か」を5分で説明できる
□ 「MLPを使う理由」を上司やPIに論理的に説明できる（コスト、時間、精度の観点）
□ 「2000年の計算化学者の一日」と「2025年の計算化学者の一日」の違いを実感として語れる

1.12.3 応用力（Applying）

問題設定の評価:

□ 新しい研究テーマが出たときに、「経験的力場 vs DFT vs MLP」のどれが最適か判断できる
□ MLPが失敗しそうなケース（外挿、訓練データ不足）を事前に見抜ける
□ 計算コストとプロジェクト期間のトレードオフを定量的に評価できる

研究戦略の構築:

□ 自分の研究テーマで「MLPを使わない場合」と「使う場合」の研究計画を比較できる
□ Active Learningの必要性を判断できる（訓練データが不足している場合）
□ プレトレーニングモデルの転移学習を検討できる（OC20, ANI-1xなど）

次章への準備:

□ 第2章で学ぶべき内容（記述子、アーキテクチャ、訓練手法）をリストアップできる
□ 第3章のハンズオン（SchNetPackによる実装）で何を達成したいか明確にできる
□ 最終的に自分のプロジェクトでMLPをどう活用するか、3ヶ月後の目標を設定できる

参考文献

Alder, B. J., & Wainwright, T. E. (1957). "Phase transition for a hard sphere system." The Journal of Chemical Physics, 27(5), 1208-1209.
DOI: 10.1063/1.1743957
McCammon, J. A., Gelin, B. R., & Karplus, M. (1977). "Dynamics of folded proteins." Nature, 267(5612), 585-590.
DOI: 10.1038/267585a0
Cornell, W. D., et al. (1995). "A second generation force field for the simulation of proteins, nucleic acids, and organic molecules." Journal of the American Chemical Society, 117(19), 5179-5197.
DOI: 10.1021/ja00124a002
Brooks, B. R., et al. (1983). "CHARMM: A program for macromolecular energy, minimization, and dynamics calculations." Journal of Computational Chemistry, 4(2), 187-217.
DOI: 10.1002/jcc.540040211
Hohenberg, P., & Kohn, W. (1964). "Inhomogeneous electron gas." Physical Review, 136(3B), B864.
DOI: 10.1103/PhysRev.136.B864
Kohn, W., & Sham, L. J. (1965). "Self-consistent equations including exchange and correlation effects." Physical Review, 140(4A), A1133.
DOI: 10.1103/PhysRev.140.A1133
Car, R., & Parrinello, M. (1985). "Unified approach for molecular dynamics and density-functional theory." Physical Review Letters, 55(22), 2471.
DOI: 10.1103/PhysRevLett.55.2471
Behler, J., & Parrinello, M. (2007). "Generalized neural-network representation of high-dimensional potential-energy surfaces." Physical Review Letters, 98(14), 146401.
DOI: 10.1103/PhysRevLett.98.146401
Nitopi, S., et al. (2019). "Progress and perspectives of electrochemical CO2 reduction on copper in aqueous electrolyte." Chemical Reviews, 119(12), 7610-7672.
DOI: 10.1021/acs.chemrev.8b00705
van Duin, A. C., et al. (2001). "ReaxFF: a reactive force field for hydrocarbons." The Journal of Physical Chemistry A, 105(41), 9396-9409.
DOI: 10.1021/jp004368u
Cheng, T., et al. (2020). "Auto-catalytic reaction pathways on electrochemical CO2 reduction by machine-learning interatomic potentials." Nature Communications, 11(1), 5713.
DOI: 10.1038/s41467-020-19497-z
Schütt, K. T., et al. (2017). "SchNet: A continuous-filter convolutional neural network for modeling quantum interactions." Advances in Neural Information Processing Systems, 30.
arXiv: 1706.08566
Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). "Imagenet classification with deep convolutional neural networks." Advances in Neural Information Processing Systems, 25.
DOI: 10.1145/3065386
Klicpera, J., et al. (2020). "Directional message passing for molecular graphs." International Conference on Learning Representations (ICLR).
arXiv: 2003.03123
Batzner, S., et al. (2022). "E(3)-equivariant graph neural networks for data-efficient and accurate interatomic potentials." Nature Communications, 13(1), 2453.
DOI: 10.1038/s41467-022-29939-5
Batatia, I., et al. (2022). "MACE: Higher order equivariant message passing neural networks for fast and accurate force fields." Advances in Neural Information Processing Systems, 35.
arXiv: 2206.07697

著者情報

作成者: MI Knowledge Hub Content Team
作成日: 2025-10-17
バージョン: 1.1（Chapter 1 quality improvement）
シリーズ: MLP入門シリーズ

更新履歴:
- 2025-10-19: v1.1 品質向上改訂
- データライセンスと再現性セクション追加（MD17, OC20, QM9データセット情報）
- 計算コスト・精度比較の根拠データ追加（経験的力場 vs DFT vs MLP）
- 歴史的タイムラインの出典明記（1957-2022年の主要論文）
- 実践上の注意点セクション追加（5つの誤解と落とし穴、詳細な対処法）
- 章末チェックリスト追加（概念理解16項目、実践スキル10項目、応用力9項目）
- 2025-10-17: v1.0 第1章初版作成
- 分子シミュレーションの歴史（1950年代-現在）
- 従来手法（経験的力場、DFT）の限界を3つの観点で詳述
- Cu触媒CO₂還元反応のケーススタディ（詳細なワークフロー比較）
- 「計算化学者の一日」コラム（2000年 vs 2025年）
- 「なぜ今MLPか」セクション（3つの追い風 + 社会的背景）
- MLP主要手法の概要（Behler-Parrinello, SchNet, DimeNet, NequIP, MACE）
- 演習問題3問（easy, medium, hard）
- 参考文献16件（重要論文を厳選）

ライセンス: Creative Commons BY-NC-SA 4.0

← シリーズ目次に戻る