Skip to main content
LibreTexts - Ukrayinska

19.4: Додаткові відомості про впровадження мультиконфігураційних методів

  • Page ID
    22460
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Метод MCSCF

    Одночасна оптимізація коефіцієнтів LCAO-MO та CI, виконана в рамках розрахунку MCCF, є досить грізним завданням. Варіаційний енергетичний функціонал являє собою квадратичну функцію коефіцієнтів СІ, і тому можна висловити стаціонарні умови для цих змінних у світському вигляді:

    \[ \sum\limits_J\text{H}_{I,J}C_J = \text{E C}_I . \]

    Однак Е є квартичною функцією\(_{\nu ,i}\) коефіцієнтів C, оскільки кожен елемент матриці\( \Phi_I \big| \text{ H } \big| \Phi_I \rangle \) включає одно- та двоелектронні інтеграли над мосом\(\phi_i\), а двоелектронні інтеграли залежать від\(C_{\nu ,i}\) коефіцієнтів. Стаціонарні умови щодо цих\(C_{\nu ,i}\) параметрів повинні вирішуватися ітераційно через цю квартичну залежність.

    Загальновідомо, що мінімізація функції (Е) декількох нелінійних параметрів є складним завданням, яке може страждати від поганої збіжності і може знаходити локальні, а не глобальні мінімуми.\(C_{\nu ,i}\) У хвильової функції MCCF, що містить багато CSF, енергія лише слабо залежить від слабо зайнятих орбіталей (тобто тих, що з'являються в CSF з малими\(C_I\) значеннями); навпаки, Е сильно залежить від\(C_{\nu ,i}\) коефіцієнтів тих орбіталей, які з'являються в CSF з більшими \(C_I\)цінності. Тому один стикається з мінімізацією функції багатьох змінних (їх може бути\(C_{\nu ,i}\) стільки, скільки квадрат числа орбітальних базисних функцій), що сильно залежить від декількох змінних і слабо від багатьох інших. Це дуже складна робота.

    З цих причин у методі MCSCF кількість CSF зазвичай зберігається до невеликого до помірного числа (наприклад, від декількох до декількох сотень), обраного для опису суттєвих кореляцій (тобто перетинів конфігурації, належної дисоціації) та важливих динамічних кореляцій (ці електронно-парні кореляції кутових , радіальні, ліво-праві тощо природи, які виникають, коли присутні низько розташовані «віртуальні» орбіталі). У такій компактній хвильовій функції з'являються лише спін-орбіталі з досить великими професіями (наприклад, що характеризуються діагональними елементами матриці щільності однієї частинки\(\gamma_{i,}\) j). В результаті енергетичний функціонал виражається через змінні, від яких він сильно залежить, і в цьому випадку нелінійний процес оптимізації менш схильний до патологічного.

    Така компактна хвильова функція MCSCF покликана забезпечити хороший опис безлічі сильно зайнятих спин-орбіталей та амплітуд КІ для CSF, в яких фігурують тільки ці спін-орбіталі. У ньому, звичайно, немає інформації про спін-орбіталі, які не використовуються для формування CSF, на яких базується розрахунок MCCF. Як результат, енергія MCCF є інваріантною до унітарної трансформації серед цих «віртуальних» орбіталів.

    На додаток до посилань, згаданих раніше в ACP та MTC, наступні статті описують кілька досягнень, які були досягнуті в методі MCSCF, особливо щодо підвищення його швидкості та діапазону конвергенції: E. Dalgaard і P. Jørgensen, J. Chem. Фіз. 69, 3833 (1978); Г.Дж. Йенсен, П. Йоргенсен, і H. Ågren, Дж. Chem. Фіз. 87, 457 (1987); Б.Х. Ленгсфілд, III і Б. Лю, Дж. Фіз. 75, 478 (1981).

    Метод взаємодії конфігурації

    У методі конфігураційної взаємодії (CI) зазвичай намагаються реалізувати високорівневу обробку електронної кореляції. Набір ортонормальних молекулярних орбіталів спочатку отримують з розрахунку SCF або MCSCF (зазвичай за участю невеликого до помірного списку CSF). Коефіцієнти LCAO-MO цих орбіталів більше не розглядаються як варіаційні параметри при наступному обчисленні СІ; тільки\(C_I\) коефіцієнти підлягають подальшій оптимізації.

    Хвильова функція CI

    \[ \psi = \sum\limits_J C_J \Phi_J \]

    найчастіше будується з CSF\(\Phi_J\), які включають:

    1. Усі CSF у SCF (у цьому випадку включена лише одна спинномозкова функція) або хвильова функція MCSF, яка використовувалася для генерації молекулярних орбіталів\(\phi_i\). Цей набір CSF називають охоплюючим «опорний простір» подальшого обчислення CI, а конкретна комбінація цих CSF, що використовується в цій орбітальної оптимізації (тобто хвильова функція SCF або MCSCF) називається еталонною функцією.
    2. CSF, які генеруються шляхом проведення одинарних, подвійних, потрійних тощо рівня «збуджень» (тобто орбітальних замін) щодо еталонних CSF. CI хвильові функції, обмежені включенням внесків через різні рівні збудження (наприклад, одинарний, подвійний тощо), позначаються S (поодиноко збуджений), D (подвійно), SD (поодиноко та подвійно), SDT (поодиноко, подвійно та потрійно) тощо.

    Орбіталі, з яких видаляються електрони, і ті, в які збуджуються електрони, можуть бути обмежені, щоб зосередити увагу на кореляціях між певними орбіталями. Наприклад, якщо виключені збудження електронів ядра, обчислюється загальна енергія, яка не містить кореляційних поправок для цих основних орбіталей. Часто можна так обмежити характер орбітальних збуджень, щоб зосередитися на енергетичних кількостях, що представляють інтерес (наприклад, розрив зв'язку CC в етані вимагає кореляції\(\sigma_{CC}\) орбіти, але 1s вуглецевого ядра орбіталі та орбіталі зв'язку CH можуть лікуватися некорельованим способом).

    Зрозуміло, що кількість CSF, включених до обчислення CI, може значно перевищувати число, яке розглядається в типових розрахунках MCSCF; Зазвичай використовуються хвильові функції CI, включаючи від 5000 до 50 000 CSF, а функції з одним до декількох мільйонів CSF знаходяться в області практичності (див. Наприклад, Дж. Олсен, Б. Рос, Поул Йоргенсен та Х.Дж. Дженсен, Дж. Фіз. 89, 2185 (1988) і Дж. Олсен, П. Йоргенсен, і Дж. Сімонс, Хім. Фіз. Листи 169, 463 (1990)).

    Потреба в таких великих розширеннях ліквору не повинна стати несподіванкою, якщо врахувати, що (i) кожна електронна пара вимагає принаймні двох CSF (скажімо, це вимагає P з них, в середньому, домінантного та P-1 інших, які подвійно збуджуються) для формування поляризованих орбітальних пар, (ii) є порядок N (N-1) /2 = X електронних пар в атомі або молекулі, що містить N електронів, і (iii) що кількість членів у хвильовій функції СІ масштабується як\(P^X\). Отже, для молекули H\(_2\) O, що містить десять електронів, у розширенні CI були б члени P\(^{55}\). Це 3.6 x10\(^{16}\) терміни, якщо P = 2 і 1,7 x10\(^{26}\) терміни, якщо P = 3. Безсумнівно, це надмірна оцінка кількості CSF, необхідних для опису електронної кореляції в H\(_2\) O, але вона демонструє, наскільки швидко кількість CSF може зростати з кількістю електронів в системі.

    \(H_{I,J}\)Матриці, що виникають при розрахунках СІ, оцінюються через одно- і двоелектронні інтеграли над молекулярними орбіталями з використанням еквівалента правил Слейтера-Кондона. Для великих обчислень CI повна\(H_{I,J}\) матриця фактично не оцінюється і не зберігається в пам'яті комп'ютера (або на його диску); скоріше, так звані «прямі CI» методи (див. Статтю Roos і Siegbahn в MTC) використовуються для обчислення і відразу підсумовування внесків до суми\( \sum\limits_J \text{H}_{I,J}C_I \) в терміні інтеграли, елементи матриці щільності та наближені значення\(C_J\) амплітуд. Ітераційні методи (див., наприклад, Е.Р. Девідсон, Дж. Фіз. 17, 87 (1975)), в яких наближені значення\(C_J\) коефіцієнтів і енергії Е уточнюються шляхом послідовного застосування\( \sum\limits_I\text{H}_{I,J} \) до попередньої оцінки\(C_J\) вектора, використовуються для вирішення цих великих задач матриці СІ на власні значення.

    Метод MPPT/MBPT

    У методі MPPT/MBPT після вибору еталонної CSF та визначення орбіталів SCF, що належать до цієї CSF, хвильова функція\(\psi\) та енергія Е визначаються в порядку порядку. Це одна з основних сильних сторін методики MPPT/MBPT; вона не вимагає, щоб зробити подальший (потенційно довільний) вибір після визначення базового набору та домінуючої (SCF) конфігурації. На відміну від лікування MCSCF та CI, не потрібно робити вибір CSF для включення або виключення з\(\psi\). Рівняння збурень MPPT/MBPT визначають, які CSF повинні бути включені в будь-який конкретний порядок.

    Наприклад, корекція хвильової функції першого порядку (\(\psi^1 \text {(i.e., } \psi = \Phi + \psi^1\)через перший порядок) задається:

    \[ \begin{align} \psi^1 &= -\sum\limits_{i<j,m>n} \dfrac{\langle \Phi_{i,j}^{m,n}\big| \text{ H - H}^0 \big| \Phi \rangle}{\epsilon_m - \epsilon_i + \epsilon_n - \epsilon_j} \bigg| \Phi_{i,j}^{m,n} \rangle \\ &= - \sum\limits_{i<j,M<n} \dfrac{\langle i,j \big| g \big| m,n \rangle - \langle i,j \big| g \big| n,m \rangle}{\epsilon_m - \epsilon_i + \epsilon_n - \epsilon_j}\bigg| \Phi_{i,j}^{m,n} \rangle \end{align} \]

    де орбітальні енергії SCF позначаються,\(\epsilon_k \text{ and } \Phi_{i,j}^{m,n}\) являє собою ліквору, яка подвійно збуджена щодо\ Phi. Таким чином, тільки подвійно збуджені КСФ сприяють хвильовій функції першого порядку; в результаті енергія Е подається через другий порядок як:

    \[ \begin{align} E &= \langle \big| \text{H}^0 \big| \Phi \rangle + \langle \Phi \Big| \text{ H - H}^0 \big| \Phi \rangle + \langle \Phi \big| \text{ H - H}^0 \big| \psi^1 \rangle \\ &= \langle \Phi \big| \text{ H } \big| \Phi \rangle - \sum\limits_{i<j,m<n} \dfrac{\big| \langle \Phi_{i,j}^{m,n} \big| \text{ H - H}^0 \big| \Phi \rangle \big|^2}{\epsilon_m - \epsilon_i + \epsilon_n -\epsilon_j} \\ &= \text{E}_{\text{SCF}} - \sum\limits_{i<j,m<n} \dfrac{\big| \langle i,j \big| g \big| m,n \rangle - \langle i,j \big| g \big| n,m \rangle \big|^2}{\epsilon_m - \epsilon_i + \epsilon_n - \epsilon_j} \\ &= \text{E}^0 + \text{E}^1 + \text{E}^2. \end{align} \]

    Ці внески були виражені, використовуючи правила СК, в терміні двоелектронних інтегралів\( \langle \text{i,j} \big| g \big|\text{m,n} \rangle \), що зв'язують збуджені спін-орбіталі зі спін-орбіталями, від яких збуджувалися електрони, а також орбітальних енергетичних відмінностей, що\( [ \epsilon_m - \epsilon_i + \epsilon_n - \epsilon_j ] \) супроводжують такі збудження. У такому вигляді стає зрозуміло, що великий внесок в енергію кореляції пари займаних орбіталей вносять\(\phi_i \phi_j\) подвійні збудження в віртуальні орбіталі,\(\phi_m \phi_n\) які мають велику зв'язок (тобто великі\( \langle i,j \big| \text{ g }\big| m,n \rangle \) інтеграли) і малі орбітальні енергетичні розриви,\( [ \epsilon_m - \epsilon_i + \epsilon_n - \epsilon_j ] \).

    У більш високих порядках корекції до хвильової функції та енергії\(\Phi\) з'являються внески від CSF, які поодиноко, триразово тощо збуджені відносно, і додаткові внески від подвійно збуджених CSF також входять. Порівняно часто проводити розрахунки MPPT/MBPT (див. Посилання, наведені вище в розділі 19.I.3, де документально задокументовані внески груп Pople та Bartlett у розвиток MPPT/MBPT) до третього порядку в енергії (оцінка якого може бути показана лише для цього\(\psi^0 \text{ and } \psi^1\)). Вся серія програм GAUSSIAN-8X, які були використані в тисячах важливих хімічних досліджень, обчислюють Е через третій порядок таким чином.

    Окрім того, що він є великим розміром і не вимагає вказати вхідні дані поза базовим набором та домінуючим CSF, підхід MPPT/MBPT здатний включати ефект усіх CSF (які сприяють будь-якому заданому порядку) без необхідності знаходити будь-які власні значення матриці. Це важлива перевага, оскільки визначення власногозначення матриці, яке необхідно при розрахунках MCSCF і CI, вимагає комп'ютерного часу пропорційно третій потужності розмірності\(\text{H}_{I,J}\) матриці. Незважаючи на всі ці переваги, важливо пам'ятати про основні недоліки підходу MPPT/MBPT; його енергія не є верхньою межею справжньої енергії, і вона може не бути в змозі лікувати випадки, коли дві або більше CSF мають рівні або майже рівні амплітуди, оскільки вона отримує амплітуди всіх, крім домінуюча ліквору з формул теорії збурень, які припускають, що збурень є «малим».

    Метод з'єднаних кластерів

    Реалізація методу Coupled-Cluster починається так само, як і у випадку MPPT/MBPT; вибирається еталонний CSF, який використовується в процесі SCF для генерації набору спин-орбіталей, які будуть використовуватися в подальшому корельованому обчисленні. Множину робочих рівнянь методу Зв'язки-Кластера можна записати явно шляхом введення форми так званого кластерного оператора T,

    \[ \text{T} = \sum\limits_{i,m}t_i^m m^+ i + \sum\limits_{i,j,m,n}t_{i,j}^{m,n}m^+ n^+ \text{ j i + ...,} \]

    де комбінація операторів\(m^+ i\) позначає створення електрона у віртуальній спінової орбіталі\(\phi_m\) та видалення електрона з займаної спін-орбіталі\(\phi_i\) для генерації єдиного збудження. Операція\(m^+ n^+\) j i, отже, являє собою подвійне збудження від\(\phi_i \phi_j\) до\(\phi_m \phi_n\). Експресія кластерного оператора T через амплітуди\(t_i^m \text{, } t_{i,j}^{m,n} \text{, }\) і т.д. для поодиноко, подвійно і т.д. збуджених CSF, і розширення експоненціальних операторів в

    \[e^{-T} \text{ H } e^{T}\]

    один отримує:

    \[ \langle \Phi_i^m \big| \text{ H + [H,T] + }\dfrac{1}{2} \text{[[H,T],T] + }\dfrac{1}{6}\text{[[[H,T],T],T] + }\dfrac{1}{24} \text{[[[[H,T],T],T],T] }\big| \Phi \rangle = 0; \]

    \[ \langle \Phi_{i,j}^{m,n} \big| \text{ H + [H,T] + }\dfrac{1}{2} \text{[[H,T],T] + }\dfrac{1}{6}\text{[[[H,T],T],T] + }\dfrac{1}{24} \text{[[[[H,T],T],T],T] }\big| \Phi \rangle = 0; \]

    \[ \langle \Phi_{i,j,k}^{m,n,p} \big| \text{ H + [H,T] + }\dfrac{1}{2} \text{[[H,T],T] + }\dfrac{1}{6}\text{[[[H,T],T],T] + }\dfrac{1}{24} \text{[[[[H,T],T],T],T] }\big| \Phi \rangle = 0; \]

    і так далі для більш високого порядку збуджених CSF. Через одно- і двоелектронну операторну природу H можна показати, що розширення експоненціальних операторів обрізається точно при четвертій потужності; тобто такі терміни, як [[[H, T], T], T], T], T] і вищі комутатори зникають однаково (це продемонстровано в главі 4 Другої Методи квантування, засновані на квантовій хімії, П. Йоргенсен та Дж. Саймонс, Академічна преса, Нью-Йорк (1981).

    Малюнок 19.3.1: Схематичне зображення класифікації на основі розширення кластера. Повна кореляція складається з синглет, дублетів, трійок та кореляцій вищого порядку, все однозначно визначено підходом до кластерного розширення. Кожна синя сфера відповідає одному оператору частинки, а жовті кола/еліпси - кореляціям. Кількість сфер в межах кореляції ідентифікує номер кластера. Зображення, що використовується з дозволу (CC SA-BY-3.0; Крістоф Н. Бьотге, «Фонон-assistierte Lasertätigkeit в мікрорезонаторах»).

    Як результат, точні рівняння зв'язаного кластера є квартичними рівняннями для амплітуд\(t_i^m \text{, } t_{i,j}^{m,n} \text{, }\) тощо. Хоча оцінити всі елементи матриці комутатора, що з'являються у вищезгаданих рівняннях зв'язаного кластера, це може бути і було зроблено (наведені вище посилання на Первіса та Бартлетта особливо актуальні в цьому контексті). Результатом є вираження кожного такого матричного елемента, за допомогою правил Слейтера-Кондона, термінами одно- та двоелектронних інтегралів над спин-орбіталями, що використовуються при визначенні\(\Phi\), включаючи ті, що\(\Phi\) самі по собі та «віртуальні» орбіталі, яких немає в\(\Phi\).

    Загалом, ці квартичні рівняння повинні потім вирішуватися ітераційним способом і сприйнятливі до труднощів збіжності, подібних до тих, що виникають при розрахунках типу MCSCF. У будь-якому такому ітераційному процесі важливо починати з наближення (до t амплітуд, в даному випадку), яке досить близьке до кінцевого збіженого результату. Таке наближення часто досягається, наприклад, нехтуючи всіма термінами, які є нелінійними в t амплітудах (тому що ці амплітуди приймаються менше одиниці за величиною). Це призводить для робочих рівнянь зв'язаного кластера, отриманих проектуванням на подвійно збуджені CSF, до:

    \[ \langle \text{ i j } \big| \text{ g } \big| \text{ m,n } \rangle ' + \left[ \epsilon_m -\epsilon_i +\epsilon_n -\epsilon_j \right] t_{i,j}^{m,n} + \sum\limits_{i',j',m',n'} \langle \Phi_{i,j}^{m,n} \big| \text{ H - H}^0 \big| \Phi_{i',j'}^{m',n'} \Phi_{i',j'}^{m',n'} \rangle t_{i',j'}^{m',n'} = 0, \]

    де позначення\( \frac{\langle \text{ i,j }\big| \text{ g }\big| \text{ m,n }\rangle '}{\epsilon_m -\epsilon_i +\epsilon_n -\epsilon_j} \) використовується для позначення двоелектронної інтегральної різниці\(\rangle \text{ i,j } \big| \text{ g } \big| \text{ m,n } \rangle \text{ - } \langle \text{ i,j } \big| \text{ g } \big| \text{ n,m } \rangle\). Якщо, крім того, ігноруються фактори, що з'єднують різні подвійно збуджені CSF (тобто сума над i ', j', m', n'), рівняння для t амплітуд зводяться до рівнянь для амплітуд спинномозкової функції MPPT/MBPT першого порядку:

    \[ t_{i,j}^{m,n} = - \dfrac{\langle \text{ i,j }\big| \text{ g } \big| \text{ m,n } \rangle '}{\epsilon_m -\epsilon_i +\epsilon_n -\epsilon_j} \]

    Як показали Бартлетт і Попл, насправді існує тісний зв'язок між методами MPPT/MBPT та з'єднаного кластера, коли рівняння зв'язаного кластера вирішуються ітераційно, починаючи з такої початкової «здогадки», подібної до MPPT/Mbpt, для цих амплітуд подвійного збудження.

    Метод з'єднаного кластера, представлений тут, страждає від тих же недоліків, що і підхід MPPT/MBPT; його енергія не є верхньою межею, і він може не бути в змозі точно описати хвильові функції, які мають дві або більше CSF з приблизно однаковою амплітудою. Більш того, розв'язання нелінійних рівнянь зв'язаного кластера може бути складним і повільно (якщо взагалі) збіжним. Він має ті ж переваги, що і метод MPPT/MBPT; його енергія є великогабаритною, вона не вимагає великого матричного рішення власного значення, а його енергія та хвильова функція визначаються після того, як вказується основа та домінуюча CSF.

    Функціональні методи щільності

    Ці підходи дають альтернативи звичайним інструментам квантової хімії. Методи CI, MCSCF, MPPT/MBPT та CC виходять за рамки єдиної конфігураційної картини, додаючи до хвильової функції більше конфігурацій, амплітуди яких вони визначають по-своєму. Це може призвести до дуже великої кількості CSF в корельованої хвильової функції, і, як наслідок, до потреби в надзвичайних комп'ютерних ресурсах.

    Функціональні підходи до щільності різні. Тут вирішується набір рівнянь орбітального рівня.

    \[ \left[ -\dfrac{\hbar^2}{2m_e}\nabla^2 -\sum\limits_A \dfrac{Z_Ae^2}{|\textbf{r} - \textbf{R}_A}| + \int\dfrac{\rho (\textbf{r}'e^2)}{|\textbf{r}-\textbf{r}'|}\textbf{dr}' + \text{U}(\textbf{r}) \right] \phi_i = \epsilon_i\phi_i \]

    в якому орбіталі {\(\phi_i\)} «відчувають» потенціали за рахунок ядерних центрів (мають заряди Z\(_{\text{A}}\)), кулонівської взаємодії із сумарною електронною щільністю\(\rho\) (r ') та так званим обмінним кореляційним потенціалом, що позначається U (r'). Конкретний електронний стан, для якого проводиться розрахунок, задається формуванням відповідної щільності\(\rho\) (r '). Перш ніж йти далі в описі того, як проводяться розрахунки DFT, давайте розглянемо витоки, що лежать в основі цієї теорії.

    Так звана теорема Гогенберга-Кона стверджує, що електронна щільність наземного стану\(\rho\) (r), що описує N-електронну систему, однозначно визначає потенціал V (r) у гамільтоніані

    \[ \text{H } = \sum\limits_J \dfrac{\hbar^2}{2m_e}\nabla_j^2 + \text{V(}\textbf{r}_j\text{)} + \dfrac{e^2}{2} \sum\limits_{k \ne j} \dfrac{1}{r_{j,k}} , \]

    і, оскільки H визначає енергію наземного стану та хвильову функцію системи, щільність ґрунтового стану\(\rho (\textbf{r})\) визначає властивості ґрунтового стану системи. Доказ цієї теореми відбувається наступним чином:

    • \(\rho (\textbf{r}) \text{ determines N because } \int \rho (\textbf{r}) d^3r = \text{N} .\)
    • Припустимо, що є два різних потенціали (крім адитивної константи, яка просто зміщує нуль загальної енергії) V (r) і V' (r) які, коли використовуються в H і H', відповідно, для вирішення для основного стану виробляють,\[ \text{E}_0 \text{, } \psi \text{(}\textbf{r}\text{) and E}_0 ’ \text{, } \psi \text{’(}\textbf{r}\text{) }\] які мають однакову щільність одного електронів:\[ \int \big| \psi \big|^2 \text{dr}_2 \text{ dr}_3 \text{ ... dr}_{\text{N}} = \rho (\textbf{r}) = \int \big|\psi '\big| \text{dr}_2 \text{ dr}_3 \text{ ... dr}_{\text{N}} \]
    • Якщо розглядати\(\psi\) як пробну варіаційну хвильову функцію для гамільтоніана H, ми знаємо, що\[ \text{E}_0 < \langle \psi ' \big| \text{H}\big| \psi '\rangle = \langle \psi '\big| \text{H'} \big| \psi ' \rangle + \int \rho(\textbf{r})\left[V(\textbf{r}) - V'(\textbf{r}) \right]\text{d}^3\text{r} = \text{E}_o ' + \int \rho (\textbf{r}) \left[ V(\text{r}) - V'(\textbf{r}) \right]\text{d}^3\textbf{r} \label{B3} \]
    • Аналогічно, приймаючи\(\psi\) як пробну функцію для H' гамільтоніана, можна виявити, що\[ E_0 ' \langle E_0 + \int \rho(\textbf{r}) \left[ V'(\textbf{r}) - V(\textbf{r}) \right] \text{d}^3\textbf{r}. \label{B4}\]
    • Додавання рівнянь\ ref {B3} і\ ref {B4} дає\[ \text{E}_0 \text{ + } \text{E}_0 \text{ + } \text{E}_0 ', \] і чітке протиріччя.

    Отже, не може бути двох різних потенціалів V і V ', які дають однаковий стан землі\(\rho (\textbf{r}\)). Отже, щільність заземлення\(\rho (\textbf{r}\)) однозначно визначає N і V, а значить H, а значить\(\psi \text{ and E}_0. \text{ Furthermore, because } \psi\) визначає всі властивості основного стану, потім\(\rho (\textbf{r})\), в принципі, визначає всі подібні властивості. Це означає, що навіть кінетична енергія і енергія електронно-електронної взаємодії наземного стану визначаються\(\rho (\textbf{r}\)). Легко помітити, що\( \int \rho (\textbf{r}) \text{V(}\textbf{r}\text{)d}^3\textbf{r} = \text{V[}\rho ]\) дає середнє значення ядерної взаємодії електронів (плюс будь-який додатковий одноелектронний аддитивний потенціал) взаємодія з точки зору щільності заземлення\(\rho (\textbf{r})\), але як виражаються кінетична енергія Т [\(\rho\)] і електрон-електронна взаємодія V\(_{ee}\text{[}\rho\)] енергії з точки зору\(\rho\)?

    Основна складність з DFT полягає в тому, що теорема Гогенберга-Кона показує, що значення наземного стану T\(_{ee}\), V, V і т.д. все\(\rho\) це унікальні функціонали наземного стану\(\rho\) (тобто, що їх можна, в принципі, визначити один раз), але це не говорить нам, що це за функціональні відносини.

    Щоб побачити, як може мати сенс, що така властивість, як кінетична енергія, оператор якої\( -\frac{\hbar^2}{2m_e}\nabla^2 \) включає похідні, може бути пов'язане з електронною щільністю, розглянемо просту систему N невзаємодіючих електронів, що рухаються в тривимірному кубічному «коробці» потенціалу. Енергетичні стани таких електронів, як відомо,

    \[ E = \left( \dfrac{h^2}{2m_e L^2} \right) \left( n_x^2 + n_y^2 + n_z^2 \right), \]

    де L - довжина коробки по трьох осях, і\(n_x \text{, } n_y \text{, and } n_z\) квантові числа, що описують стан. Ми можемо розглядати\(n_x^2 \text{ + } n_y^2\text{ + } n_z^2 = R^2\) як визначення квадратного радіуса сфери в трьох вимірах, і ми розуміємо, що щільність квантових станів у цьому просторі є одним станом на одиницю об'єму в\(n_x \text{, } n_y \text{, } n_z\) просторі. Оскільки\(n_x \text{, } n_y \text{, and } n_z\) повинні бути натуральні числа, обсяг охоплює всі стани енергією менше або дорівнює заданій енергії E =\(\left(\frac{h^2}{2m_eL^2}\right)R^2 \text{ is } \frac{1}{8}\) об'єм сфери радіуса R:

    \[ \Phi (\text{E}) = \dfrac{1}{8}\left( \dfrac{4\pi}{3}\right)R^3 = \left( \dfrac{\pi}{6}\right) \sqrt{9m_e E\dfrac{L^2}{h^2}}^3 . \]

    Оскільки на одиницю такого об'єму припадає один стан,\(\Phi\) (Е) - це також кількість станів з енергією менше або дорівнює Е, і називається інтегрованою щільністю станів. Число станів g (E) dE з енергією між E і E+De, щільністю станів, є похідною від\(\Phi\):

    \[ g(E) = \dfrac{d\Phi}{dE} = \dfrac{\pi}{4}\sqrt{8m_e\dfrac{L^2}{h^2}}^3 \sqrt{E}. \]

    Якщо обчислити загальну енергію для N електронів, при станах, що мають енергії аж до так званої енергії Фермі (тобто енергії найвищої зайнятої молекулярної орбітальної HOMO) подвійно зайнятої, то отримаємо енергію наземного стану:

    \[ E_0 = 2\int\limits_0^{E_F}g(E)EdE = \dfrac{8\pi}{5}\sqrt{\dfrac{2m_e}{h^2}}^3L^3\sqrt{E_F}^5 . \]

    Загальна кількість електронів N може бути виражена як

    \[ N = 2\int\limits_0^{E_F}g(E)dE = \dfrac{8\pi}{3}\sqrt{\dfrac{2m_e}{h^2}}^3 L^3 \sqrt{E_F}^3 , \]

    які можна вирішити\(E_F\) за термінами N, щоб потім\(E_0\) виражати термінами N замість\(E_F\):

    \[ E_0 = \dfrac{3h^2}{10m_e}\sqrt[3]{\dfrac{3}{8\pi}}^2L^3 \sqrt[3]{\dfrac{N}{L}}^5 . \]

    Це дає загальну енергію, яка також є кінетичною енергією в даному випадку, оскільки потенційна енергія дорівнює нулю в межах «коробки», з точки зору електронної щільності\(\rho\) (x, y, z) = (\(\frac{N}{L^3}\)). Тому може бути правдоподібним вираження кінетичних енергій з точки зору щільності електронів\(\rho(\textbf{r}\)), але аж ніяк не зрозуміло, як це зробити для «реальних» атомів і молекул з електронно-ядерними та електронно-електронними взаємодіями.

    В одній з найбільш ранніх моделей DFT, теорії Томаса-Фермі, кінетична енергія атома або молекули наближається за допомогою вищевказаного виду лікування на «локальному» рівні. Тобто для кожного елемента об'єму в просторі r припускається, що вираз, вказаний вище, є дійсним, а потім інтегрується по всьому r для обчислення загальної кінетичної енергії:

    \[ T_{TF}[\rho ] = \int \dfrac{3h^2}{10m_e}\sqrt[3]{\dfrac{3}{8\pi}}^2 \sqrt[3]{\rho(\textbf{r})}^5 \text{d}^3\textbf{r} = C_F\int \sqrt[3]{\rho (\textbf{r})}^5 \text{d}^3\textbf{r} , \]

    де остання рівність просто визначає\(_F\) константу C (яка дорівнює 2.8712 в атомних одиницях). Ігноруючи кореляційні та обмінні внески в загальну енергію, цей Т поєднується з електронно-ядерною V і кулонівською електронно-електронно-потенційною енергіями для отримання загальної енергії Томаса-Фермі:

    \[ E_{0,TF}[\rho ] = C_F \int \sqrt[3]{\rho (\textbf{r})}^5d^3\textbf{r} + \int V(\textbf{r})\rho (\textbf{r}) d^3\textbf{r} + \dfrac{e^2}{2}\int \rho (\textbf{r})\dfrac{\rho (\textbf{r}')}{|\textbf{r}-\textbf{r}' |}d^3\textbf{r} d^3\textbf{r}' , \]

    Цей вираз є прикладом того, як E\(_0\) дається як функціональне наближення локальної густини (LDA). Термін локальний означає, що енергія дається як функціонал (тобто функція\(\rho\)), який залежить лише від точок\(\rho(\textbf{r})\) у просторі, але не від більш ніж однієї точки простору.\(\rho(\textbf{r})\)

    На жаль, енергетичний функціонал Томаса-Фермі не дає результатів, які мають досить високу точність, щоб бути корисним в хімії. Чого не вистачає в цій теорії - це a. енергія обміну та б. енергія кореляції; крім того, кінетична енергія розглядається лише в приблизному порядку, описаному.

    У книзі Парра і Яна показано, як Дірак зміг вирішити енергію обміну для «рівномірного електронного газу» (N кулонівських взаємодіючих електронів, що рухаються в рівномірному позитивному фоновому заряді, величина якого врівноважує заряд N електронів). Якщо на локальному рівні застосувати точний вираз для енергії обміну однорідного електронного газу, то отримують загальноприйняте наближення локальної густини Дірака до енергії обміну:

    \[ \text{E}_{\text{ex, Dirac}}[\rho ] = - C_x \int \sqrt[3]{\rho (\textbf{r})}^4 d^3\textbf{r} , \]

    з\(C_x = \frac{3}{4}|sqrt[3]{\frac{3}{\pi}} = 0.7386\) в атомних одиницях. Додавання цієї обмінної енергії до загальної енергії Томаса-Фермі Е\(_{0,TF} [\rho]\) дає так званий функціонал енергії Томаса-Фермі-Дірака (TFD).

    Оскільки щільності електронів досить сильно варіюються просторово поблизу ядер, потрібні поправки до вищезазначених наближень до\(\rho\text{] and E}_{ex.Dirac}\) T [. Одним з найбільш часто використовуваних так званих градієнтно-виправлених наближень є те, що винайдено Бекке і називається функціоналом обміну Becke88:

    \[ E_{ex}(Becke88) = E_{ex,Dirac}[\rho ] -\gamma \int x^2\sqrt[3]{\rho}^4\left[ \dfrac{1}{1 + 6\gamma\text{ x }csch(x)} \right] \textbf{dr,} \]

    де x =\(\frac{1}{\sqrt[3]{\rho}^4} \big|\nabla \rho \big| \text{, and } \gamma\) - параметр, обраний таким чином, щоб вищевказана енергія обміну могла найкращим чином відтворювати відомі енергії обміну конкретних електронних станів атомів інертного газу (Бекке\(\gamma\) знаходить рівним 0,0042). Поширена корекція градієнта до попередньої T [\(\rho\)] називається корекцією Вайцсакера і задається

    \[ \delta\text{T}_{\text{Weizsacker}} = \dfrac{1}{72}\dfrac{\hbar}{m_e}\int \dfrac{\big| \nabla \rho (\textbf{r}) \big|^2}{\rho (\textbf{r})} d\textbf{r}. \]

    Хоча наведене вище обговорення говорить про те, як можна обчислити енергію наземного стану після того, як дана\(\rho (\textbf{r})\) щільність наземного стану, все одно потрібно знати, як отримати\(\rho\). Кон і Шам (KS) ввели набір так званих орбіталів КС, що підкоряються наступному рівнянню:

    \[ \left[ -\dfrac{1}{2}\nabla^2 + V(\textbf{r}) + \dfrac{e^2}{2}\int \dfrac{\rho(\textbf{r}') }{\big|\textbf{r}-\textbf{r}'\big|} \textbf{dr}' + U_{xc}(\textbf{r}) \right] \phi_j = \epsilon_j \phi_j , \]

    де так званий обмінно-кореляційний потенціал\(U_{xc} (\textbf{r}) = \delta\text{E}_{xc}\dfrac{[\rho ]}{\delta\rho (\textbf{r})}\) може бути отриманий шляхом функціональної диференціації, якщо відомий обмінно-кореляційний енергетичний функціонал\(\text{E}_{xc}[\rho ]\). KS також показав, що орбіталі KS {\(\phi_j\)} можуть бути використані для обчислення щільності\(\rho\) шляхом простого складання орбітальних щільностей, помножених на орбітальну зайнятість n\(_j\):

    \[ \rho (\textbf{r} ) = \sum\limits_j n_j \big| \phi_j (\textbf{r})\big|^2 . \]

    (тут\(n_j\) = 0,1, або 2 - номер окупації орбіти\(\phi_j\) в досліджуваному стані) і що кінетична енергія повинна бути розрахована як

    \[ \text{T} = \sum\limits_j n_j \langle \phi_j (\textbf{r}) \big| -\dfrac{1}{2} \nabla^2 \big| \phi_j (\textbf{r}) \rangle . \]

    Ті самі дослідження ідеалізованого «рівномірного електронного газу», які ідентифікували обмінний функціонал Дірака, виявили, що енергія кореляції (на електрон) також може бути записана саме як функція електронної густини\(\rho\) системи, але лише у двох обмежувальних випадках - високий- межа щільності (велика\(\rho\)) і межа низької щільності. До цих пір не існує точного виразу для енергії кореляції навіть для однорідного електронного газу, який дійсний при довільних значеннях\(\rho\). Тому багато роботи було присвячено створенню ефективних та точних інтерполяційних формул, що з'єднують однорідні електронні газові вирази низької та високої щільності. Одним з таких виразів є

    \[ \text{E}_c [\rho ] = \int \rho (\textbf{r})\epsilon_c(\rho )\text{d}\textbf{r} , \]

    де

    \[ \epsilon_c(\rho ) = \dfrac{A}{2}\left[ ln\left( \dfrac{x}{X} \right) + \dfrac{2b}{Q tan^{-1}\left( \dfrac{Q}{2x + b} \right)} -\dfrac{bx_0}{X_0} \left[ ln\left( \dfrac{(x-x_0)^2}{X} + \dfrac{2(b+x_0)}{Q tan^{-1}\left( \dfrac{Q}{2x+b} \right)} \right) \right] \right] \]

    це енергія кореляції на електрон. Тут х\(\sqrt{r_s} \text{, } X=x^2 +bx+c \text{, } X_0 = x_0^2 + bx_0 + c \text{ and } Q = \sqrt{(4c - b^2)} \text{, } A = 0.0621814\text{, } x_0\) = -0,409286, б = 13,0720, а в = 42,7198. Параметр\(r_s \text{ is how the density } \rho \text{ enters since } \frac{4}{3} \pi r_s^3\) дорівнює радіусу сфери, обсяг якої є ефективним об'ємом, зайнятим одним електроном.\(\frac{1}{\rho}; \text{ that is, } r_s\) Розумне наближення до повного\(\text{E}_{xc}[\rho ]\) містило б Дірак (і, можливо, градієнт виправлений) функціонал обміну плюс вище\(\text{E}_C[\rho ]\), але існує багато альтернативних наближень до обмінно-кореляційного енергетичного функціоналу. В даний час багато робітників роблять все можливе, щоб «приготувати» функціонали для співвідношення і обміну енергіями, але поки ніхто не винайшов функціоналів, які настільки надійні, що більшість працівників погоджуються їх використовувати.

    Підводячи підсумок, при впровадженні будь-якого DFT зазвичай відбувається наступним чином:

    1. Обрана атомна орбітальна основа, з точки зору якої мають бути розширені орбіталі КС.
    2. Деяка початкова здогадка зроблена для коефіцієнтів розширення LCAO-KS\(\text{C}_{jj,a}: \phi_j = \sum\limits_a \text{C}_{j,a}\chi_a\).
    3. Щільність обчислюється як\(\rho (\textbf{r}) = \sum\limits_j n_j \big|\phi_j (\textbf{r})\big|^2 \). Часто,\(\rho (\textbf{r})\) розширюється в атомної орбітальної основі, яка не повинна бути такою ж, як основа\(\phi_j\), що використовується для, і коефіцієнти розширення\(\rho\) обчислюються з точки зору тих, що\(\phi_j\). Також часто використовується атомна орбітальна основа для розширення\(\sqrt[3]{\rho (\textbf{r})} \text{ which, together with } \rho\), необхідна для оцінки внеску обмінно-кореляційного функціоналу в Е\(_0\).
    4. Щільність поточної ітерації використовується у рівняннях КС для визначення гамільтоніана,\(\left[-\frac{1}{2}\nabla^2 \text{ + V}(\textbf{r}) + \frac{e^2}{2} \int \frac{\rho (\textbf{r}’)}{|\textbf{r}-\textbf{r}’|} \text{ d}\textbf{r}’ + \text{ U}_{xc}(\textbf{r}) \right]\) чиї «нові» власні функції {\(\phi_j\)} та власні значення {\(\epsilon_j\)} знайдені шляхом розв'язання рівнянь КС.
    5. Ці нові\(\phi_j\) використовуються для обчислення нової щільності, яка, в свою чергу, використовується для вирішення нового набору рівнянь КС. Цей процес продовжується до досягнення збіжності (тобто до тих пір, поки\(\phi_j\) використовувані для визначення поточної ітерації не\(\rho\) будуть такими ж\(\phi_j\), що виникають як рішення на наступній ітерації.
    6. Після визначення\(\rho (\textbf{r})\) збіжності енергію можна обчислити за допомогою більш раннього виразу

      \[ \text{E} [\rho ] = \sum\limits_j n_j \langle \phi_j (\textbf{r})\big| -\dfrac{1}{2} \nabla^2 \big| \phi_j (\textbf{r})\rangle + \int V(\textbf{r}) \rho (\textbf{r}) \text{d}\textbf{r} + \dfrac{e^2}{2} \int \rho (\textbf{r})\dfrac{ \rho (\textbf{r}')}{\big|\textbf{r}-\textbf{r}'\big|}\text{d}\textbf{r }\text{d}\textbf{r}' + \text{E}_{xc}[\rho ]. \]

    Закриваючи цей розділ, слід ще раз підкреслити, що ця область в даний час переживає вибухове зростання і багато уваги. Як результат, майже впевнено, що багато конкретних функціоналів, розглянутих вище, будуть замінені найближчим часом вдосконаленими та більш суворо обґрунтованими версіями. Цілком ймовірно, що розширення DFT до збуджених станів (багато працівників активно займаються цим) будуть розміщені на більш твердій землі та застосовані до молекулярних систем. Оскільки обчислювальні зусилля, пов'язані з цими підходами, значно менш сильно масштабуються з базовим встановленим розміром, ніж для звичайних (SCF, MCSCF, CI тощо) методів, функціональні методи щільності пропонують великі перспективи і, ймовірно, внесуть великий внесок у квантову хімію в наступному десятилітті.

    Дописувачі та атрибуція