9.4: Коваріантна похідна
Цілі навчання
- Постійна векторна функція, або для будь-якого тензора вищого рангу змінюється при вираженні в новій системі координат
У цьому необов'язковому розділі ми розглядаємо питання, порушені в розділі 7.5. Там ми відзначили, що в немінковських координатах не можна наївно використовувати зміни складових вектора як міру зміни самого вектора. Постійна скалярна функція залишається постійною, коли вона виражена в новій системі координат, але те ж саме не вірно для постійної векторної функції або для будь-якого тензора вищого рангу. Це пов'язано з тим, що зміна координат змінює одиниці, в яких вимірюється вектор, і якщо зміна координат нелінійна, одиниці змінюються від точки до точки. Ця тема логічно не належить до цієї глави, але я розмістив її тут, тому що її не можна чітко обговорювати, не охопивши тензори рангу вище одного.

Розглянемо одновимірний випадок, в якому векторva має тільки одну складову, а метрика також є єдиним числом, щоб ми могли опустити індекси і просто записатиv іg. (Ми просто повинні пам'ятати, щоv це дійсно вектор, хоча ми залишаємо верхній індекс.) Якщо постійна,v то її похіднаdv/dx, обчислена звичайним способом без жодного коригувального терміну, дорівнює нулю. Якщо далі припустити, що метрика - це просто постійнаg=1, то нуль - це не просто відповідь, а правильна відповідь.
Тепер припустимо, що ми трансформуємося в нову систему координатX, і метрикаG, виражена в цій системі координат, не є постійною. Застосовуючи закон тензорного перетворення, ми маємоV=vdXdx, і диференціація по відношенню до нуля неX дасть, тому що коефіцієнтdX/dx не постійний. Це неправильна відповідь: насправдіV не змінюється, він просто, здається, змінюється, тому щоG робить.
Ми хочемо додати коригувальний термін до похідного оператораd/dX, утворюючи новий похідний оператор∇X, який дає правильну відповідь. ∇Xназивається коваріантною похідною. Цей коригувальний термін легко знайти, якщо врахувати, яким повинен бути результат при диференціації самої метрики. Загалом, якщо тензор, здається, змінюється, він може змінюватися або тому, що він дійсно змінюється, або тому, що показник змінюється. Якщо сама метрика змінюється, це може бути або тому, що метрика дійсно змінюється, або.. тому що метрика змінюється. Іншими словами, немає розумного способу призначити ненульову коваріантну похідну самій метриці, тому ми повинні мати∇XG=0. Тому необхідна корекція полягає уd/dX заміні на
∇X=ddX−G−1dGdX
Застосовуючи це доG дає нуль. Gтензор другого рангу з двома нижчими індексами. Якщо застосувати ту ж корекцію до похідних інших тензорів цього типу, ми отримаємо ненульові результати, і вони будуть правильними ненульовими результатами. Математично форма похідної є1ydydx, яка відома як логарифмічна похідна, так як вона дорівнюєd(lny)dx. Він вимірює мультиплікативну швидкість зміниy. Наприклад, якщоy масштабується в рази,k колиx збільшується на1 одиницю, то логарифмічна похіднаy єlnk. Логарифмічна похідна відecx isc. Логарифмічний характер коригувального терміна до∇X є хорошою справою, оскільки дозволяє нам приймати зміни масштабу, які є мультиплікативними змінами, і перетворювати їх в адитивні поправки до похідного оператора. Аддитивність поправок необхідна, якщо результат коваріантної похідної повинен бути тензором, оскільки тензори є адитивними істотами. Як щодо величин, які не є коваріантними тензорами другого рангу? При масштабуванні координат на множник ковектори масштабуються поkk−1, а тензори другого рангу з двома нижчими індексами масштабуються наk−2. Тому термін корекції повинен бути вдвічі менше для ковекторів,
∇X=ddX−12G−1dGdX
і повинен мати протилежний знак для векторів.
Узагальнюючи термін корекції до похідних векторів в більш ніж одному вимірі, ми повинні мати щось такого вигляду:
∇avb=∂avb+Γbacvc
∇avb=∂avb−Γcbavc
деΓbac, званий символом Крістоффеля, не трансформується як тензор, а включає в себе похідні метрики. («Крістоффель» вимовляється «Кріст-жахливий», з наголосом на середньому складі.)
Важливим є те, що коли ми оцінюємо певний компонент коваріантної похідної∇2v3, наприклад, результат може бути ненульовим, навіть якщо компонентv3 зникає однаково.
Приклад9.4.1: Christoffel symbols on the globe

Як якісний приклад розглянемо траєкторію літака, показану на малюнку9.4.2, від Лондона до Мехіко. Ця траєкторія є найкоротшою між цими двома точками; така траєкторія мінімальної довжини називається геодезичною. У фізиці прийнято працювати з широтоюθ, виміряної вниз від північного полюса, а не широтою, виміряної від екватора. НаP, над Північною Атлантикою, широта літака має мінімум. (Ми бачимо, не беручи це на віру з фігури, що такий мінімум повинен відбутися. Найпростіший спосіб переконати себе в цьому - розглянути шлях, який йде прямо через жердину, вθ=0.)
НаP, вектор швидкості літака вказує прямо на захід. НаQ, над Новою Англією, його швидкість має велику складову на південь. Оскільки шлях є геодезичним, а площина має постійну швидкість, вектор швидкості просто паралельно транспортується; коваріантна похідна вектора дорівнює нулю. Оскільки ми маємоvθ=0 наP, єдиний спосіб пояснити ненульове і додатне значення∂φvθ є те, що у нас є ненульове і від'ємне значенняΓθφφ.
За симетрії ми можемо зробити висновок, щоΓθφφ має мати позитивне значення в південній півкулі, і повинні зникати на екваторі.
Γθφφобчислюється в прикладі нижче.
Симетрія також вимагає, щоб цей символ Крістоффеля був незалежним відφ, і він також повинен бути незалежним від радіуса сфери.
Щоб обчислити коваріантну похідну тензора вищого рангу, ми просто додаємо більше коригувальних термінів, наприклад,
∇aUbc=∂aUbc−ΓdbaUdc−ΓdcaUbd
або
∇aUcb=∂aUcb−ΓdbaUcd−ΓcadUdb
При частковій∂_µ похідній немає сенсу використовувати метрику для підняття індексу і форми∂_µ. Це має сенс робити це з коваріантними похідними, так само\nabla ^a = g^{ab} \nabla _b є правильною ідентичністю.
Позначення коми, крапки з комою та пташиних доріжок
Деякі автори використовують надскрипти з комами і крапками з комою для позначення часткових і коваріантних похідних. Наступні рівняння дають еквівалентні позначення для одних і тих же похідних:
\partial _\mu = \frac{\partial }{\partial x^\mu }
\partial _\mu X_\nu = X_{\nu ,\mu }
\nabla _a X_b = X_{b;a}
\nabla ^a X_b = X_b\: ^{;a}

\PageIndex{3}На малюнку показані два приклади відповідних позначень пташиних доріжок. Оскільки пташині сліди мають на увазі бути явно координатниминезалежними, вони не мають способу вираження нековаріантних похідних.
Знаходження символу Крістоффеля з метрики
Ми вже знайшли символ Крістоффеля з точки зору метрики в одному вимірі. Висловлюючи його в тензорних позначеннях, ми маємо
\Gamma ^d\: _{ba} = \frac{1}{2}g^{cd}(\partial _? g_{??})
де інверсія однокомпонентної матриціG була замінена інверсією матриці, і, що ще важливіше, знаки питання вказують на те, що було б кілька способів розмістити індекси так, щоб результатом було граматичне тензорне рівняння. Найбільш загальною формою для символу Крістоффеля було б
\Gamma ^b\: _{ac} = \frac{1}{2}g^{db}(L\partial _c g_{ab} + M\partial _a g_{cb} + N\partial _b g_{ca})
деLM, іN є константами. Послідовність з одновимірним виразом вимагаєL + M + N = 1. УмоваL = M виникає на фізичних, а не математичних підставах; це відображає той факт, що експерименти не показали доказів ефекту, званого крутінням, при якому вектори певним чином оберталися б при транспортуванні. MТерміниL та терміни мають інше фізичне значення, ніжN термін.
Припустимо, спостерігач використовує такі координати, що всі об'єкти описуються як подовжуються з часом, а зміна масштабу, накопиченого за один день, є факторомk > 1. Це описується похідною∂_t g_{xx} < 1, яка впливає наM термін. Оскільки метрика використовується для обчислення квадратних відстаней, елементg_{xx} матриці масштабується вниз на1/√k. Щоб компенсувати∂_t v^x < 0, тому нам потрібно додати позитивний термін корекціїM > 0, до коваріантної похідної. Коли той самий спостерігач вимірює швидкість зміниv^t вектора щодо простору, швидкість зміни виявляється занадто маленькою, оскільки змінна, яку вона диференціює щодо, занадто велика. Для цього потрібноN < 0, і корекція того ж розміру, що іM корекція, так|M| = |N|. ЗнаходимоL = M = -N = 1.
Самоперевірка: чи залежить вищевказаний аргумент від використання простору для однієї координати та часу для іншої?
Отриманий загальний вираз для символу Крістоффеля в терміні метрики дорівнює
\Gamma ^c\: _{ab} = \frac{1}{2}g^{cd}(\partial _a g_{bd} + \partial _b g_{ad} - \partial _d g_{ab})
Можна повернутися назад і перевірити, що це дає\nabla _c g_{ab} = 0.
Самоперевірка: У випадку1 розміру, показати, що це зводиться до більш раннього результату-\frac{1}{2}\frac{\mathrm{d} G}{\mathrm{d} X}.
Γне є тензором, тобто він не трансформується відповідно до правил тензорного перетворення. Оскільки цеΓ не тензор, не очевидно, що коваріантна похідна, яка побудована з нього, є тензорною. Але якщо це не очевидно, це також не дивно - мета вищевказаного деривації полягала в тому, щоб отримати результати, які були б незалежними від координат.
Приклад\PageIndex{2}: Christoffel symbols on the globe, quantitatively
У\PageIndex{1} прикладі ми зробили висновок про наступні властивості символу КрістоффеляΓ^θ\: _{φφ} на радіусній сферіR: Γ^θ\: _{φφ} не залежить відφ іR,Γ^θ\: _{φφ} < 0 в північній півкулі (колатидаθ меншеπ/2),Γ^θ\: _{φφ} = 0 на екваторі, іΓ^θ\: _{φφ} > 0 в південній півкулі.
Метрика на сфері єds^2 = R^2 dθ^2 + R^2 sin^2 θdφ^2. Єдиним терміном, що не зникає у виразі forΓ^θ\: _{φφ}, є той, який включає∂_θ g_{φφ} = 2R^2 sinθcosθ. РезультатΓ^θ\: _{φφ} = -sinθcosθ, який можна перевірити, щоб мати властивості, заявлені вище.
геодезичне рівняння
Світова лінія - це часоподібна крива в просторі-часі. Як особливий випадок, деякі такі криві насправді не вигнуті, а прямі. Фізично ті, які ми вважаємо прямими, - це ті, які можуть бути світовою лінією тестової частинки, на яку не діють будь-які негравітаційні сили (розділ 5.1). Математично ми покажемо в цьому розділі, як символи Крістоффеля можуть бути використані для пошуку диференціальних рівнянь, що описують такий рух. Світова лінія тестової частинки називається геодезичної. Рівняння також мають рішення, які є космічними або світлоподібними, і ми також вважаємо їх геодезичними.
Геодезики відіграють ту ж роль у відносності, яку грають прямі лінії в евклідовій геометрії. У евклідовій геометрії ми можемо вказати дві точки і попросити криву, що з'єднує їх, яка має мінімальну довжину. Відповідь - рядок. У спеціальній теорії відносності часова геодезична максимізує належний час (розділ 2.4) між двома подіями.
У спеціальній теорії відносності геодезичні дані задаються лінійними рівняннями при вираженні в координатах Мінковського, а вектор швидкості тестової частинки має постійні складові при вираженні в координатах Мінковського. Взагалі відносність координат Мінковського не існує, а геодезичні об'єкти не мають тих властивостей, які ми очікуємо на основі евклідової інтуїції; наприклад, спочатку паралельні геодезії можуть згодом сходитися або розходитися.
характеристика геодезичної

Геодезичну можна визначити як світову лінію, яка зберігає дотичність при паралельному транспорті, фігурі\PageIndex{4}. Це, по суті, математичний спосіб вираження поняття, яке ми раніше висловлювали більш неофіційно з точки зору «перебування на курсі» або переміщення «інерційно». (З причин, більш детально розглянутих нижче, це визначення краще, ніж визначення геодезичної як кривої екстремальної або стаціонарної метричної довжини.)
Криву можна задати, надавши функціїx^i(λ) для її координат, деλ є дійсним параметром. Вектор, що лежить дотичною до кривої, потім можна обчислити за допомогою часткових похідних,T^i = ∂x^i/∂λ. Існує три способи, за допомогою яких векторна функціяλ може змінюватися:
- він може змінитися з банальної причини, що метрика змінюється, так що його компоненти змінюються при вираженні в новій метриці
- він може змінювати свої компоненти перпендикулярно кривій; або
- він міг змінювати свою складову паралельно кривій.
Можливість 1 насправді не повинна вважатися зміною взагалі, і визначення коваріантної похідної спеціально розроблено для того, щоб бути нечутливим до такого роду речей. 2 не може застосовуватися доT^i, яка є дотичною за конструкцією. Тому було б зручно, якбиT^i траплялося завжди однакової довжини. Якщо так, то 3 також не станеться, і ми могли б повторно висловити визначення геодезичного, сказавши, що коваріантна похідна дорівнює нулю.T^i З цієї причини ми будемо вважати для решти цього розділу, що параметризація кривої має цю властивість. У ньютонівському контексті ми могли б уявити, щоx^i це чисто просторовіλ координати і бути універсальною часовою координатою. Потім ми інтерпретуємоT^i як швидкість, і обмеження полягало б у параметризації, що описує рух з постійною швидкістю. У відносності обмеження полягає в тому, щоλ повинно бути афінним параметром. Наприклад, це може бути належний час частинки, якщо крива, про яку йде мова, є часовою.
Коваріантна похідна по параметру
Позначення у наведеному вище розділі не зовсім адаптоване до наших теперішніх цілей, оскільки дозволяє висловити коваріантну похідну щодо однієї з координат, але не стосовно такого параметра, якλ. Ми хотіли б відзначити коваріантнуT^i похідну щодоλ as∇_λ T^i, хочаλ це не координата. Для з'єднання двох типів похідних ми можемо використовувати загальну похідну. Щоб зрозуміти ідею, ось як ми обчислюємо загальну похідну для скалярної функціїf(x,y), без тензорних позначень:
\frac{\mathrm{d} f}{\mathrm{d} \lambda } = \frac{\partial f}{\partial x} \frac{\partial x}{\partial \lambda } + \frac{\partial f}{\partial y} \frac{\partial y}{\partial \lambda }
Це всього лише узагальнення правила ланцюга до функції двох змінних. Наприклад, якщоλ представляє час іf температуру, то це скаже нам про швидкість зміни температури, оскільки термометр проводився через простір. Застосовуючи це до цієї задачі, ми виражаємо загальну коваріантну похідну як
\begin{align*} \nabla _{\lambda } T^i &= (\nabla _b T^i)\frac{\mathrm{d} x^b}{\mathrm{d} \lambda }\\ &= (\partial _b T^i + \Gamma ^i \: _{bc}T^c)\frac{\mathrm{d} x^b}{\mathrm{d} \lambda } \end{align*}
геодезичне рівняння
Визнаючи\partial _b T^i \frac{\mathrm{d} x^b}{\mathrm{d} \lambda } як сумарну нековаріантну похідну, знаходимо
\nabla _{\lambda } T^i = \frac{\mathrm{d} T^i}{\mathrm{d} \lambda } + \Gamma ^i\: _{bc} T^c \frac{\mathrm{d} x^b}{\mathrm{d} \lambda }
Підставивши\frac{\partial x^i}{\partial\lambda } і встановивши коваріантну похідну рівну нулю, отримаємоT^i
\frac{\mathrm{d}^2 x^i}{\mathrm{d} \lambda ^2} + \Gamma ^i\: _{bc} \frac{\mathrm{d} x^c}{\mathrm{d} \lambda }\frac{\mathrm{d} x^b}{\mathrm{d} \lambda } = 0
Це відоме як геодезичне рівняння.
Якщо це диференціальне рівняння задовольняється для одного афінного параметраλ, то воно також задовольняється для будь-якого іншого афінного параметраλ' = aλ + b, деa іb є константами. Нагадаємо, що афінні параметри визначаються тільки уздовж геодезичних, а не за довільними кривими. Ми не можемо почати з визначення афінного параметра, а потім використовувати його для пошуку геодезичних за допомогою цього рівняння, тому що ми не можемо визначити афінний параметр без попереднього визначення геодезичного. Так само ми не можемо зробити геодезичний спочатку, а потім афінний параметр, тому що якби у нас вже був геодезичний в руці, нам не знадобиться диференціальне рівняння, щоб знайти геодезичне. Рішення цієї курячо-яєчної загадки полягає в тому, щоб записати диференціальні рівняння і спробувати знайти рішення, не намагаючись заздалегідь вказати ні афінний параметр, ні геодезичний.
Геодезичне рівняння корисно при встановленні однієї з необхідних теоретичних основ відносності, яка полягає в єдиності геодезичних для заданого набору початкових умов. Якби геодезичні не були однозначно визначені, то частинки не мали б можливості вирішити, як рухатися. Форма геодезичного рівняння гарантує унікальність, оскільки з її допомогою можна визначити алгоритм, який будує геодезичний для заданого набору початкових умов.
Не характеризуються як криві стаціонарної довжини
Геодезичне рівняння може здатися громіздким. Чому б просто не визначити геодезичну як криву, що з'єднує дві точки, яка максимізує або мінімізує власну метричну довжину? Проблема в тому, що це не узагальнює добре криві, які не схожі на час. Випадковий читач, можливо, побажає пропустити залишок цього підрозділу, в якому обговорюється цей момент.
Дляσ просторового випадку ми хотіли б визначити належну метричну довжину кривої як\sigma = \int \sqrt{-g{ij} dx^i dx^j}, знак мінус необхідний, тому що ми використовуємо метрику з підписом+---, і ми хочемо, щоб результат був реальним. Величинаσ може бути розглянута як результат, який ми отримаємо, наблизивши криву ланцюгом коротких відрізків лінії та додаючи їх належні довжини. У випадку, коли вся крива лежить у площині одночасності для деякого спостерігача,σ є евклідова довжина кривої, виміряна цим спостерігачем. Наш неσ є ні максимумом, ні мінімумом для космічної геодезичної, що з'єднує дві події. Щоб побачити це, виберіть кадр, в якому дві події одночасні, і прийняти координати Мінковського таким чином, щоб точки обидва лежали наx -осі. Деформування геодезичної вxy площині робить те, що ми очікуємо відповідно до евклідової геометрії: вона збільшує довжину. Деформуючи його вxt площині, однак, зменшує довжину (як стає очевидним при розгляді випадку великої деформації, яка перетворює геодезичну криву нульової довжини, що складається з двох світлоподібних відрізків лінії). Результатом є те, що геодезичний не є ні мінімізатором, ні максимізаторомσ.
Максимізація або мінімізація належної довжини є сильною вимогою. Пов'язаний, але більш допустимий критерій для застосування до кривої, що з'єднує дві фіксовані точки, полягає в тому, що якщо ми змінимо криву на деяку невелику величину, зміна довжини повинна зникнути до першого порядку. Наприклад, дві точкиA іB на поверхні землі визначають велике коло, тобто коло, окружність якого дорівнює окружності землі. Це велике коло дає нам два різні шляхи, за якими ми могли б подорожувати відA доB. Один з них зазвичай буде довшим, ніж інший. Обидва вони настільки прямі, наскільки вони можуть бути, тримаючись на поверхні землі, тому в цьому контексті сферичної геометрії вони обидва вважаються геодезичними. Одна річ, яку мають спільні два шляхи, полягає в тому, що вони обидва нерухомі. Стаціонарність визначається наступним чином. З огляду на певну параметризовану кривуγ(t), давайте зафіксуємо певний векторh(t) у кожній точці кривої, яка є дотичною до земної поверхні, і нехайh буде безперервна функція,t яка зникає в кінцевих точках. Тоді якщо він невеликий в порівнянні з радіусом землі, ми можемо чітко визначити, що означаєγ обурюватиh, виробляючи ще одну криву,γ∗ подібну, але не таку, як,γ. Стаціонарність означає, що різниця в довжині міжγ іγ∗ є порядком2 для малого. Це узагальнення поняття елементарного числення про те, що функція має нульову похідну поблизу екстремуму або точки перелому. У нашому прикладі на поверхні землі дві геодезикиB з'єднуютьA і обидві стаціонарні.
Космічні геодезики в спеціальній теорії відносності є стаціонарними за вищевказаним визначенням. Однак це твердження може ввести в оману. Оскільки ми будуємо переміщення як продуктh, його похідна також гарантовано зменшиться пропорційно для малого. Ми могли б трохи послабити цю вимогу, і лише вимагати, щоб величина зміщення була порядковою. При цьому можна показати, що просторові криві не є нерухомими. Наприклад, будь-яка просторова крива може бути наближена до довільного ступеня точності ланцюжком світлоподібних геодезичних сегментів. Таким чином, довільно мале збурення в кривій зводить її довжину до нуля.
Ситуація стає ще гірше для світлоподібних геодезичних робіт. Тут ми повинні були б визначити, що таке «довжина». Ми могли б або взяти абсолютне значенняL = \int \sqrt{|g{ij} dx^i dx^j|}, або ні,L = \int \sqrt{g{ij} dx^i dx^j}. Якщо ми не беремо абсолютне значення, неL повинні бути реальними для невеликих варіацій геодезичного, і тому ми не маємо чітко визначеного порядку, і не можемо сказати, чиL є максимумом, мінімумом чи ні. Незалежно від того, чи приймаємо ми абсолютне значення, ми маємоL = 0 для світлоподібного геодезичного, але функція квадратного кореня не має диференційовну поведінку, коли його аргумент дорівнює нулю, тому ми не маємо стаціонарності. Якщо ж взяти абсолютне значення, то для геодезичної кривої довжина дорівнює нулю, що є максимально коротким. Однак можна мати негеодезичні криві нульової довжини, такі як світлоподібна гвинтова крива навколоt -осі.