線性代數
A
=
[
1
2
3
4
]
{\displaystyle \mathbf {A} ={\begin{bmatrix}1&2\\3&4\end{bmatrix}}}
向量 · 向量空間 · 基底 · 行列式 · 矩陣
「橫(row)」的各地常用名稱 中國大陸 行 臺灣 列[ 1]
行列式 (英語:Determinant ),記作
det
(
A
)
{\displaystyle \det(A)}
或
|
A
|
{\displaystyle |A|}
,是一個在方塊矩陣 上計算得到的標量 。行列式可以看作是有向面積 或體積 的概念在一般的歐幾里得空間 中的推廣。或者說,在歐幾里得空間中,行列式描述的是一個線性變換 對「體積」所造成的影響。無論是在線性代數 、多項式 理論,還是在微積分學 中(比如說換元積分法 中),行列式作為基本的數學工具,都有着重要的應用。
行列式概念最早出現在解線性方程組 的過程中。十七世紀晚期,關孝和 與萊布尼茨 的著作中已經使用行列式來確定線性方程組解的個數以及形式。十八世紀開始,行列式開始作為獨立的數學概念被研究。十九世紀以後,行列式理論進一步得到發展和完善。矩陣 概念的引入使得更多有關行列式的性質被發現,行列式在許多領域都逐漸顯現出重要的意義和作用,其定義也被推廣到諸如線性自同態 和向量組 等結構上。
行列式的特性可以被概括為一個交替多線性形式 ,這個本質使得行列式在歐幾里德空間中可以成為描述「體積」的函數[ 2] 。
矩陣
A
{\displaystyle A}
的行列式記作
det
(
A
)
{\displaystyle \det(A)}
。行列式經常使用豎直線記法(例如:克萊姆法則 和子式 )。例如,對於一個矩陣:
A
=
[
a
b
c
d
e
f
g
h
i
]
{\displaystyle A={\begin{bmatrix}a&b&c\\d&e&f\\g&h&i\end{bmatrix}}}
det
(
A
)
{\displaystyle \det(A)}
也記作
|
A
|
{\displaystyle |A|}
,或以細長的垂直線取代矩陣的方括號,明確的寫為[ 3] [ 4] :
det
(
A
)
=
|
A
|
=
|
a
b
c
d
e
f
g
h
i
|
{\displaystyle \det(A)=|A|={\begin{vmatrix}a&b&c\\d&e&f\\g&h&i\end{vmatrix}}}
當這個記法用於絕對值 時,其作用對象為數,矩陣的絕對值是無定義的。矩陣範數 通常以雙垂直線來表示(如:
‖
⋅
‖
{\displaystyle \|\cdot \|}
),且可以使用下標。故不會與二者造成混淆。
一個
n
{\displaystyle n}
階 方塊矩陣
A
{\displaystyle A}
的行列式可直觀地定義如下:
det
(
A
)
=
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
a
i
,
σ
(
i
)
{\displaystyle \det(A)=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{i,\sigma (i)}}
其中,
S
n
{\displaystyle S_{n}}
是集合
{
1
,
2
,
.
.
.
,
n
}
{\displaystyle \left\{1,2,...,n\right\}}
上置換 的全體,即集合
{
1
,
2
,
.
.
.
,
n
}
{\displaystyle \left\{1,2,...,n\right\}}
到自身上的一一映射(雙射 )的全體;
∑
σ
∈
S
n
{\displaystyle \sum _{\sigma \in S_{n}}}
表示對
S
n
{\displaystyle S_{n}}
全部元素的求和,即對於每個
σ
∈
S
n
{\displaystyle \sigma \in S_{n}}
,
sgn
(
σ
)
∏
i
=
1
n
a
i
,
σ
(
i
)
{\displaystyle \operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{i,\sigma (i)}}
在加法算式中出現一次;對每一個滿足
1
≤
i
,
j
≤
n
{\displaystyle 1\leq i,j\leq n}
的數對
(
i
,
j
)
{\displaystyle \left(i,j\right)}
,
a
i
,
j
{\displaystyle a_{i,j}}
是矩陣
A
{\displaystyle A}
的第
i
{\displaystyle i}
行第
j
{\displaystyle j}
列的元素。
sgn
(
σ
)
{\displaystyle \operatorname {sgn}(\sigma )}
表示置換
σ
∈
S
n
{\displaystyle \sigma \in S_{n}}
的符號差 ,具體地說,滿足
1
≤
i
≤
j
≤
n
{\displaystyle 1\leq i\leq j\leq n}
但
σ
(
i
)
>
σ
(
j
)
{\displaystyle \sigma (i)>\sigma (j)}
的有序數對
(
i
,
j
)
{\displaystyle \left(i,j\right)}
稱為
σ
{\displaystyle \sigma }
的一個逆序。
如果
σ
{\displaystyle \sigma }
的逆序共有偶數個,則
sgn
σ
=
1
{\displaystyle \operatorname {sgn} \sigma =1}
,如果共有奇數個,則
sgn
σ
=
−
1
{\displaystyle \operatorname {sgn} \sigma =-1}
。
舉例來說,對於3元置換
σ
=
(
2
,
3
,
1
)
{\displaystyle \sigma =\left(2,3,1\right)}
(即是說
σ
(
1
)
=
2
{\displaystyle \sigma (1)=2}
,
σ
(
2
)
=
3
{\displaystyle \sigma (2)=3}
,
σ
(
3
)
=
1
{\displaystyle \sigma (3)=1}
)而言,由於1在2後,1在3後,所以共有2個逆序(偶數個),因此
sgn
(
σ
)
=
1
{\displaystyle \operatorname {sgn}(\sigma )=1}
,從而3階行列式中項
a
1
,
2
a
2
,
3
a
3
,
1
{\displaystyle a_{1,2}a_{2,3}a_{3,1}}
的符號是正的。但對於三元置換
σ
=
(
3
,
2
,
1
)
{\displaystyle \sigma =\left(3,2,1\right)}
(即是說
σ
(
1
)
=
3
{\displaystyle \sigma (1)=3}
,
σ
(
2
)
=
2
{\displaystyle \sigma (2)=2}
,
σ
(
3
)
=
1
{\displaystyle \sigma (3)=1}
)而言,可以數出共有3個逆序(奇數個),因此
sgn
σ
=
−
1
{\displaystyle \operatorname {sgn} \sigma =-1}
,從而3階行列式中項
a
1
,
3
a
2
,
2
a
3
,
1
{\displaystyle a_{1,3}a_{2,2}a_{3,1}}
的符號是負號[ 5] [ 6] 。
注意到對於任意正整數
n
{\displaystyle n}
,
S
n
{\displaystyle S_{n}}
共擁有n ! 個元素,因此上式中共有
n
!
{\displaystyle n!}
個求和項,即這是一個有限多次的求和。
對於簡單的2階和3階的矩陣,行列式的表達式相對簡單,而且恰好是每條主對角線 (左上至右下)元素乘積之和減去每條副對角線(右上至左下)元素乘積之和(見圖中紅線和藍線)。
2階矩陣的行列式:
|
a
1
,
1
a
1
,
2
a
2
,
1
a
2
,
2
|
=
a
1
,
1
a
2
,
2
−
a
1
,
2
a
2
,
1
{\displaystyle {\begin{vmatrix}a_{1,1}&a_{1,2}\\a_{2,1}&a_{2,2}\end{vmatrix}}=a_{1,1}a_{2,2}-a_{1,2}a_{2,1}}
[ 7]
3階矩陣的行列式:
|
a
1
,
1
a
1
,
2
a
1
,
3
a
2
,
1
a
2
,
2
a
2
,
3
a
3
,
1
a
3
,
2
a
3
,
3
|
=
a
1
,
1
a
2
,
2
a
3
,
3
+
a
1
,
2
a
2
,
3
a
3
,
1
+
a
1
,
3
a
2
,
1
a
3
,
2
−
a
1
,
3
a
2
,
2
a
3
,
1
−
a
1
,
1
a
2
,
3
a
3
,
2
−
a
1
,
2
a
2
,
1
a
3
,
3
{\displaystyle \displaystyle {\begin{vmatrix}a_{1,1}&a_{1,2}&a_{1,3}\\a_{2,1}&a_{2,2}&a_{2,3}\\a_{3,1}&a_{3,2}&a_{3,3}\end{vmatrix}}=a_{1,1}a_{2,2}a_{3,3}+a_{1,2}a_{2,3}a_{3,1}+a_{1,3}a_{2,1}a_{3,2}-a_{1,3}a_{2,2}a_{3,1}-a_{1,1}a_{2,3}a_{3,2}-a_{1,2}a_{2,1}a_{3,3}}
[ 8]
三階矩陣的行列式為每條紅線上的元素的乘積之和,減去藍線上元素乘積之和。
但對於階數
n
≥
4
{\displaystyle n\geq 4}
的方陣
A
{\displaystyle A}
,這樣的主對角線和副對角線分別只有
n
{\displaystyle n}
條,由於
A
{\displaystyle A}
的主、副對角線總條數
=
2
n
<
(
n
−
1
)
n
<
n
!
=
S
n
{\displaystyle =2n<\left(n-1\right)n<n!=S_{n}}
的元素個數
因此,行列式的相加項中除了這樣的對角線乘積之外,還有其他更多的項。例如4階行列式中,項
a
1
,
2
a
2
,
3
a
3
,
1
a
4
,
4
{\displaystyle a_{1,2}a_{2,3}a_{3,1}a_{4,4}}
就不是任何對角線的元素乘積。不過,和2、3階行列式情況相同的是,n 階行列式中的每一項仍然是從矩陣中選取n 個元素相乘得到,且保證在每行和每列中都恰好只選取一個元素,而整個行列式恰好將所有這樣的選取方法遍歷一次。
另外,
n
×
n
{\displaystyle n\times n}
矩陣的每一行或每一列也可以看成是一個
n
{\displaystyle n}
元向量 ,這時矩陣的行列式也被稱為這
n
{\displaystyle n}
個
n
{\displaystyle n}
元向量 組成的向量組的行列式[ 9] 。
行列式的一個自然的源起是n 維平行體的體積。行列式的定義和n 維平行體的體積有着本質上的關聯[ 10] 。
行列式是向量形成的平行四邊形的面積
在一個二維平面 上,兩個向量
X
=
(
a
,
c
)
{\displaystyle X=\left(a,c\right)}
和
X
′
=
(
b
,
d
)
{\displaystyle X'=\left(b,d\right)}
的行列式是:
det
(
X
,
X
′
)
=
|
a
b
c
d
|
=
a
d
−
b
c
{\displaystyle \det(X,X')={\begin{vmatrix}a&b\\c&d\end{vmatrix}}=ad-bc}
[ 7]
比如說,兩個向量
X
=
(
2
,
1
)
{\displaystyle X=\left(2,1\right)}
和
X
′
=
(
3
,
4
)
{\displaystyle X'=\left(3,4\right)}
的行列式是:
det
(
X
,
X
′
)
=
|
2
3
1
4
|
=
2
⋅
4
−
3
⋅
1
=
5
{\displaystyle \det(X,X')={\begin{vmatrix}2&3\\1&4\end{vmatrix}}=2\cdot 4-3\cdot 1=5}
經計算可知,當係數是實數時,行列式表示的是向量
X
{\displaystyle X}
和
X
′
{\displaystyle X'}
形成的平行四邊形 的有向面積,並有如下性質:
行列式為零當且僅當兩個向量共線(線性相關 ),這時平行四邊形退化成一條直線[ 9] 。
如果以逆時針方向為正向的話,有向面積的意義是:平行四邊形面積為正當且僅當以原點為不動點將
X
{\displaystyle X}
逆時針「轉到」
X
′
{\displaystyle X'}
處時,掃過的地方在平行四邊形裡,否則的話面積就是負的。如右圖中,
X
{\displaystyle X}
和
X
′
{\displaystyle X'}
所構成的平行四邊形的面積就是正的[ 11] 。
行列式是一個雙線性映射 。也就是說,
det
(
λ
X
+
μ
Y
,
X
′
)
=
λ
det
(
X
,
X
′
)
+
μ
det
(
Y
,
X
′
)
{\displaystyle \det(\lambda X+\mu Y,X')=\lambda \det(X,X')+\mu \det(Y,X')\;}
,
並且
det
(
X
,
λ
X
′
+
μ
Y
′
)
=
λ
det
(
X
,
X
′
)
+
μ
det
(
X
,
Y
′
)
{\displaystyle \det(X,\lambda X'+\mu Y')=\lambda \det(X,X')+\mu \det(X,Y')\;}
[ 9] 。
行列式
其幾何意義是:以同一個向量
v
{\displaystyle v}
作為一條邊的兩個平行四邊形的面積之和,等於它們各自另一邊的向量
u
{\displaystyle u}
和
u
′
{\displaystyle u'}
加起來後的向量:
u
+
u
′
{\displaystyle u+u'}
和
v
{\displaystyle v}
所構成的平行四邊形的面積,如左圖中所示。
在三維的有向空間 中,三個三維向量的行列式是:
det
(
X
,
X
′
,
X
″
)
=
|
x
x
′
x
″
y
y
′
y
″
z
z
′
z
″
|
=
x
y
′
z
″
+
x
′
y
″
z
+
x
″
y
z
′
−
x
y
″
z
′
−
x
′
y
z
″
−
x
″
y
′
z
{\displaystyle \det(X,X',X'')={\begin{vmatrix}x&x'&x''\\y&y'&y''\\z&z'&z''\end{vmatrix}}=xy'z''+x'y''z+x''yz'-xy''z'-x'yz''-x''y'z}
。[ 8]
比如說,三個向量
(
2
,
1
,
5
)
{\displaystyle \left(2,1,5\right)}
、
(
6
,
0
,
8
)
{\displaystyle \left(6,0,8\right)}
和
(
3
,
2
,
4
)
{\displaystyle \left(3,2,4\right)}
的行列式是:
det
(
X
,
X
′
,
X
″
)
=
|
2
6
3
1
0
2
5
8
4
|
=
2
⋅
0
⋅
4
+
6
⋅
2
⋅
5
+
3
⋅
1
⋅
8
−
2
⋅
2
⋅
8
−
6
⋅
1
⋅
4
−
3
⋅
0
⋅
5
=
28
{\displaystyle \det(X,X',X'')={\begin{vmatrix}2&6&3\\1&0&2\\5&8&4\end{vmatrix}}=2\cdot 0\cdot 4+6\cdot 2\cdot 5+3\cdot 1\cdot 8-2\cdot 2\cdot 8-6\cdot 1\cdot 4-3\cdot 0\cdot 5=28}
當係數是實數時,行列式表示
X
{\displaystyle X}
、
X
′
{\displaystyle X'}
和
X
″
{\displaystyle X''}
三個向量形成的平行六面體的有向體積,也叫做這三個向量的混合積 。同樣的,可以觀察到如下性質[ 12] :
行列式為零當且僅當三個向量共線或者共面(三者線性相關 ),這時平行六面體退化為平面圖形,體積為零[ 10] 。
兩個相鄰平行六面體的體積之和
三維空間中有向體積的定義要比二維空間中複雜,一般是根據右手定則 來約定。比如右圖中(
u
,
v
,
w
{\displaystyle u,v,w}
)所形成的平行六面體的體積是正的,而(
u
,
w
,
v
{\displaystyle u,w,v}
)所形成的平行六面體的體積是負的。這個定義和行列式的計算並不矛盾,因為行列式中向量的坐標都是在取好坐標系後才決定的,而坐標系的三個方向一般也是按照右手規則來設定的。如果計算開始時坐標系的定向 反過來的話,有向體積的定義也要跟着反過來,這樣行列式才能代表有向體積[ 10] [ 13] 。
這時行列式是一個「三線性映射 」,也就是說,對第一個向量有
det
(
a
X
+
b
Y
,
X
′
,
X
″
)
=
a
det
(
X
,
X
′
,
X
″
)
+
b
det
(
Y
,
X
′
,
X
″
)
{\displaystyle \det(aX+bY,X',X'')=a\det(X,X',X'')+b\det(Y,X',X'')\;}
,對第二、第三個向量也是如此。其幾何意義和二維時基本相同,是指當生成兩個平行六面體的每組三個向量中如果有兩個是重合的,比如分別是:(
u
,
v
,
w
{\displaystyle u,v,w}
)和(
u
′
,
v
,
w
{\displaystyle u',v,w}
),那麼它們的體積之總和等於將
u
{\displaystyle u}
和
u
′
{\displaystyle u'}
加起來後的向量
u
+
u
′
{\displaystyle u+u'}
和
v
{\displaystyle v}
,
w
{\displaystyle w}
所形成的平行六面體的體積,如右圖所示[ 10] 。
在以上的行列式中,我們不加選擇地將向量在所謂的正交基 (即直角坐標系 )下分解,實際上在不同的基底 之下,行列式的值並不相同。這並不是說平行六面體的體積不唯一。恰恰相反,這說明體積的概念依賴于衡量空間的尺度,也就是基底的取法。用基底的變換可以看作線性映射 對基底的作用,而不同基底下的行列式代表了基變換 對「體積」的影響。可以證明,對於所有同定向的標準正交基 ,向量組的行列式的值在絕對值意義上是一樣的[ 14] 。也就是說,如果我們選擇的基底都是「單位長度」,並且兩兩正交 ,那麼在這樣的基之下,平行六面體的體積的絕對值是唯一的[ 15] 。
經線性映射後的正方體
設E 是一個一般的n 維的有向歐幾里得空間 。一個線性變換把一個向量線性地變為另一個向量。比如說,在三維空間中,向量(
x
,
y
,
z
{\displaystyle x,y,z}
)被映射到向量(
x
′
,
y
′
,
z
′
{\displaystyle x',y',z'}
):
x
′
=
a
1
x
+
b
1
y
+
c
1
z
y
′
=
a
2
x
+
b
2
y
+
c
2
z
z
′
=
a
3
x
+
b
3
y
+
c
3
z
{\displaystyle {\begin{matrix}x'=a_{1}x+b_{1}y+c_{1}z\\y'=a_{2}x+b_{2}y+c_{2}z\\z'=a_{3}x+b_{3}y+c_{3}z\end{matrix}}}
其中
a
{\displaystyle a}
、
b
{\displaystyle b}
、
c
{\displaystyle c}
是係數。如右圖,正方體(可以看作原來的一組基形成的)經線性變換後可以變成一個普通的平行六面體,或變成一個平行四邊形(沒有體積)。這兩種情況表示了兩種不同的線性變換,行列式可以將其很好地分辨出來(為零或不為零)。
更詳細地說,行列式表示的是線性變換前後平行六面體的體積的變化係數。如果設左邊的正方體體積是一,那麼中間的平行六面體的(有向)體積就是線性變換的行列式的值,右邊的平行四邊形體積為零,因為線性變換的行列式為零。這裡我們混淆了線性變換的行列式和向量組的行列式,但兩者是一樣的,因為我們在對一組基作變換[ 16] 。
以上二維和三維行列式的例子中,行列式被解釋為向量形成的圖形的面積或體積。面積或體積的定義是恆正的,而行列式是有正有負的,因此需要引入有向面積和有向體積的概念。負的面積或體積在物理學中可能難以理解,但在數學中,它們和有向角 的概念類似,都是對空間鏡面對稱特性的一種刻畫。如果行列式表示的是線性變換對體積的影響,那麼行列式的正負就表示了空間的定向[ 17] 。
如上圖中,左邊的黃色骰子(可以看成有單位的有向體積的物體)在經過了線性變換後變成中間綠色的平行六面體,這時行列式為正,兩者是同定向的,可以通過旋轉和拉伸從一個變成另一個。而骰子和右邊的紅色平行六面體之間也是通過線性變換得到的,但是無論怎樣旋轉和拉伸,都無法使一個變成另一個,一定要通過鏡面反射才行。這時兩者之間的線性變換的行列式是負的。可以看出,線性變換可以分為兩類,一類對應着正的行列式,保持空間的定向不變,另一類對應負的行列式,顛倒空間的定向[ 17] [ 18] [ 19] 。
由二維及三維的例子,可以看到一般的行列式應該具有怎樣的性質。在
n
{\displaystyle n}
維歐幾里得空間中,作為「平行多面體」的「體積」的概念的推廣,行列式繼承了「體積」函數的性質。首先,行列式需要是線性的,這可以由面積的性質類比得到。這裡的線性是對於每一個向量來說的,因為當一個向量變為原來的
a
{\displaystyle a}
倍時,「平行多面體」的「體積」也變為原來的
a
{\displaystyle a}
倍。其次,當一個向量在其它向量組成的「超平面 」上時,
n
{\displaystyle n}
維「平行多面體」的「體積」是零(可以想像三維空間的例子)。也就是說,當向量線性相關 時,行列式為零。在一般係數域上的線性空間中,行列式也正是由這樣的特性所刻劃的:
行列式是係數域為
K
{\displaystyle K}
的有限維線性空間
E
{\displaystyle E}
上射到
K
{\displaystyle K}
的交替n- 線性形式 [ 20] 。
具體來說,設
E
{\displaystyle E}
是一個係數在域
K
{\displaystyle K}
上的有限維線性空間,維數為
n
{\displaystyle n}
。一個
E
{\displaystyle E}
上的交替
n
−
{\displaystyle n-}
線性形式是指滿足以下性質的函數
D
:
E
n
→
K
{\displaystyle D:E^{n}\to K}
:
n
{\displaystyle n}
重線性:
D
(
a
1
,
…
,
c
a
i
+
a
i
′
,
…
,
a
n
)
=
c
D
(
a
1
,
…
,
a
i
,
…
,
a
n
)
+
D
(
a
1
,
…
,
a
i
′
,
…
,
a
n
)
{\displaystyle D(a_{1},\ldots ,ca_{i}+a_{i}',\ldots ,a_{n})=cD(a_{1},\ldots ,a_{i},\ldots ,a_{n})+D(a_{1},\ldots ,a_{i}',\ldots ,a_{n})}
交替性:
D
(
a
1
,
a
2
,
…
,
a
n
)
=
−
D
(
a
2
,
a
1
,
…
,
a
n
)
{\displaystyle D(a_{1},a_{2},\ldots ,a_{n})=-D(a_{2},a_{1},\ldots ,a_{n})}
或者說,當
a
i
=
a
j
{\displaystyle a_{i}=a_{j}}
的時候
D
(
a
1
,
…
,
a
i
,
…
,
a
j
,
…
,
a
n
)
=
0
{\displaystyle D(a_{1},\ldots ,a_{i},\ldots ,a_{j},\ldots ,a_{n})=0}
所有E 上的交替
n
−
{\displaystyle n-}
線性形式的集合記作
A
n
(
E
)
{\displaystyle A_{n}(E)}
。
定理 :
A
n
(
E
)
{\displaystyle A_{n}(E)}
的維度是1。也就是說,設
B
=
(
e
1
,
…
,
e
n
)
{\displaystyle B=(e_{1},\dots ,e_{n})}
是
E
{\displaystyle E}
的一組基,那麼,所有的交替
n
−
{\displaystyle n-}
線性形式
f
:
E
n
→
K
{\displaystyle f:E^{n}\to K}
都可以寫成
f
(
a
1
,
…
,
a
n
)
=
(
∑
σ
∈
S
n
sgn
(
σ
)
∏
j
=
1
n
a
σ
(
j
)
,
j
)
f
(
e
1
,
…
,
e
n
)
{\displaystyle f(a_{1},\dots ,a_{n})=\left(\sum _{\sigma \in {\mathfrak {S}}_{n}}\operatorname {sgn}(\sigma )\prod _{j=1}^{n}a_{\sigma (j),j}\right)f(e_{1},\dots ,e_{n})}
其中
a
j
=
∑
i
=
1
n
a
i
,
j
e
i
{\displaystyle a_{j}=\sum _{i=1}^{n}a_{i,j}e_{i}}
是在基
B
{\displaystyle B}
下的展開[ 20] [ 21] 。
證明 :
對任一個
n
−
{\displaystyle n-}
線性形式
D
:
E
n
→
K
{\displaystyle D:E^{n}\to K}
,考慮將
D
{\displaystyle D}
依照多線性性質展開,
D
(
a
1
,
…
,
a
n
)
=
D
(
∑
i
1
=
1
n
a
i
1
,
1
e
i
1
,
…
,
∑
i
n
=
1
n
a
i
n
,
n
e
i
n
)
=
∑
i
1
=
1
n
…
∑
i
n
=
1
n
∏
j
=
1
n
a
i
j
,
j
D
(
e
i
1
,
…
,
e
i
n
)
{\displaystyle D(a_{1},\dots ,a_{n})=D\left(\sum _{i_{1}=1}^{n}a_{i_{1},1}e_{i_{1}},\dots ,\sum _{i_{n}=1}^{n}a_{i_{n},n}e_{i_{n}}\right)=\sum _{i_{1}=1}^{n}\dots \sum _{i_{n}=1}^{n}\prod _{j=1}^{n}a_{i_{j},j}D(e_{i_{1}},\dots ,e_{i_{n}})}
這時,由交替性,
D
(
e
i
1
,
…
,
e
i
n
)
≠
0
{\displaystyle D(e_{i_{1}},\dots ,e_{i_{n}})\neq 0}
當且僅當
i
1
,
…
,
i
n
{\displaystyle i_{1},\dots ,i_{n}}
是
1
,
…
,
n
{\displaystyle 1,\dots ,n}
的一個排列,所以有
D
(
a
1
,
…
,
a
n
)
=
D
(
I
n
)
⋅
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
a
i
,
σ
(
i
)
{\displaystyle D(a_{1},\dots ,a_{n})=D(I_{n})\cdot \sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{i,\sigma (i)}}
這裡,
I
n
=
(
e
1
,
…
,
e
n
)
{\displaystyle I_{n}=(e_{1},\dots ,e_{n})}
。
設
B
=
(
e
1
,
…
,
e
n
)
{\displaystyle B=(e_{1},\dots ,e_{n})}
是
E
{\displaystyle E}
的一組基,根據上面的定理和線性形式的性質,可以定義
B
{\displaystyle B}
下的行列式。
其中的唯一性是因為如果有兩個交替
n
−
{\displaystyle n-}
線性形式滿足條件,則它們的差在一組基上為0,從而恆等於0。於是,一組基上的一個向量組的行列式就是:
定義 :
確定了
E
{\displaystyle E}
上的一組基
B
{\displaystyle B}
後,向量組
a
1
,
…
,
a
n
{\displaystyle a_{1},\dots ,a_{n}}
在
B
{\displaystyle B}
下的行列式是:
det
B
(
a
1
,
…
,
a
n
)
=
(
∑
σ
∈
S
n
sgn
(
σ
)
∏
j
=
1
n
a
σ
(
j
)
,
j
)
det
B
(
e
1
,
…
,
e
n
)
=
∑
σ
∈
S
n
sgn
(
σ
)
∏
j
=
1
n
a
σ
(
j
)
,
j
{\displaystyle \det {}_{B}(a_{1},\dots ,a_{n})=\left(\sum _{\sigma \in {\mathfrak {S}}_{n}}\operatorname {sgn}(\sigma )\prod _{j=1}^{n}a_{\sigma (j),j}\right)\det {}_{B}(e_{1},\dots ,e_{n})=\sum _{\sigma \in {\mathfrak {S}}_{n}}\operatorname {sgn}(\sigma )\prod _{j=1}^{n}a_{\sigma (j),j}}
其中
a
j
=
∑
i
=
1
n
a
i
,
j
e
i
{\displaystyle a_{j}=\sum _{i=1}^{n}a_{i,j}e_{i}}
是在
B
{\displaystyle B}
下的展開[ 22] 。
可以見到這個定義與之前直觀的定義是吻合的,它有時也被稱作萊布尼茲公式 。
設
B
{\displaystyle B}
與
B
′
{\displaystyle B'}
是向量空間中的兩組基,則將上面定理中的
f
{\displaystyle f}
改為
det
B
{\displaystyle \det {}_{B}}
就得到向量組在兩組基下的行列式之間的關係:
det
B
′
(
a
1
,
…
,
a
n
)
=
det
B
′
(
B
)
×
det
B
(
a
1
,
…
,
a
n
)
{\displaystyle \det {}_{B'}(a_{1},\dots ,a_{n})=\det {}_{B'}(B)\times \det {}_{B}(a_{1},\dots ,a_{n})}
,
設
M
n
(
K
)
{\displaystyle \displaystyle {\mathit {M}}_{n}(K)}
為所有定義在係數域
K
{\displaystyle K}
上的
n
×
n
{\displaystyle n\times n}
矩陣的集合。將
n
×
n
{\displaystyle n\times n}
矩陣
M
{\displaystyle M}
(
M
{\displaystyle M}
的元素記為
m
i
,
j
{\displaystyle \displaystyle m_{i,j}}
)的
n
{\displaystyle n}
列寫成
m
1
,
…
,
m
n
{\displaystyle m_{1},\ldots ,m_{n}}
,
m
j
{\displaystyle \displaystyle m_{j}}
可以看作是
R
n
{\displaystyle \mathbb {R} ^{n}}
的正則基上的向量。矩陣
M
{\displaystyle M}
的行列式定義為向量組
m
1
,
…
,
m
n
{\displaystyle m_{1},\ldots ,m_{n}}
的行列式。這裡的向量都在
R
n
{\displaystyle \mathbb {R} ^{n}}
的正則基上展開,因此矩陣的行列式不依賴於基的選擇。
定義 :
矩陣
M
{\displaystyle M}
的行列式
det
(
M
)
=
det
(
m
1
,
…
,
m
n
)
=
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
m
σ
(
i
)
,
i
{\displaystyle \det(M)=\det(m_{1},\ldots ,m_{n})=\sum _{\sigma \in {\mathfrak {S}}_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}m_{\sigma (i),i}}
[ 23]
這樣定義的矩陣
M
{\displaystyle M}
的行列式與向量組的行列式有同樣的性質。單位矩陣 的行列式為1,若矩陣的某幾行線性相關 ,則它的行列式為零。
由萊布尼茲公式,可以證明矩陣行列式的一個重要性質:
定理 :
一個矩陣的行列式等於它的轉置矩陣 的行列式:
det
M
=
det
(
t
M
)
{\displaystyle \det M=\det \left({}^{t}{M}\right)}
,[ 24]
也就是說矩陣的行列式既可以看作
n
{\displaystyle n}
個行向量 的行列式,也可以看作
n
{\displaystyle n}
個列向量 的行列式。因此也可以通過行向量組來定義矩陣行列式,並且得到的定義是等價的。
設
f
{\displaystyle f}
是
n
{\displaystyle n}
維線性空間
E
{\displaystyle E}
到自身的線性變換(自同態 ),對於給定的一組基,可以定義線性變換在這組基下的行列式。
f 的變換矩陣滿足
[
f
(
x
1
)
,
…
,
f
(
x
n
)
]
=
[
f
]
B
⋅
[
x
1
,
…
,
x
n
]
{\displaystyle \left[f(x_{1}),\dots ,f(x_{n})\right]=\left[f\right]_{B}\cdot \left[x_{1},\dots ,x_{n}\right]}
也就是說對所有的向量組
(
x
1
,
…
,
x
n
)
{\displaystyle (x_{1},\dots ,x_{n})}
,
det
B
(
f
(
x
1
)
,
…
,
f
(
x
n
)
)
=
det
(
[
f
]
B
)
×
det
B
(
x
1
,
…
,
x
n
)
{\displaystyle \det {}_{B}(f(x_{1}),\dots ,f(x_{n}))=\det \left([f]_{B}\right)\times \det {}_{B}(x_{1},\dots ,x_{n})}
=
det
f
×
det
B
(
x
1
,
⋯
,
x
n
)
{\displaystyle =\det f\times \det {}_{B}(x_{1},\cdots ,x_{n})}
。
可以證明,f 在E 的任意一組基下的變換矩陣的行列式都是相等的[ 25] 。
證明 :
考慮映射
d
f
,
B
{\displaystyle d_{f,B}}
使得
(
x
1
,
⋯
,
x
n
)
{\displaystyle (x_{1},\cdots ,x_{n})}
被映射到
d
f
,
B
(
x
1
,
…
,
x
n
)
=
det
B
(
f
(
x
1
)
,
…
,
f
(
x
n
)
)
{\displaystyle d_{f,B}(x_{1},\dots ,x_{n})=\det {}_{B}(f(x_{1}),\dots ,f(x_{n}))}
,
d
f
,
B
{\displaystyle d_{f,B}}
是一個交替n- 線性形式,因此由前面證的定理,
d
f
,
B
{\displaystyle d_{f,B}}
和
d
e
t
B
{\displaystyle det_{B}}
只相差一個係數。
d
f
,
B
=
λ
⋅
det
B
{\displaystyle d_{f,B}=\lambda \cdot \det {}_{B}}
。
而由變換矩陣的性質可以知道:
λ
=
det
(
[
f
]
B
)
{\displaystyle \lambda =\det \left([f]_{B}\right)}
也就是說
det
B
(
f
(
x
1
)
,
…
,
f
(
x
n
)
)
=
det
(
[
f
]
B
)
×
det
B
(
x
1
,
…
,
x
n
)
(
1
)
{\displaystyle \det {}_{B}(f(x_{1}),\dots ,f(x_{n}))=\det \left([f]_{B}\right)\times \det {}_{B}(x_{1},\dots ,x_{n})\qquad (1)}
對於另外一組基
B
′
{\displaystyle B'}
,運用基變更公式,可以得到:
det
B
(
f
(
x
1
)
,
…
,
f
(
x
n
)
)
=
det
B
(
B
′
)
×
det
B
′
(
f
(
x
1
)
,
…
,
f
(
x
n
)
)
{\displaystyle \det {}_{B}(f(x_{1}),\dots ,f(x_{n}))=\det {}_{B}(B')\times \det {}_{B'}(f(x_{1}),\dots ,f(x_{n}))}
det
(
[
f
]
B
)
×
det
B
(
x
1
,
…
,
x
n
)
=
det
B
(
f
(
x
1
)
,
…
,
f
(
x
n
)
)
=
det
B
(
B
′
)
×
det
B
′
(
f
(
x
1
)
,
…
,
f
(
x
n
)
)
=
det
B
(
B
′
)
×
det
(
[
f
]
B
′
)
×
det
B
′
(
x
1
,
…
,
x
n
)
=
det
(
[
f
]
B
′
)
×
det
B
(
x
1
,
…
,
x
n
)
{\displaystyle {\begin{aligned}\det \left([f]_{B}\right)\times \det {}_{B}(x_{1},\dots ,x_{n})&=\det {}_{B}(f(x_{1}),\dots ,f(x_{n}))\\&=\det {}_{B}(B')\times \det {}_{B'}(f(x_{1}),\dots ,f(x_{n}))\\&=\det {}_{B}(B')\times \det \left([f]_{B'}\right)\times \det {}_{B'}(x_{1},\dots ,x_{n})\\&=\det \left([f]_{B'}\right)\times \det {}_{B}(x_{1},\dots ,x_{n})\end{aligned}}}
從而可以得出
det
(
[
f
]
B
′
)
{\displaystyle \det \left([f]_{B'}\right)}
等於
det
(
[
f
]
B
)
{\displaystyle \det \left([f]_{B}\right)}
。於是
det
(
[
f
]
B
′
)
{\displaystyle \det \left([f]_{B'}\right)}
是一個不依賴於基,只依賴於f 的數。
因此線性變換的行列式定義可以修改為不依賴於基的形式:
前一節里對正方體做線性變換時,
(
x
1
,
⋯
,
x
n
)
{\displaystyle (x_{1},\cdots ,x_{n})}
是原來的基,
det
B
(
x
1
,
…
,
x
n
)
=
1
{\displaystyle \det {}_{B}(x_{1},\dots ,x_{n})=1}
,因此可以混淆向量組的行列式和線性變換的行列式[ 25] 。
特別地,行列式為1的線性變換保持向量組的行列式,它們構成一般線性群
G
L
(
E
)
{\displaystyle GL(E)}
的一個子群
S
L
(
E
)
{\displaystyle SL(E)}
,稱作特殊線性群 [ 26] 。可以證明,
S
L
(
E
)
{\displaystyle SL(E)}
是由所有的錯切 生成的,即所有具有如下形式的矩陣代表的線性變換:
[
1
1
λ
1
1
]
=
I
n
+
λ
E
i
j
{\displaystyle {\begin{bmatrix}1&&&&\\&1&&&\\&&\lambda &&\\&&&1&\\&&&&1\end{bmatrix}}=I_{n}+\lambda E_{ij}}
其中
E
i
j
{\displaystyle E_{ij}}
是只在第
i
{\displaystyle i}
行第
j
{\displaystyle j}
列處係數取1,其餘係數為0的矩陣。也就是說,錯切變換保持向量組形成的「平行多面體」的體積[ 27] 。同樣,可以證明兩個相似矩陣 有相等的行列式[ 28] 。
以上的定義中都假設矩陣的係數取自域
K
{\displaystyle \mathbb {K} }
中,實際上矩陣的係數可以是任意的交換環
k
{\displaystyle k}
,這時有限維線性空間變為以
B
=
(
e
1
,
…
,
e
n
)
{\displaystyle B=(e_{1},\dots ,e_{n})}
為基的自由
k
−
{\displaystyle k-}
模 ,而相應的關於行列式的定義和性質依然成立(在可定義的範疇內)。如果矩陣係數是非交換環的話,以上的行列式定義將不再唯一。1845年,阿瑟·凱萊 首次開始研究非交換環上行列式定義的問題。他注意到,對於係數是四元數 (不可交換)的二階行列式
|
a
11
a
12
a
21
a
22
|
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\\\end{vmatrix}}}
表達式
a
11
a
22
−
a
12
a
21
{\displaystyle a_{11}a_{22}-a_{12}a_{21}}
和
a
11
a
22
−
a
21
a
12
{\displaystyle a_{11}a_{22}-a_{21}a_{12}}
是不一樣的。1926年,阿蘭德·海廷 和A.理查德森提出了非交換環上的行列式的不同定義。理查德森將二階行列式定義為:
(
a
11
−
a
12
a
22
−
1
a
21
)
a
22
{\displaystyle (a_{11}-a_{12}a_{22}^{-1}a_{21})a_{22}}
,而海廷則提倡使用
(
a
11
−
a
12
a
22
−
1
a
21
)
{\displaystyle (a_{11}-a_{12}a_{22}^{-1}a_{21})}
。兩人都用歸納法定義了更高階矩陣的行列式。1931年,奧斯丁·歐爾 在一大類非交換環(後來命名為歐爾環 )上定義了行列式的概念。最著名的非交換環上的行列式的定義當屬讓·迪厄多內 的定義。迪厄多內是布爾巴基學派 的代表成員之一,他將除環
K
{\displaystyle \mathbb {K} }
中的行列式定義在商域
K
/
[
K
,
K
]
{\displaystyle \mathbb {K} /[\mathbb {K} ,\mathbb {K} ]}
上,而不是在
K
{\displaystyle \mathbb {K} }
中。這個定義下的行列式有接近交換環中行列式的性質。例如,迪爾多內的行列式可以保持行列式的乘法定理。而這種行列式與交換環中行列式的區別是:將矩陣的兩行或兩列互換後,行列式的值不變。[ 29] 之後菲列克斯·別列金 (Березин, Феликс Александрович )、佐藤幹夫 等人對迪厄多內的定義進行了探究和擴展[ 30] 。
行列式的一些基本性質,可以由它的多線性以及交替性推出。
在行列式中,一行(列)元素全為0,則此行列式的值為0[ 31] 。
|
0
0
…
0
a
21
a
22
…
a
2
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
|
0
a
12
…
a
1
n
0
a
22
…
a
2
n
⋮
⋮
⋱
⋮
0
a
n
2
…
a
n
n
|
=
0
{\displaystyle {\begin{vmatrix}{\color {blue}0}&{\color {blue}0}&\dots &{\color {blue}0}\\a_{21}&a_{22}&\dots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\begin{vmatrix}{\color {blue}0}&a_{12}&\dots &a_{1n}\\{\color {blue}0}&a_{22}&\dots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\{\color {blue}0}&a_{n2}&\dots &a_{nn}\end{vmatrix}}=0}
在行列式中,某一行(列)有公因子
k
{\displaystyle k}
,則可以提出
k
{\displaystyle k}
[ 31] 。
D
=
|
a
11
a
12
…
a
1
n
⋮
⋮
⋱
⋮
k
a
i
1
k
a
i
2
…
k
a
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
k
|
a
11
a
12
…
a
1
n
⋮
⋮
⋱
⋮
a
i
1
a
i
2
…
a
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
k
D
1
{\displaystyle D={\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\ddots &\vdots \\{\color {blue}k}a_{i1}&{\color {blue}k}a_{i2}&\dots &{\color {blue}k}a_{in}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\color {blue}k}{\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\ddots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\color {blue}k}D_{1}}
在行列式中,某一行(列)的每個元素是兩數之和,則此行列式可拆分為兩個相加的行列式[ 31] 。
|
a
11
a
12
…
a
1
n
⋮
⋮
⋱
⋮
a
i
1
+
b
i
1
a
i
2
+
b
i
2
…
a
i
n
+
b
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
|
a
11
a
12
…
a
1
n
⋮
⋮
⋱
⋮
a
i
1
a
i
2
…
a
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
+
|
a
11
a
12
…
a
1
n
⋮
⋮
⋱
⋮
b
i
1
b
i
2
…
b
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\ddots &\vdots \\{\color {blue}a_{i1}}+{\color {OliveGreen}b_{i1}}&{\color {blue}a_{i2}}+{\color {OliveGreen}b_{i2}}&\dots &{\color {blue}a_{in}}+{\color {OliveGreen}b_{in}}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\ddots &\vdots \\{\color {blue}a_{i1}}&{\color {blue}a_{i2}}&\dots &{\color {blue}a_{in}}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}+{\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\ddots &\vdots \\{\color {OliveGreen}b_{i1}}&{\color {OliveGreen}b_{i2}}&\dots &{\color {OliveGreen}b_{in}}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}}
行列式中的兩行(列)互換,改變行列式正負符號[ 31] 。
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
a
j
2
…
a
j
n
⋮
⋮
⋮
⋮
|
=
−
|
⋮
⋮
⋮
⋮
a
j
1
a
j
2
…
a
j
n
a
i
1
a
i
2
…
a
i
n
⋮
⋮
⋮
⋮
|
{\displaystyle {\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\{\color {blue}a_{i1}}&{\color {blue}a_{i2}}&\dots &{\color {blue}a_{in}}\\{\color {OliveGreen}a_{j1}}&{\color {OliveGreen}a_{j2}}&\dots &{\color {OliveGreen}a_{jn}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}=-{\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\{\color {OliveGreen}a_{j1}}&{\color {OliveGreen}a_{j2}}&\dots &{\color {OliveGreen}a_{jn}}\\{\color {blue}a_{i1}}&{\color {blue}a_{i2}}&\dots &{\color {blue}a_{in}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}}
在行列式中,有兩行(列)對應成比例或相同,則此行列式的值為0[ 31] 。
|
2
2
…
2
8
8
…
8
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
0
{\displaystyle {\begin{vmatrix}{\color {blue}2}&{\color {blue}2}&\dots &{\color {blue}2}\\{\color {blue}8}&{\color {blue}8}&\dots &{\color {blue}8}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}=0}
將一行(列)的
k
{\displaystyle k}
倍加進另一行(列)裡,行列式的值不變[ 31] 。
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
a
j
2
…
a
j
n
⋮
⋮
⋮
⋮
|
=
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
+
k
a
i
1
a
j
2
+
k
a
i
2
…
a
j
n
+
k
a
i
n
⋮
⋮
⋮
⋮
|
{\displaystyle {\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\a_{j1}&a_{j2}&\dots &a_{jn}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}={\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\a_{j1}{\color {blue}+ka_{i1}}&a_{j2}{\color {blue}+ka_{i2}}&\dots &a_{jn}{\color {blue}+ka_{in}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}}
注意 :一行(列)的
k
{\displaystyle k}
倍加上另一行(列),行列式的值改變。
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
a
j
2
…
a
j
n
⋮
⋮
⋮
⋮
|
≠
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
k
a
j
1
+
a
i
1
k
a
j
2
+
a
i
2
…
k
a
j
n
+
a
i
n
⋮
⋮
⋮
⋮
|
{\displaystyle {\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\a_{j1}&a_{j2}&\dots &a_{jn}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}{\color {red}\neq }{\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\{\color {red}k}a_{j1}{\color {red}+a_{i1}}&{\color {red}k}a_{j2}{\color {red}+a_{i2}}&\dots &{\color {red}k}a_{jn}{\color {red}+a_{in}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}}
將行列式的行列互換,行列式的值不變,其中行列互換相當於轉置[ 31] [ 32] 。這個性質可以簡單地記作
D
=
|
a
i
j
|
=
|
a
j
i
|
=
D
T
{\displaystyle D={\begin{vmatrix}a_{ij}\end{vmatrix}}={\begin{vmatrix}a_{ji}\end{vmatrix}}=D^{\textrm {T}}}
例如
|
a
11
a
12
…
a
1
n
a
21
a
22
…
a
2
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
|
a
11
a
21
…
a
n
1
a
12
a
22
…
a
n
2
⋮
⋮
⋱
⋮
a
1
n
a
2
n
…
a
n
n
|
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\a_{21}&a_{22}&\dots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\begin{vmatrix}a_{11}&a_{21}&\dots &a_{n1}\\a_{12}&a_{22}&\dots &a_{n2}\\\vdots &\vdots &\ddots &\vdots \\a_{1n}&a_{2n}&\dots &a_{nn}\end{vmatrix}}}
行列式的乘法定理:方塊矩陣 的乘積的行列式等於行列式的乘積。
det
(
A
B
)
=
det
(
A
)
det
(
B
)
{\displaystyle \displaystyle \det(AB)=\det(A)\det(B)}
。特別的,若將矩陣中的每一行每一列上的數都乘以一個常數
r
{\displaystyle r}
,那麼所得到的行列式不是原來的
r
{\displaystyle r}
倍,而是
r
n
{\displaystyle r^{n}}
倍:[ 33]
det
(
r
A
)
=
det
(
r
I
n
⋅
A
)
=
det
(
r
I
n
)
⋅
det
(
A
)
=
r
n
det
(
A
)
{\displaystyle \det(rA)=\det(rI_{n}\cdot A)=\det(rI_{n})\cdot \det(A)=r^{n}\det(A)}
。
以上的乘法公式還可以進一步推廣為所謂柯西–比內公式 ,從而使得只要兩個矩陣的乘積是方塊矩陣,就有類似於以上的結果:假設
A
{\displaystyle A}
是一個
m
×
n
{\displaystyle m\times n}
矩陣,而
B
{\displaystyle B}
是一個
n
×
m
{\displaystyle n\times m}
矩陣。如果
S
{\displaystyle S}
是
{
1
,
⋯
,
n
}
{\displaystyle \left\{1,\cdots ,n\right\}}
中具有
m
{\displaystyle m}
個元素的子集
{
S
1
,
⋯
,
S
m
}
{\displaystyle \left\{S_{1},\cdots ,S_{m}\right\}}
,我們記
A
S
{\displaystyle A_{S}}
為
A
{\displaystyle A}
中列指標位於
S
{\displaystyle S}
中的
m
×
m
{\displaystyle m\times m}
子矩陣。類似地,記
B
S
{\displaystyle B_{S}}
為
B
{\displaystyle B}
中行指標位於
S
{\displaystyle S}
中的
m
×
m
{\displaystyle m\times m}
子矩陣。那麼
det
(
A
B
)
=
∑
S
det
(
A
S
)
det
(
B
S
)
{\displaystyle \det(AB)=\sum _{S}\det(A_{S})\det(B_{S})\,}
這裡求遍
{
1
,
⋯
,
n
}
{\displaystyle \left\{1,\cdots ,n\right\}}
中
m
{\displaystyle m}
個元素的所有可能子集
S
{\displaystyle S}
(共有C(n ,m ) 個)。
如果
m
=
n
{\displaystyle m=n}
,即
A
{\displaystyle A}
與
B
{\displaystyle B}
是同樣大小的方塊矩陣,則只有一個容許集合
S
{\displaystyle S}
,柯西–比內公式退化為通常行列式的乘法公式。如過
m
=
1
{\displaystyle m=1}
則有
n
{\displaystyle n}
容許集合
S
{\displaystyle S}
,這個公式退化為點積 。如果
m
>
n
{\displaystyle m>n}
,沒有容許集合
S
{\displaystyle S}
,約定行列式
det
(
A
B
)
{\displaystyle \det(AB)}
是零[ 34] 。
若
A
{\displaystyle A}
是可逆矩陣 ,
det
(
A
−
1
)
=
(
det
(
A
)
)
−
1
{\displaystyle \displaystyle \det(A^{-1})=(\det(A))^{-1}}
[ 35] 。
由行列式的乘法定理以及
det
(
A
−
1
)
=
(
det
(
A
)
)
−
1
{\displaystyle \displaystyle \det(A^{-1})=(\det(A))^{-1}}
可以知道,行列式定義了一個從一般線性群
(
G
L
n
(
F
)
,
×
)
{\displaystyle (GL_{n}(\mathbb {F} ),\times )}
到
(
F
∗
,
×
)
{\displaystyle (\mathbb {F} ^{*},\times )}
上的群同態 [ 36] 。
若將方塊矩陣中的元素取共軛 ,得到的是矩陣的共軛矩陣。共軛矩陣的行列式值等於矩陣行列式值的共軛:
det
(
A
¯
)
=
det
(
A
)
¯
{\displaystyle \det({\overline {A}})={\overline {\det(A)}}}
[ 37]
若兩個矩陣相似 ,那麼它們的行列式相同。這是因為兩個相似的矩陣之間只相差一個基底變換,而行列式描述的是矩陣對應的線性映射對體積的影響,而不是體積,所以基底變換並不會影響行列式的值。用數學語言來說,就是:
如果兩個矩陣
A
{\displaystyle \mathbf {A} }
與
B
{\displaystyle \mathbf {B} }
相似,那麼存在可逆矩陣
P
{\displaystyle \mathbf {P} }
使得
A
=
P
B
P
−
1
{\displaystyle \mathbf {A} =\mathbf {PB} \mathbf {P} ^{-1}}
,所以
det
(
A
)
=
det
(
P
B
P
−
1
)
=
det
(
P
)
⋅
det
(
B
)
⋅
det
(
P
−
1
)
=
det
(
B
)
⋅
det
(
P
)
⋅
det
(
P
)
−
1
=
det
(
B
)
{\displaystyle \det(\mathbf {A} )=\det(\mathbf {PB} \mathbf {P} ^{-1})=\det(\mathbf {P} )\cdot \det(\mathbf {B} )\cdot \det(\mathbf {P} ^{-1})=\det(\mathbf {B} )\cdot \det(\mathbf {P} )\cdot \det(\mathbf {P} )^{-1}=\det(\mathbf {B} )}
[ 28]
行列式是所有特徵值 (按代數重數計)的乘積。這可由矩陣必和其若爾當標準型 相似推導出[ 38] 。特殊地,三角矩陣 的行列式等於其對角線上所有元素的乘積[ 38] 。
由於三角矩陣的行列式計算簡便,當矩陣的係數為域 時,可以通過高斯消去法 將矩陣變換成三角矩陣,或者將矩陣分解成三角矩陣的乘積之後再利用行列式的乘法定理進行計算。可以證明,所有的矩陣
A
{\displaystyle A}
都可以分解成一個上三角矩陣
U
{\displaystyle U}
、一個下三角矩陣
L
{\displaystyle L}
以及一個置換矩陣
P
{\displaystyle P}
的乘積:
A
=
P
⋅
L
⋅
U
{\displaystyle A=P\cdot L\cdot U}
。這時,矩陣
A
{\displaystyle A}
的行列式可以寫成:
det
(
A
)
=
det
(
P
)
⋅
det
(
L
)
⋅
det
(
U
)
{\displaystyle \det(A)=\det(P)\cdot \det(L)\cdot \det(U)}
[ 39]
分塊矩陣的行列式並不能簡單地表示成每個分塊的行列式的乘積組合。對於分塊的三角矩陣,仍然有類似的結論:
|
A
0
C
D
|
=
|
A
B
0
D
|
=
det
(
A
)
det
(
D
)
{\displaystyle {\begin{vmatrix}A&0\\C&D\end{vmatrix}}={\begin{vmatrix}A&B\\0&D\end{vmatrix}}=\det(A)\det(D)}
,矩陣的行列式等於對角元素的行列式之乘積。
對於一般情況,若對角元素中有一個是可逆矩陣,比如說
A
{\displaystyle A}
可逆,那麼矩陣的行列式可以寫做
|
A
B
C
D
|
=
det
(
A
)
det
(
D
−
C
A
−
1
B
)
{\displaystyle {\begin{vmatrix}A&B\\C&D\end{vmatrix}}=\det(A)\det(D-CA^{-1}B)}
。[ 40]
矩陣的行列式和矩陣的跡數 有一定的關聯,當矩陣的係數為域 時,在定義了矩陣的指數函數 後,有如下的恆等式:
det
(
exp
(
A
)
)
=
exp
(
t
r
(
A
)
)
{\displaystyle \det(\exp(A))=\exp(\mathrm {tr} (A))}
[ 41]
對一個
n
{\displaystyle n}
階的行列式
M
{\displaystyle M}
,去掉
M
{\displaystyle M}
的第
i
{\displaystyle i}
行第
j
{\displaystyle j}
列後形成的
n
−
1
{\displaystyle n-1}
階的行列式叫做
M
{\displaystyle M}
關於元素
m
i
j
{\displaystyle m_{ij}}
的餘因式 。記作
M
i
j
{\displaystyle M_{ij}}
[ 42] 。
M
i
j
=
|
m
1
,
1
…
m
1
,
j
−
1
m
1
,
j
+
1
…
m
1
,
n
⋮
⋮
⋮
⋮
m
i
−
1
,
1
…
m
i
−
1
,
j
−
1
m
i
−
1
,
j
+
1
…
m
i
−
1
,
n
m
i
+
1
,
1
…
m
i
+
1
,
j
−
1
m
i
+
1
,
j
+
1
…
m
i
+
1
,
n
⋮
⋮
⋮
⋮
m
n
,
1
…
m
n
,
j
−
1
m
n
,
j
+
1
…
m
n
,
n
|
{\displaystyle M_{ij}={\begin{vmatrix}m_{1,1}&\dots &m_{1,j-1}&m_{1,j+1}&\dots &m_{1,n}\\\vdots &&\vdots &\vdots &&\vdots \\m_{i-1,1}&\dots &m_{i-1,j-1}&m_{i-1,j+1}&\dots &m_{i-1,n}\\m_{i+1,1}&\dots &m_{i+1,j-1}&m_{i+1,j+1}&\dots &m_{i+1,n}\\\vdots &&\vdots &\vdots &&\vdots \\m_{n,1}&\dots &m_{n,j-1}&m_{n,j+1}&\dots &m_{n,n}\end{vmatrix}}}
皮埃爾-西蒙·拉普拉斯
M
{\displaystyle M}
關於元素
m
i
j
{\displaystyle m_{ij}}
的代數餘子式 記作
C
i
j
{\displaystyle C_{ij}}
。
C
i
j
=
(
−
1
)
(
i
+
j
)
⋅
M
i
j
{\displaystyle C_{ij}=(-1)^{(i+j)}\cdot M_{ij}}
[ 42] 。
一個
n
{\displaystyle n}
階的行列式
M
{\displaystyle M}
可以寫成一行(或一列)的元素與對應的代數餘子式的乘積之和,叫作行列式按一行(或一列)的展開。
det
M
=
∑
i
=
1
n
m
i
;
j
C
i
,
j
{\displaystyle \det {M}=\sum _{i=1}^{n}m_{i;j}C_{i,j}}
det
M
=
∑
j
=
1
n
m
i
;
j
C
i
,
j
{\displaystyle \det {M}=\sum _{j=1}^{n}m_{i;j}C_{i,j}}
這個公式又稱拉普拉斯公式 ,把
n
{\displaystyle n}
維矩陣的行列式計算變為了
n
{\displaystyle n}
個
n
−
1
{\displaystyle n-1}
維的行列式的計算[ 42] [ 43] 。另一方面,拉普拉斯公式可以作為行列式的一種歸納定義:在定義了二維行列式後,
n
{\displaystyle n}
維矩陣的行列式可以藉助拉普拉斯公式用
n
−
1
{\displaystyle n-1}
維的行列式來定義。這樣定義的行列式與前面的定義是等價的[ 10] 。
計算行列式的值是一個常見的問題。最簡單的方法是按照定義
det
(
A
)
=
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
a
i
,
σ
(
i
)
{\displaystyle \det(A)=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{i,\sigma (i)}}
計算或按照拉普拉斯公式 進行遞歸 運算。這樣的算法需要計算
n
!
{\displaystyle n!}
次的加法,複雜度是指數函數。在實際的計算中只能用於計算階數很小的行列式。注意到拉普拉斯公式的性質,如果一行或一列裡面有很多個0,那麼就可以把行列式按這一行或一列展開,這時數值 為零的係數所對應的代數餘子式就不必計算了,因為最後要乘以0,這樣就可以簡化計算。然而更加簡便的算法是利用高斯消去法 或LU分解法 ,把矩陣通過初等變換變成三角矩陣或三角矩陣的乘積來計算行列式的值。這些算法的複雜度都是
n
3
{\displaystyle n^{3}}
級別,遠遠小於直接計算的複雜度。
如果一個算法可以在
O
(
n
s
)
{\displaystyle {\mathit {O}}(n^{s})}
時間內算出矩陣乘法,那麼可以構造出一種
O
(
n
s
)
{\displaystyle {\mathit {O}}(n^{s})}
時間內的行列式求值算法。這說明求矩陣的行列式的值和矩陣的乘法有相同的複雜度。於是,通過分治算法或者其它的方法,可以達到比
O
(
n
3
)
{\displaystyle {\mathit {O}}(n^{3})}
更好的結果。比如,存在複雜度
O
(
n
2.376
)
{\displaystyle {\mathit {O}}(n^{2.376})}
的行列式求值算法[ 44] [ 45] 。
由行列式的一般表達形式中可以看出,矩陣
A
{\displaystyle A}
的行列式是關於其係數的多項式。因此行列式函數具有良好的光滑性質。
設矩陣函數
t
↦
A
(
t
)
{\displaystyle t\mapsto A(t)}
為
C
k
{\displaystyle {\mathcal {C}}^{k}}
(k 階連續可導 )的函數,則由於行列式函數
t
↦
det
A
(
t
)
{\displaystyle t\mapsto \det A(t)}
只不過是矩陣
A
(
t
)
{\displaystyle A(t)}
的某些係數的乘積,所以也是
C
k
{\displaystyle {\mathcal {C}}^{k}}
的。其對t 的導數為
d
d
t
(
det
(
A
1
(
t
)
,
…
,
A
n
(
t
)
)
)
=
∑
i
=
1
n
det
(
A
1
(
t
)
,
…
,
A
i
−
1
(
t
)
,
A
i
′
(
t
)
,
A
i
+
1
(
t
)
,
…
,
A
n
(
t
)
)
{\displaystyle {\frac {\rm {d}}{{\rm {d}}t}}\left(\det(A_{1}(t),\dots ,A_{n}(t))\right)=\sum _{i=1}^{n}\det(A_{1}(t),\dots ,A_{i-1}(t),A'_{i}(t),A_{i+1}(t),\dots ,A_{n}(t))}
,其中的每個
A
i
(
t
)
{\displaystyle A_{i}(t)}
是矩陣
A
(
t
)
{\displaystyle A(t)}
的第i 個行向量(也可以全部是列向量)。[ 46]
函數
A
↦
det
A
{\displaystyle A\mapsto \det A}
是連續的。由此,n階一般線性群 是一個開集 ,因為是開區間
R
−
{
0
}
{\displaystyle \mathbb {R} -\left\{0\right\}}
的原像,而特殊線性群 則是一個閉集 ,因為是閉集合
{
1
,
−
1
}
{\displaystyle \left\{1,-1\right\}}
的原像[ 47] 。
函數
A
↦
det
A
{\displaystyle A\mapsto \det A}
也是可微的 ,甚至是光滑 的(
C
∞
{\displaystyle {\mathcal {C}}^{\infty }}
)[ 48] 。它在某個矩陣
A
{\displaystyle A}
處的展開為
det
(
A
+
H
)
=
det
A
+
t
r
(
t
C
o
m
(
A
)
.
H
)
+
o
(
‖
H
‖
)
{\displaystyle \det(A+H)=\det A+{\rm {tr}}({}^{t}{\rm {Com}}(A).H)+o(\|H\|)}
[ 49]
也就是說,在裝備正則範數 的矩陣空間
M
n
(
R
)
{\displaystyle M_{n}(\mathbb {R} )}
中,伴隨矩陣 是行列式函數的梯度
∇
det
(
A
)
=
C
o
m
(
A
)
{\displaystyle \nabla \det(A)={\rm {Com}}(A)}
[ 50] 特別當
A
{\displaystyle A}
為單位矩陣 時,
det
(
I
+
H
)
=
1
+
t
r
(
H
)
+
o
(
‖
H
‖
)
,
∇
det
(
I
)
=
I
{\displaystyle \det(I+H)=1+{\rm {tr}}(H)+o(\|H\|),\qquad \nabla \det(I)=I}
可逆矩陣的可微性說明一般線性群
G
L
n
(
R
)
{\displaystyle GL_{n}(\mathbb {R} )}
是一個李群 [ 51] 。
行列式與外代數 有密切的關係,因為外代數正是在給定的交換環
K
{\displaystyle \mathbb {K} }
上的自由
K
{\displaystyle \mathbb {K} }
-模
V
{\displaystyle V}
上最「一般性」的有交替性質的結合代數 ,記為
∧
(
V
)
{\displaystyle \wedge (V)}
。外代數是由楔積 構造而成的,而楔積在
V
{\displaystyle V}
上的交替性質表現如下(定義):
楔積是滿足結合律 的雙線性 的二元運算,使得對於所有向量
v
∈
V
{\displaystyle v\in V}
,
v
∧
v
=
0
{\displaystyle v\wedge v=0}
這表示
對於所有向量
u
,
v
∈
V
{\displaystyle u,v\in V}
,
u
∧
v
=
−
v
∧
u
{\displaystyle u\wedge v=-v\wedge u}
,以及
當
v
1
,
…
,
v
k
∈
V
{\displaystyle v_{1},\ldots ,v_{k}\in V}
線性相關 時,
v
1
∧
v
2
∧
⋯
∧
v
k
=
0
{\displaystyle v_{1}\wedge v_{2}\wedge \cdots \wedge v_{k}=0}
。所有形同
v
1
∧
v
2
∧
⋯
∧
v
k
{\displaystyle v_{1}\wedge v_{2}\wedge \cdots \wedge v_{k}}
的元素稱為
k
−
{\displaystyle k-}
向量 。所有
k
−
{\displaystyle k-}
向量構成了
∧
(
V
)
{\displaystyle \wedge (V)}
的一個子空間,稱為
V
{\displaystyle V}
的
k
−
{\displaystyle k-}
階外冪 ,記為
∧
k
(
V
)
{\displaystyle \wedge ^{k}(V)}
。行列式函數是
n
{\displaystyle n}
重交替線性形式,所以可以看成是將
n
{\displaystyle n}
個
K
n
{\displaystyle \mathbb {K} ^{n}}
裡面的向量映射到它們對應的
n
−
{\displaystyle n-}
階外冪
∧
n
(
K
n
)
{\displaystyle \wedge ^{n}(\mathbb {K} ^{n})}
這樣一個映射。由於
K
n
{\displaystyle \mathbb {K} ^{n}}
的
k
−
{\displaystyle k-}
階外冪
∧
k
(
K
n
)
{\displaystyle \wedge ^{k}(\mathbb {K} ^{n})}
的維數等於組合數
(
n
k
)
{\displaystyle {\binom {n}{k}}}
,
∧
n
(
R
n
)
{\displaystyle \wedge ^{n}(\mathbb {R} ^{n})}
的維數是
(
n
n
)
=
1
{\displaystyle {\binom {n}{n}}=1}
,因此
∧
n
(
K
n
)
{\displaystyle \wedge ^{n}(\mathbb {K} ^{n})}
實際上同構 於
K
{\displaystyle \mathbb {K} }
,所以將行列式看做
n
{\displaystyle n}
個
K
n
{\displaystyle \mathbb {K} ^{n}}
裡面的向量映射到它們對應的
n
−
{\displaystyle n-}
階外冪
∧
n
(
K
n
)
{\displaystyle \wedge ^{n}(\mathbb {K} ^{n})}
的映射與之前的行列式定義並沒有衝突。外代數理論實際上涵蓋了行列式理論。[ 52] [ 53]
對三維歐幾里得空間中
R
3
{\displaystyle \mathbb {R} ^{3}}
可以建立一個線性同構
ϕ
:
Λ
2
(
R
3
)
→
R
3
{\displaystyle \phi :\Lambda ^{2}(\mathbb {R} ^{3})\rightarrow \mathbb {R} ^{3}}
如下:任取
R
3
{\displaystyle \mathbb {R} ^{3}}
的右手的標準正交基
i
{\displaystyle {\boldsymbol {i}}}
,
j
{\displaystyle {\boldsymbol {j}}}
,
k
{\displaystyle {\boldsymbol {k}}}
,規定
ϕ
{\displaystyle \phi }
把
i
∧
j
{\displaystyle {\boldsymbol {i}}\wedge \mathbf {j} }
,
j
∧
k
{\displaystyle {\boldsymbol {j}}\wedge {\boldsymbol {k}}}
,
k
∧
i
{\displaystyle {\boldsymbol {k}}\wedge {\boldsymbol {i}}}
分別映射為
k
{\displaystyle {\boldsymbol {k}}}
,
i
{\displaystyle {\boldsymbol {i}}}
,
j
{\displaystyle {\boldsymbol {j}}}
,則
ϕ
{\displaystyle \phi }
的定義與右手的標準正交基如何選取無關。
不難看出,對任意向量
u
{\displaystyle {\boldsymbol {u}}}
和
v
{\displaystyle {\boldsymbol {v}}}
,這個線性同構把楔積
u
∧
v
{\displaystyle {\boldsymbol {u}}\wedge {\boldsymbol {v}}}
映射為叉積
u
×
v
{\displaystyle {\boldsymbol {u}}\times {\boldsymbol {v}}}
。這就是叉乘 (向量積)的實質。叉積可以用帶向量的行列式:
a
×
b
=
|
i
j
k
a
1
a
2
a
3
b
1
b
2
b
3
|
{\displaystyle \mathbf {a} \times \mathbf {b} =\ {\begin{vmatrix}\mathbf {i} &\mathbf {j} &\mathbf {k} \\a_{1}&a_{2}&a_{3}\\b_{1}&b_{2}&b_{3}\\\end{vmatrix}}}
來表示,但要注意這個行列式形式並不代表一個「真正」的行列式,因為第一行的分量不是數,而是向量。這個計算之所以正確是得益於線性同構
ϕ
{\displaystyle \phi }
。[ 53]
行列式的概念最初是伴隨着方程 組的求解而發展起來的。行列式的提出可以追溯到十七世紀,最初的雛形由日本 數學家 關孝和 與德國 數學家戈特弗里德·萊布尼茨 各自獨立得出,時間相差132年。
關孝和在《解伏題之法》中首次運用行列式的概念
1545年,吉羅拉莫·卡爾達諾 在著作《大術 》(Ars Magna )中給出了一種解兩個一次方程組的方法。他把這種方法稱為「母法」(regula de modo )。這種方法和後來的克萊姆法則 已經很相似了,但卡爾達諾並沒有給出行列式的概念[ 54] 。
1683年,日本數學家關孝和 在其著作《解伏題之法》中首次引進了行列式的概念。書中出現了
2
×
2
{\displaystyle 2\times 2}
、
3
×
3
{\displaystyle 3\times 3}
乃至
5
×
5
{\displaystyle 5\times 5}
的行列式,行列式被用來求解高次方程組[ 55] [ 56] 。
1693年,德國數學家萊布尼茨開始使用指標數的系統集合來表示有三個未知數的三個一次方程組的係數。他從三個方程的系統中消去了兩個未知量後得到一個行列式。這個行列式不等於零,就意味着有一組解同時滿足三個方程[ 57] [ 58] [ 55] 。由於當時沒有矩陣的概念,萊布尼茨將行列式中元素的位置用數對來表示:ij 代表第i 行第j 列。萊布尼茨對行列式的研究成果中已經包括了行列式的展開 和克萊姆法則 ,但這些結果在當時並不為人所知[ 59] 。
1730年,蘇格蘭 數學家科林·麥克勞林 在他的《論代數》中已經開始闡述行列式的理論,記載了用行列式解二元、三元和四元一次方程的方法,並給出了四元一次方程組的一般解的正確形式,儘管這本書直到麥克勞林逝世兩年後(1748年)才得以出版[ 60] 。
約瑟夫·拉格朗日
1750年,瑞士 的加布里爾·克萊姆 首先在他的《代數曲線分析引論》給出了n 元一次方程組求解的法則,用於確定經過五個點的一般二次曲線 的係數,但並沒有給出證明[ 61] 。其中行列式的計算十分複雜,因為是定義在奇置換和偶置換 上的[ 62] 。
此後,關於行列式的研究逐漸增多。1764年,法國的艾蒂安·裴蜀 的論文中關於行列式的計算方法的研究簡化了克萊姆法則,給出了用結式 來判別線性方程組的方法[ 55] [ 63] 。同是法國人的范德蒙德 則在1771年的論著中第一個將行列式和解方程理論分離,對行列式單獨作出闡述。這是數學家們開始對行列式本身進行研究的開端[ 64] 。
1772年,皮埃爾-西蒙·拉普拉斯 在論文《對積分和世界體系的探討》中推廣了范德蒙德著作裡面將行列式展開為若干個較小的行列式之和的方法,發展出子式 的概念。一年後,約瑟夫·拉格朗日 發現了
3
×
3
{\displaystyle 3\times 3}
的行列式與空間中體積的聯繫。他發現:原點和空間中三個點所構成的四面體 的體積,是它們的坐標所組成的行列式的六分之一[ 65] [ 55] 。
行列式在大部分歐洲語言中被稱為「determinant」(某些語言中詞尾加e或o,或變成s),這個稱呼最早是由卡爾·弗里德里希·高斯 在他的《算術研究 》中引入的。這個稱呼的詞根有「決定」意思,因為在高斯的使用中,行列式能夠決定二次曲線 的性質。在同一本著作中,高斯還敘述了一種通過係數之間加減來求解多元一次方程組的方法,也就是現在的高斯消元法 [ 55] 。
詹姆斯·約瑟夫·西爾維斯特
進入十九世紀後,行列式理論進一步得到發展和完善。奧古斯丁·路易·柯西 在1812年首先將「determinant」一詞用來表示十八世紀出現的行列式,此前高斯只不過將這個詞限定在二次曲線所對應的係數行列式中。柯西也是最早將行列式排成方陣並將其元素用雙重下標表示的數學家(垂直線記法是阿瑟·凱萊 在1841年率先使用的)[ 66] 。柯西還證明了行列式的乘法定理 (實際上是矩陣乘法),這個定理曾經在雅克·菲利普·瑪利·比內 (Jacque Philippe Marie Binet )的書中出現過,但沒有證明[ 67] [ 55] [ 66] 。
十九世紀五十年代,凱萊和詹姆斯·約瑟夫·西爾維斯特 將矩陣 的概念引入數學研究中[ 68] 。行列式和矩陣之間的密切關係使得矩陣論 蓬勃發展的同時也帶來了許多關於行列式的新結果,例如阿達馬不等式 、正交行列式、對稱行列式等等[ 69] 。
與此同時,行列式也被應用於各種領域中。高斯在二次曲線 和二次型 的研究中使用行列式作為二次曲線 和二次型 劃歸為標準型時的判別依據。之後,卡爾·魏爾斯特拉斯 和西爾維斯特又完善了二次型理論,研究了
λ
{\displaystyle \lambda }
-矩陣的行列式以及初等因子 [ 70] [ 71] 。行列式被用於多重函數的積分大約始於十九世紀三十年代。1832年至1833年間卡爾·雅可比 發現了一些特殊結果,1839年,歐仁·夏爾·卡塔蘭 (Eugène Charles Catalan )發現了所謂的雅可比行列式 [ 72] [ 73] 。1841年,雅可比發表了一篇關於函數行列式的論文,討論函數的線性相關性 與雅可比行列式的關係[ 74] 。
行列式的一個主要應用是解線性方程組 。當線性方程組的方程個數與未知數 個數相等時,方程組不一定總是有唯一解。對一個有n 個方程和n 個未知數的線性方程組,我們研究未知數係數所對應的行列式。這個線性方程組有唯一解當且僅當 它對應的行列式不為零。這也是行列式概念出現的根源[ 75] 。
當線性方程組對應的行列式不為零時,由克萊姆法則 ,可以直接以行列式的形式寫出方程組的解。但用克萊姆法則求解計算量巨大,因此並沒有實際應用價值,一般用於理論上的推導[ 76] 。
矩陣的概念出現得比行列式晚,直到十九世紀中期才被引入,然而兩者在本質上仍然有密切關係。通過矩陣,線性方程組可以表示為
A
x
=
b
{\displaystyle \mathbf {A} x=b}
其中
A
{\displaystyle \mathbf {A} }
是由方程組中未知數的係數構成的方塊矩陣,
x
=
(
x
1
,
x
2
,
⋯
,
x
n
)
T
{\displaystyle x=(x_{1},x_{2},\cdots ,x_{n})^{\mathbf {T} }}
是未知數,而
b
=
(
b
1
,
b
2
,
⋯
,
b
n
)
T
{\displaystyle b=(b_{1},b_{2},\cdots ,b_{n})^{\mathbf {T} }}
。
在矩陣理論中,行列式也有各種用途。多項式
p
(
x
)
=
det
(
x
I
−
A
)
{\displaystyle p(x)=\det(xI-A)}
稱為方塊矩陣
A
{\displaystyle A}
的特徵值多項式。這是一個由行列式定義的多項式,它的解是矩陣所有的特徵值 。換句話說,
x
{\displaystyle x}
是矩陣
A
{\displaystyle A}
的特徵值當且僅當
x
I
−
A
{\displaystyle xI-A}
不是可逆矩陣。特徵值多項式在矩陣理論中有重要的應用[ 77] 。
早在高斯的時代,行列式就和多項式的研究聯繫在一起。行列式的一個應用是在所謂的「結式 」上。結式是兩個多項式
p
{\displaystyle \displaystyle p}
和
q
{\displaystyle \displaystyle q}
的西爾維斯特矩陣 的行列式。兩個多項式的結式等於0 當且僅當它們有高於或等於一次的公因子多項式。結式還可以判斷多項式是否有重根:如果多項式
p
{\displaystyle \displaystyle p}
和它的微分多項式
p
′
{\displaystyle \displaystyle p^{\prime }}
的結式不為零,那麼這個多項式沒有重根,否則有重根[ 78] 。
行列式在多項式逼近理論 中也有出現。給定一組插值點,判別插值多項式的存在性需要看所謂的范德蒙矩陣 ,而由於范德蒙矩陣的行列式不為零,因此根據克萊姆法則,插值多項式唯一存在(次數小於插值點個數)[ 79] 。
朗斯基行列式是函數矩陣的行列式,因此本身也是一個函數。給定n 個n-1 次連續 可微 函數,f1 、...、fn ,它們的朗斯基行列式W(f1 , ..., fn ) 為:
W
(
f
1
,
…
,
f
n
)
(
t
)
=
|
f
1
(
t
)
f
2
(
t
)
⋯
f
n
(
t
)
f
1
′
(
t
)
f
2
′
(
t
)
⋯
f
n
′
(
t
)
⋮
⋮
⋱
⋮
f
1
(
n
−
1
)
(
t
)
f
2
(
n
−
1
)
(
t
)
⋯
f
n
(
n
−
1
)
(
t
)
|
{\displaystyle W(f_{1},\ldots ,f_{n})(t)={\begin{vmatrix}f_{1}(t)&f_{2}(t)&\cdots &f_{n}(t)\\f_{1}'(t)&f_{2}'(t)&\cdots &f_{n}'(t)\\\vdots &\vdots &\ddots &\vdots \\f_{1}^{(n-1)}(t)&f_{2}^{(n-1)}(t)&\cdots &f_{n}^{(n-1)}(t)\end{vmatrix}}}
[ 80]
可以證明,如果f1 、...、fn 線性相關,那麼它們的朗斯基行列式恆等於零[ 80] 。
在線性微分動力系統理論中,朗斯基行列式用來判別若干個解的線性相關性。如果n 個解f1 、...、fn 線性無關,那麼它們的朗斯基行列式將總不為零[ 81] 。根據劉維爾定理,n 維空間上的線性微分方程:
Y
′
=
A
(
t
)
Y
{\displaystyle Y^{\prime }=A(t)Y}
的基礎解系所構成的朗斯基行列式
W
(
t
)
{\displaystyle W(t)}
滿足:
W
′
(
t
)
=
t
r
A
(
t
)
W
(
t
)
{\displaystyle W'(t)={\rm {tr}}\,A(t)W(t)}
,[ 80]
同樣地,線性微分方程:
y
(
n
)
=
a
0
(
t
)
y
+
a
1
(
t
)
y
′
+
a
2
(
t
)
y
″
+
.
.
.
+
a
n
−
1
(
t
)
y
(
n
−
1
)
{\displaystyle y^{(n)}=a_{0}(t)y+a_{1}(t)y'+a_{2}(t)y''+...+a_{n-1}(t)y^{(n-1)}\,}
的基礎解系所構成的朗斯基行列式
W
(
t
)
{\displaystyle W(t)}
滿足:
W
′
(
t
)
=
a
n
−
1
(
t
)
W
(
t
)
{\displaystyle W'(t)=a_{n-1}(t)W(t)}
[ 80]
雅可比行列式是把一個體積元(藍色)變換成另一個(紅色)時兩者的體積之比
行列式體現了線性變換對於空間體積的作用,對於非線性的函數,其對體積的影響更為複雜,但對於足夠「良好」的函數,在一個微小的範圍內,比如說在空間中一點的附近,可以將函數的效果近似地用線性的變換來代替。由此,對於某些函數,也可以將它在某一點附近的作用效果用它在這一點上的偏導數構成的矩陣(稱為雅可比矩陣 )來表示。這類行列式被稱為「雅可比行列式 」,即是雅可比矩陣 的行列式,只對連續可微 的函數有定義[ 82] 。
在計算「體積」的多重積分中,雅可比行列式應用於換元積分 的時候。積分的思想是將空間割成許多個微小的體積元,稱為積分元素,再將每個體積元上的函數值 乘以體積元的體積後相加。將一個積分元素換為另一個積分元素時,實際上作了一次對空間中體積的度量方式的改變:分劃體積元的方式不同了。譬如在二維空間中,將直角坐標 積分換為極坐標 積分時,面積元素由方塊區域變成扇形區域。因此,要測量這種體積度量方式的改變,可以將這種變換看成一個非線性的變換函數(實際上是一個微分同胚 ):
φ
:
R
n
⟶
R
n
{\displaystyle \varphi :\mathbb {R} ^{n}\longrightarrow \mathbb {R} ^{n}}
。而它在每一點的影響可以通過雅可比行列式來體現[ 83] 。
運用雅可比行列式的還有非線性方程組的數值求解。對於一般的非線性方程組,不存在求解公式,只能夠用數值分析 的方法求近似解。求近似解的基本思想也是將非線性問題在局部的地方逐步線性化,化歸為線性方程組來求解。設有方程組:
{
f
1
(
x
1
,
x
2
,
⋯
,
x
n
)
=
0
⋮
⋮
f
n
(
x
1
,
x
2
,
⋯
,
x
n
)
=
0
{\displaystyle {\begin{cases}f_{1}(x_{1},x_{2},\cdots ,x_{n})=0\\\quad \vdots \qquad \qquad \qquad \vdots \quad \\f_{n}(x_{1},x_{2},\cdots ,x_{n})=0\end{cases}}}
其中
f
=
(
f
1
,
⋯
,
f
n
)
{\displaystyle f=(f_{1},\cdots ,f_{n})}
是連續可微函數,並在解的附近雅可比行列式不為零,那麼可以用牛頓法迭代求得近似解。迭代程序為:
f
(
x
(
k
+
1
)
)
=
x
(
k
)
−
det
(
J
f
(
x
(
k
)
)
)
−
1
f
(
x
(
k
)
)
(
k
=
0
,
1
,
⋯
)
{\displaystyle f(x^{(k+1)})=x^{(k)}-\det(\mathbf {J} _{f}(x^{(k)}))^{-1}f(x^{(k)})\qquad (k=0,1,\cdots )}
其中的
x
(
k
)
=
(
x
1
(
k
)
,
x
2
(
k
)
,
⋯
,
x
n
(
k
)
)
{\displaystyle x^{(k)}=(x_{1}^{(k)},x_{2}^{(k)},\cdots ,x_{n}^{(k)})}
是第
k
{\displaystyle k}
次迭代時的解的近似數值。每次迭代時先求解關於線性方程組
J
f
(
x
(
k
)
)
Δ
x
(
k
)
=
f
(
x
(
k
)
)
{\displaystyle \mathbf {J} _{f}(x^{(k)})\Delta x^{(k)}=f(x^{(k)})}
然後計算新的近似值
x
(
k
+
1
)
=
x
(
k
)
−
Δ
x
(
k
)
{\displaystyle x^{(k+1)}=x^{(k)}-\Delta x^{(k)}}
[ 84]
在實際應用中,還需要考慮帶有參數的非線性方程組:
{
f
1
(
x
1
,
x
2
,
⋯
,
x
n
,
λ
)
=
0
⋮
⋮
f
n
(
x
1
,
x
2
,
⋯
,
x
n
,
λ
)
=
0
{\displaystyle {\begin{cases}f_{1}(x_{1},x_{2},\cdots ,x_{n},\lambda )=0\\\quad \vdots \qquad \qquad \qquad \vdots \quad \\f_{n}(x_{1},x_{2},\cdots ,x_{n},\lambda )=0\end{cases}}}
其中的
λ
{\displaystyle \lambda }
可以代表溫度 、外力 等環境因素。當環境改變時,方程解上的雅可比行列式可能從非零變為零。雅可比行列式為零的點稱為臨界點或分支點,是方程的解改變性質的地方。和線性方程組類似,當雅可比行列式的值為零時,方程組會出現局部多值的情況。尋找分支點和分支方向的研究是非線性方程求解的一大問題。[ 85]
^ 1.0 1.1 線性代數的專有名詞 (PDF) . (原始內容 (PDF) 存檔於2022-10-28).
^ 項武義,《基礎代數學》,第92頁
^ 居余馬,《線性代數》第2-5頁
^ 張賢科,《高等代數學》,第38頁
^ (英文) M.R. Adhikari. Text book of linear algebra: an introduction to modern algebra . Allied Publishers Pvt Ltd. 2004. ISBN 978-8-177-64591-0 . ,第461頁
^ 張賢科,《高等代數學》,第33頁
^ 7.0 7.1 Harold,頁34
^ 8.0 8.1 Harold,頁35
^ 9.0 9.1 9.2 張賢科,《高等代數學》,第40頁
^ 10.0 10.1 10.2 10.3 10.4 (中文) 項武義. 基礎代數學. 人民教育出版社. 2004. ISBN 7-107-17679-X . ,第92頁。
^ 項武義. 基礎代數學. 人民教育出版社. 2004. ISBN 7-107-17679-X .
^ Harold,頁36
^ Gilbert Strang, Linear algebra and its applications ,第234頁
^ 張賢科,《高等代數學》,第283頁
^ werner,第136-140頁
^ (英文) Gilbert Strang. Linear Algebra and its applications , 3rd Edition. Brookes/Cole Thomson Learning. 2006. ISBN 0-15-551005-3 . ,第234-235頁
^ 17.0 17.1 Werner,頁132
^ (法文) Robert COQUEREAU. Espaces fibrés et Connexions . 2002 [2009-12-12 ] . (原始內容 存檔於2010-03-09).
^ 項武義,《基礎代數學》,第92-93頁
^ 20.0 20.1 Werner,頁102
^ 張賢科,《高等代數學》,頁43-46
^ Steven Roman, Advanced Linear Algebra ,第387-388頁
^ Werner,頁109
^ 24.0 24.1 Steven Roman, Advanced Linear Algebra ,第405-406頁
^ 25.0 25.1 Werner,頁104
^ 胡冠章,王殿軍,《應用近世代數》,第47頁
^ 居余馬,《線性代數》,第7-10頁
^ 28.0 28.1 (英文) F. R. Gantmacher. The theory of matrices. Dover Publications. 2005. ISBN 978-0486445540 . ,第67-68頁
^ Paul Moritz Cohn. Further algebra and applications. Springer. 2003. ISBN 978-1-852-33667-7 .
^ (英文) A theory of noncommutative determinants and characteristic functions of graphs (PDF) . Functional Analysis and Its Applications (Springer New York). doi:10.1007/BF01075044 . [永久失效連結 ]
^ 31.0 31.1 31.2 31.3 31.4 31.5 31.6 居余馬,《線性代數》,第7-11頁
^ Steven Roman, Advanced Linear Algebra ,第405-406頁
^ 項武義,《基礎代數學》,第89頁
^ (英文) The Cauchy-Binet Formula (PDF) . [2010-05-19 ] . (原始內容 (PDF) 存檔於2019-03-04).
^ 居余馬,《線性代數》,頁65
^ (英文) Gabe Cunningham. The General Linear Group (PDF) . [2010-05-19 ] . (原始內容存檔 (PDF) 於2021-05-03).
^ 這是由於行列式按照定義可以看成關於矩陣係數的多項式。另一方面,若干個複數乘積或和的共軛等於其共軛的乘積或和。從而當每個係數都取共軛後,行列式這個多項式的值也變成原來的共軛。
^ 38.0 38.1 (英文) N.丹佛,J.T.施瓦茨. 《线性算子》第一章:一般理论. Interscience. 1958: 39–40.
^ Gilbert Strang, Linear Algebra and its applications ,第236-237頁
^ (英文) Mike Brookes. The Matrix Reference Manual . Imperial College. [2010-02-02 ] . (原始內容 存檔於2008-01-13).
^ (英文) Horn, Roger A.; Johnson, Charles R., Topics in Matrix Analysis, Cambridge University Press , 1991, ISBN 978-0-521-46713-1 ,第439頁
^ 42.0 42.1 42.2 居余馬,《線性代數》,頁3-5
^ 張賢科,《高等代數學》,頁47-48
^ (英文) Erich Kaltofen、Gilles Villard. On the complexity of computing determinants (PDF) . Computational Complexity. doi:10.1007/s00037-004-0185-3 . [永久失效連結 ]
^ (英文) Villard, Gilles, Exact computation of the determinant and of the inverse of a matrix (PDF) , CNRS - LIP ENS Lyon, INRIA, 2002 [2010-02-03 ] , (原始內容 (PDF) 存檔於2008-07-04)
^ (英文) Joel N. Franklin. Matrix Theory . Dover Publications. 2000. ISBN 978-0486411798 . ,第23-24頁
^ (英文) John O'Connor. The linear groups . [2010-05-20 ] . (原始內容存檔 於2021-01-08).
^ (英文) Lawrence Conlon. Differentiable manifolds, 2nd edition. Birkhäuser Boston;. 2001. ISBN 978-0817641344 .
^ (英文) Rajendra Bhatia, Tanvi Jai. Higher order derivatives and perturbation Bounds for determinants (PDF) . Indian Statistical Institute, Delhi Centre. [2010-05-20 ] . (原始內容存檔 (PDF) 於2021-01-23).
^ (中文) 張賢達. 矩阵分析与应用. 清華大學出版社. 2008. ISBN 9787302092711 . ,第272頁
^ (英文) Vladimir G. Ivancevic,Tijana T. Ivancevic. Applied differential geometry: a modern introduction. World Scientific Publishing Company. 2007. ISBN 978-9812706140 .
^ 張賢科,《高等代數學》,第311-319頁
^ 53.0 53.1 (英文) Joesph J.Rotman. Advanced Modern Algebra . Prentice Hall. 2002. ISBN 978-0-130-87868-7 . ,第747-760頁
^ (德文) E Knobloch, Determinants , in I Grattan-Guinness (ed.), Companion Encyclopedia of the History and Philosophy of the Mathematical Sciences (London, 1994), 766-774.
^ 55.0 55.1 55.2 55.3 55.4 55.5 (英文) J J O'Connor、E F Robertson. Matrices and determinants . [2009-12-10 ] . (原始內容 存檔於2008-07-25).
^ (中文) 曹亮吉. 關孝和 . 科學月刊第十八卷第二、第三期. [2009-12-10 ] . (原始內容存檔 於2021-04-27).
^ (德文) 萊布尼茲,《萊布尼茲數學文獻》(Leibnizens mathematische Schriften ), A. Asher,第二卷,頁229-245
^ (中文) 行列式 . 香港教育發展組教育資訊站. [2009-12-10 ] . (原始內容 存檔於2010-01-04).
^ (德文) E. Knobloch, Der Beginn der Determinantentheorie, Leibnizens nachgelassene Studien zum Determinantenkalkül (Hildesheim, 1980)
^ (英文) C. B. Boyer, A History of Mathematics (John Wiley, 1968)
^ (法文) 加布里爾·克拉默 Introduction à l'analyse des lignes courbes algébraique 1750
^ (德文) M. Cantor, Geschichte der Mathematik (Teubner, 1913)
^ (法文) 艾蒂安·裴蜀 Recherches sur le degré des équations résultantes de l』évanouissement des inconnues, et sur le moyens qu’il convient d』employer pour trouver ces équations , Mém. Acad. Roy. Sci Paris, 1764, pp 288–338
^ (法文) 亞歷山德·西奧菲勒·范德蒙德 Mémoire sur l』élimination, Hist. de l』Acad. Roy. des Sciences Paris 1772, 2e partie, pp 516-532
^ (法文) 拉格朗日 Nouvelle solution du problème du mouvement de rotation d』un corps de figure quelconque qui n』est animé par aucune force accélératrice Nouveaux mémoires de l』Académie royale des sciences et des belles-lettres de Berlin, 1773
^ 66.0 66.1 《古今數學思想》第三卷,第198頁
^ (法文) Mémoire sur les fonctions qui ne peuvent obtenir que deux valeurs égales et des signes contraires par suite des transpositions opérées entre les variables qu'elles renferment . Journal de l'Ecole Polytechnique (l'Ecole Royale Polytechnique). 1815年10月: 29–112 [2009-12-10 ] . (原始內容存檔 於2020-06-11).
^ 《古今數學思想》第三卷,208-209頁
^ 《古今數學思想》第三卷,第207頁
^ (德文) Monatsberichte der Berliner Akademie. 1858年1月: 207–220.
^ (德文) Monatsberichte der Berliner Akademie. 1868年1月: 310–338.
^ (中文) 雅可比行列式 . [2009-12-10 ] . (原始內容 存檔於2016-03-04).
^ 《古今數學思想》第三卷,第200頁
^ (德文) De determinantibus Functionalibus 22 . Paul Stäckel. 1841.
^ 《古今數學思想》第二卷,第361頁
^ (中文) 盧剛. 线性代数与解析几何. 高等教育出版社. 2005. ISBN 978-7-040-13651-7 .
^ 居余馬,《線性代數》,頁213-214.
^ (中文) 王東明,夏壁燦. 计算机代数. 清華大學出版社. 2004. ISBN 978-7-302-15919-3 .
^ (英文) Matheus Grasselli,Dmitry Pelinovsky. Numerical mathematics . Jones & Bartlett. 2008. ISBN 978-0-763-73767-2 . 第247頁.
^ 80.0 80.1 80.2 80.3 (英文) Andy R. Magid. Lectures on differential Galois theory. American Mathematical Society. 1994. ISBN 978-0821870044 . ,第15-17頁
^ (中文) 王高雄,周之銘,朱思銘,王壽松. 常微分方程. 高等教育出版社. 2006. ISBN 978-7-040-19366-4 .
^ (中文) 清華大學數學科學系《微積分》編寫組. 《微积分》. 清華大學出版社. 2004. ISBN 978-7-302-06004-8 . ,第112-115頁
^ (中文) 齊民友. 《重温微积分》. 高等教育出版社. 2004. ISBN 7-040-12931-0 . 第79-85頁
^ (中文) 李慶揚,莫孜中,祁力群. 《非线性方程组的数值解法》. 科學出版社. 1999. ISBN 7-030-02846-5 .
^ (中文) 武際可滕寧鈎袁勇. 分叉问题及其计算方法 (PDF) . 力學與實踐. 1987, 第4期 . [永久失效連結 ]
書籍