アダマールの不等式のメモ

 アダマールの不等式 ; \boldsymbol a_iAの各列ベクトルとして

\begin{aligned} \det A \le \prod_{i=1}^{n}\|\boldsymbol a_i\|\end{aligned}

なるものがあります。知られてる証明はテクニカルなことして相加相乗平均でテクニカルなことするテクニカルなやつです。

 ただQR分解考えたらそれはそうというお気持ちになりました。シュミットの直交化でQR分解を構成するわけですが直角三角形の斜辺は残りの辺以上であることに注意するとアダマールの不等式はわりと自明です。というか等号成立条件から逆算したらQR分解考えるのは自然すぎる。というメモでした。

微分で行列式を求める!

 ぼーっとしてたら思いついたことを書きます。次のような行列の行列式を求めよ、なんて問題はその辺の線形代数の教科書に載ってたりします。A_nは対角成分が1, 非対角成分が3, サイズnの行列です。

\begin{aligned} A_n= \begin{pmatrix}1 & 3 & 3 & \cdots & 3\\ 3 & 1 & 3 & \ddots & \vdots\\ 3 & 3 & 1 & \ddots & 3\\ \vdots & \ddots & \ddots & \ddots & 3\\ 3 & \cdots & 3 & 3 & 1 \end{pmatrix}\end{aligned}

 教科書に載ってるぐらいなので別に難しくありません。行・列基本変形を少し行うだけで簡単に求まります。が、気持ち悪い別解を思いついたので紹介しようという魂胆です。

 

 以下のようなxについての関数f_{n}(x)を定義します。aは定数だとしましょう。

\begin{aligned} f_{n}(x)= \begin{vmatrix}x & a & a & \cdots & a\\ a & x & a & \ddots & \vdots\\ a & a & x & \ddots & a\\ \vdots & \ddots & \ddots & \ddots & a\\ a & \cdots & a & a & x \end{vmatrix}\end{aligned}

先のA_n行列式a=3のときのf_{n}(1)として求まるのでf_{n}(x)の正体が分かってしまえば勝ちです。

 

さて、f_{n}(x)をどうやって求めましょうか...タイトルでネタバレしてるんですよね()。というわけで微分してみまーす。行列式微分は各列を微分したときの行列式たちの和で書けます。

\begin{aligned} \frac{\mathrm d}{\mathrm d x}f_{n}(x)&= \frac{\mathrm d}{\mathrm d x}\begin{vmatrix}x & a & a & \cdots & a\\ a & x & a & \ddots & \vdots\\ a & a & x & \ddots & a\\ \vdots & \ddots & \ddots & \ddots & a\\ a & \cdots & a & a & x \end{vmatrix}\\[8pt] &= \begin{vmatrix}1 & a & a & \cdots & a\\ 0 & x & a & \ddots & \vdots\\ 0 & a & x & \ddots & a\\ \vdots & \ddots & \ddots & \ddots & a\\ 0 & \cdots & a & a & x \end{vmatrix}+\begin{vmatrix}x & 0 & a & \cdots & a\\ a & 1 & a & \ddots & \vdots\\ a & 0 & x & \ddots & a\\ \vdots & \ddots & \ddots & \ddots & a\\ a & \cdots & a & a & x \end{vmatrix}+\\ &\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots + \begin{vmatrix}x & a & a & \cdots & 0\\ a & x & a & \ddots & \vdots\\ a & a & x & \ddots & 0\\ \vdots & \ddots & \ddots & \ddots & 0\\ a & \cdots & a & a & 1 \end{vmatrix}\\ &= n\begin{vmatrix}x & a & a & \cdots & a\\ a & x & a & \ddots & \vdots\\ a & a & x & \ddots & a\\ \vdots & \ddots & \ddots & \ddots & a\\ a & \cdots & a & a & x \end{vmatrix} \ \ \ \ (\leftarrow \text{サイズは}n-1)\\[8pt] & = nf_{n-1}(x)\end{aligned}

 はい、長い旅でしたがこれでf_{n}(x)についての関係式が得られました。

\begin{aligned} \frac{\mathrm d}{\mathrm d x}f_{n}(x)= nf_{n-1}(x)\end{aligned}

とりあえず f_n(x)は順番に積分していけば求まりそうです。ただ積分定数よく分からんし〜〜〜ということでもう少し詰めていきましょう。一旦落ち着こうってやつです。

 まず f_n(x)はその定義からxについてのn次式です。また全成分が等しい行列の行列式0なのでf_n(a)=0です。よって,f_n(x)(x-a)^{i}\ (1\le i \le n)たちの線形結合で書けます。さらにn=2のときは簡単に計算できて

\begin{aligned} f_2(x)&= \begin{vmatrix}x &a \\ a&x \end{vmatrix}\\&=x^2-a^2\\&=(x-a)^{2} + 2a(x-a)\end{aligned}

となります。以上の話をまとめると、

\begin{aligned} &・\frac{\mathrm d}{\mathrm d x}f_{n}(x)= nf_{n-1}(x)\\ &・f_{2}(x)=(x-a)^{2} + 2a(x-a)\\&・ f_n(x) は (x-a)で割り切れる\end{aligned}

 ここまでくればf_n(x)を出すのは簡単です。実際、

\begin{aligned} f_{3}(x) &= 3\int f_{2}(x) \mathrm d x \\ &= 3\int \{(x-a)^{2} + 2a(x-a)\} \mathrm d x\\ &= (x-a)^{3} + 3a(x-a)^2\end{aligned}
\begin{aligned} f_{4}(x) &= 4\int f_{3}(x) \mathrm d x \\ &= 4\int \{(x-a)^{3} + 3a(x-a)^2\} \mathrm d x\\ &= (x-a)^{4} + 4a(x-a)^3 \\&\vdots \end{aligned}

 

と順番に求まり、一般に

\begin{aligned} f_{n}(x) = (x-a)^{n} + na(x-a)^{n-1}\end{aligned}

であることがわかります。よって、冒頭に出てきたA_nについて、

\begin{aligned} \det A_n = (1-3)^{n} + 3n(1-3)^{n-1}=(3n-2)(-2)^{n-1}\end{aligned}

であることが分かりました。

BCとCBの固有値の関係

 「特異値分解」ってネットで調べると証明っぽいものが出てきたりします。ぽいものが。その中でありがちな議論は「A^{{\rm T}}A固有値AA^{{\rm T}}固有値でもある」、また「AA^{{\rm T}}固有値A^{{\rm T}}A固有値でもある」ので「AA^{{\rm T}}A^{{\rm T}}A固有値は一致する」みたいなやつです。

 え、重複度について何も議論してなくない??????というわけでそのあたりについて適当に勉強したことを適当に紹介します。特異値分解の証明はいろいろありますが日本語でヒットするものは高確率でガバい気がします。線形代数、そんな簡単ではなさそう。

 

 話がそれたので戻ります。B\in\mathbb R^{n\times m}およびC\in\mathbb R^{m\times n} \ (m\le n) に対して以下が成り立ちます。

\begin{aligned}p_{BC}(t) = t^{n-m}p_{CB}(t)\end{aligned}

ここでp_A(t)Aの固有多項式を表しました。この式からBCCB固有値は重複度を含めて一致することがわかります。(サイズ的に足りない分は0で埋める。)

 証明は(読むのは)とっても簡単で

\begin{aligned}  \left[ \begin{array} { c c } { C B } & { 0 } \\ { B } & { 0 _ { n } } \end{array} \right] \end{aligned}

\begin{aligned}  \left[ \begin{array} { c c } { 0 _ { m } } & { 0 } \\ { B } & { B C } \end{array} \right] \end{aligned}

が実は相似になっていることを示しておしまいです。

 

 この定理を使えば一番上で話した特異値分解の説明も厳密にできます。他にも応用例があって、コーシーの恒等式

\begin{aligned} \operatorname { det } \left( A + x y ^ { {\rm T} } \right) = \operatorname { det } A + y ^ { {\rm T} } ( \operatorname { adj } A ) x \end{aligned}

を示すことができたり,ij成分がi+jで与えられる行列の固有値を求めることができます。

ヒルベルト行列の正定値性

 任意の0でない多項式f(x)=a_{n}x^{n-1} + a_{n-1}x^{n-2} + \cdots +a_{2}x+a_1に対して,

\begin{aligned} \int_{0}^{1} f(x)^2 {\rm d} x \gt 0\end{aligned}

 ここまでは当たり前体操です。この左辺を変形すると

\begin{aligned} \int_{0}^{1} f(x)^2 {\rm d} x &= \int_{0}^{1} \left(\sum_{i=1}^{n}\sum_{j=1}^{n} a_{i}a_{j} x^{i-1}x^{j-1} \right) {\rm d} x \\ &= \sum_{i=1}^{n}\sum_{j=1}^{n} a_{i}a_{j} \int_{0}^{1} x^{i+j-2} \, {\rm d} x \\ &= \sum_{i=1}^{n}\sum_{j=1}^{n} \frac{a_{i}a_{j}}{i+j-1}\end{aligned}

 よって,以下のように第ij成分が\frac{1}{i+j-1}で与えられるHを用意すれば,

\begin{aligned} H= \begin{pmatrix}1 & \frac{1}{2} & \frac{1}{3} & \cdots & \frac{1}{n}\\ \frac{1}{2} & \frac{1}{3} & \frac{1}{4} & \ddots & \vdots\\ \frac{1}{3} & \frac{1}{4} & \ddots & \ddots & \vdots\\ \vdots & \ddots & \ddots & \ddots & \frac{1}{2n-2}\\ \frac{1}{n} & \cdots & \cdots & \frac{1}{2n-2} & \frac{1}{2n-1} \end{pmatrix}\end{aligned}

任意の {\boldsymbol a}=(a_1, a_2, \dots, a_n)^{{\rm T}} \neq {\boldsymbol 0}について,

\begin{aligned} {\boldsymbol a}^{{\rm T}} H {\boldsymbol a} \gt 0\end{aligned}

です。これで先のように定義した行列Hは正定値であることが分かりました。実はHには名前がついていてヒルベルト行列と言います。

 

 こっから先は真面目に計算はしていない妄想です。今回はf(x)の表現の基底として1,x,\dots,x^{n-1}をとったため,Hに対する二次形式が登場しました。同様の議論でf(x)の表現の基底としてルジャンドル多項式(厳密には区間をアフィン変換したやつ)を持ってくれば対角行列に対する二次形式が登場することがわかります。つまり,それらの基底の変換行列を Sとおけば

\begin{aligned} S^{{\rm T}} H S = D : 対角行列 \end{aligned}

と、対角化っぽいことができます。ルジャンドル多項式はよく調べられているので Sは簡単に求まり,上の表式からH逆行列も求まりそうです。詳しくは知りません(無責任)。とりあえず久保くんさんの試合を観ます。

とあるrank 等式の証明

 一般化逆行列の説明でCが列フルランクだったらC^{\rm T}Cは正則みたいな話を見てほんまか?ってなったのでメモです。一般に任意の行列Aについて以下が成り立ちます。

\begin{aligned} {\rm rank}\ A^{\rm T}A = {\rm rank}\ A\end{aligned}
 
 

(証明)

\begin{aligned} Ax=0 &\Rightarrow A^{\rm T}Ax =0\end{aligned}
\begin{aligned} A^{\rm T}Ax =0 &\Rightarrow (Ax)^{\rm T}Ax=0\\&\Rightarrow Ax=0\end{aligned}

より,\ker A^{\rm T}A = \ker Aが従います。次元定理から{\rm rank}\ A^{\rm T}A = {\rm rank}Aも分かります。

 

 標準形とかでごちゃごちゃやってもできるかもしれないですがわりと綺麗に示せました。

 例えば行階数と列階数が等しいとか、自明っぽい話でもいざ証明しようとなると難しいものです。

 

恒等式の使い方

 中1とかにするとウケる話をします。手品みたいなものです。

 

 突然ですが2桁の整数を3つ思い浮かべてください。思い浮かべたのは 37, 41, 66 ですね。(えー、そういう体でしばらく付き合ってください。これ当たってたらそれはもう手品を超えたなにかです。) 

それに対して僕は 72, 35, 31, 6 という4つの整数を返します。「は?」と言うあなた、普通の反応です。「3つの整数に対して4つの整数返してくるのは失礼では?」というあなた、なんかごめんなさい...

 冗談はさておき実は下の式が成り立ちます。確認してみてください。

\begin{aligned}37+41+66 &= 72+35+31+6\\37^{2}+41^{2}+66^{2} &= 72^{2}+35^{2}+31^{2}+6^{2}\end{aligned}

...!?!?!?。すごくないですか?

  

 他の例でも見てみましょう。あなたが 45, 50, 73 と言えば僕は 84, 39, 34, 11 を返します。先と同じように 

\begin{aligned}45+50+73 &= 84+39+34+11\\45^{2}+50^{2}+73^{2} &= 84^{2}+39^{2}+34^{2}+11^{2}\end{aligned}

が成り立ちます。 

 以下ネタばらしです。考えたい人はまだ見ないでください。上の2つの例を眺めているとなんとなくカラクリは分かるかもしれません。

 

 

 

 

 

 

 

\begin{aligned} (x+y)+(y+z)+(z+x) &= (x+y+z)+x+y+z\\(x+y)^{2}+(y+z)^{2}+(z+x)^{2} &= (x+y+z)^{2}+x^{2}+y^{2}+z^{2}\end{aligned}

 以上です。この式をじっと眺めていれば何をやっていたか分かるでしょう。恒等式、神々しい......

 Q.最後のそれは洒落のつもりですか?

 A.はい

log 2 の近似

 本日三度目の投稿です。暇なので。

 

 唐突ですが\log 2(以下底は自然対数とします)の値が必要になったことありませんか???僕は、ないです。が、中2のときに同級生にしたらほ〜〜んって言われた面白い話を書きます。

 

  \log (1+x)マクローリン展開は有名ですね。 \dfrac{1}{1+x}=1-x+x^{2}-x^{3}+\cdots積分する感じで

 \log (1+x)= x-\dfrac{x^{2}}{2}+\dfrac{x^{3}}{3}-\dfrac{x^{4}}{4}+\cdots

  x=1を代入して(収束の話はググってください、最近ググれば全部わかるという噂をよく聞くし)

 \log 2= 1-\dfrac{1}{2}+\dfrac{1}{3}-\dfrac{1}{4}+\cdots

この式自体、あるいはこの式の右辺の収束がまあそれは遅いということはよく知られています。

 もっと収束の速い式を作ってみましょう。先のマクローリン展開およびそこでx-xに置き換えたものを並べると、

\begin{aligned}\log(1+x)&= x-\dfrac{x^{2}}{2}+\dfrac{x^{3}}{3}-\dfrac{x^{4}}{4}+\cdots\\ \log(1-x)&= -x-\dfrac{x^{2}}{2}-\dfrac{x^{3}}{3}-\dfrac{x^{4}}{4}+\cdots\end{aligned}

 辺々引き算して

\begin{aligned}\log\left(\dfrac{1+x}{1-x}\right)= 2\left(x+\dfrac{x^{3}}{3}+\dfrac{x^{5}}{5}+\cdots\right)\end{aligned}

  x=\dfrac{1}{3}を代入すると...

\begin{aligned}\log 2= 2\left(\dfrac{1}{3}+\dfrac{1}{3\cdot 3^{3}}+\dfrac{1}{5\cdot 3^{5}}+\cdots\right)\end{aligned}

 

 「...!!!この右辺の収束普通に早くない?え、ちょっと式いじっただけじゃん!?!?すごい!!!」という反応をしてください、ほ〜〜んとか言わないの。

 

 とにかく簡単な式変形で有意義なことができました。一般に

\begin{aligned}f:[0,1)\rightarrow [1,\infty), \ \ f(x)=\dfrac{1+x}{1-x}\end{aligned}

全単射になるので,任意のt\ge 1に対して,x=f^{-1}(t)とすれば0\le x\lt 1

で、

\begin{aligned}\log t= 2\left(x+\dfrac{x^{3}}{3}+\dfrac{x^{5}}{5}+\cdots\right)\end{aligned}

と割と収束が早い感じに計算できます。