La triple norme d’une matrice : matrix_norm et l1norm, l2norm ou norm ou specnorm, linfnorm

6.49.4 La triple norme d’une matrice : `matrix_norm` et `l1norm`, `l2norm` ou `norm` ou `specnorm`, `linfnorm`

matrix_norm a deux arguments : une matrice A et 1 ou 2 ou inf et par défaut 1.
matrix_norm renvoie la triple norme subordonnée à l₁ (resp l₂ ou l^∞) si il n’y a pas de second argument ou si le second argument est 1 (resp 2 ou inf).
matrix_norm(A) ou matrix_norm(A,1) c’est aussi l1norm(A) ou colnorm(A),
matrix_norm(A,2) c’est aussi l2norm(A) ou SPECNORM(A) ou max(SVL(A)),
matrix_norm(A,inf) c’est aussi linfnorm(A) ou rownorm(A).
Pour les différentes normes de vecteurs (voir aussi 6.42.1, 6.42.1 et 6.42.1).
Pour plus de détails sur la triple norme voir le Rappel situé après les exemples.
On tape :

B:=[[1,2,3],[3,-9,6],[4,5,6]]

Puis

matrix_norm(B)

matrix_norm(B,1)

l1norm(B)

colnorm(B)

On obtient :

16

En effet max(1+3+4,2+9+5,3+6+6)=16
On tape :

matrix_norm(B,2)

l2norm(B)

SPECNORM(B)

max(SVL(B))

On obtient :

11.2449175989

En effet max(SVL(B)) renvoie la plus grande racine carrée des valeurs propres de trn(B)*B.
sqrt(proot(pcar(trn(B)*B))) ou sqrt(EIGENVAL(trn(B)*B)) renvoie :
[9.48552308331,0.759394515579,11.2449175989]
On tape :

matrix_norm(B,inf)

linfnorm(B)

rownorm(B)

On obtient :

18

En effet max(1+2+3,3+9+6,4+5+6)=18
Rappel
En mathématiques, et plus particulièrement en analyse fonctionnelle, une norme d’opérateur ou norme subordonnée est une norme définie sur l’espace des opérateurs bornés entre deux espaces vectoriels normés. Entre deux tels espaces, les opérateurs bornés ne sont autres que les applications linéaires continues.
On va considérer ici que les applications linéaires sur des espaces vectoriels de dimension finie.
Théorème
Soient E et F 2 espaces vectoriels normés (de norme || ||_E et || ||_F) de dimension finie et f une application linéaire de E dans F.
Alors il existe une constante réelle K tel que pour tout x∈ E on ait :
|| f(x)||_F≤ K|| x||_E
f est donc lipschitzienne sur E et continue de E dans F.
Définition de la triple norme
D’après ce qui précéde, on a :
pour tout x∈ E si || x||_E≤ 1 alors on a || f(x)||_F≤ K.
Donc l’ensemble {|| f(x)||_F pour || x||_E≤ 1} est une partie non vide et majorée de ℝ. Cet ensemble admet donc une borne supérieure que l’on appelle la triple norme.
Ainsi

|||f ||| =

sup

|| x||_E≤ 1

|| f(x)||_F

Attention La valeur de ||| f ||| dépend des normes || ||_E et || ||_F utilisées.
la triple norme est donc une norme subordonnée aux normes de E et F.
Dans le cas où E = F, on choisit usuellement || ||_E=|| ||_F (même si ce n’est pas obligatoire).
Pour les normes usuelles, on dispose de formules pratiques : prenons E = ℝⁿ et f∈ L(E). Notons x=(x₁,... ,x_n) un vecteur quelconque de ℝⁿ et A=(a_jk) la matrice de f dans la base canonique. On a alors :

Si ||x||_E=max_{0≤ j≤ n−1}|x_j| (c’est la norme l^∞), alors la norme de f vaut :

max

0≤ j≤ n−1

∑

0≤ k≤ n−1

|a_jk|

C’est ce qui est défini dans Xcas par rownorm(A)
Si ||x||_E=∑_{1≤ i≤ n}|x_i| (c’est la norme l₁), alors la norme de f vaut :

max

0≤ k≤ n−1

∑

0≤ j≤ n−1

|a_jk|

C’est ce qui est noté dans Xcas : colnorm(A)
Si ||x||_E=√∑_{0≤ j≤ n−1}x_j² (c’est la norme l₂ ou euclidienne, associée au produit scalaire canonique), alors la norme triple de f est la racine carrée de la plus grande valeur propre de f^*∘ f, où f^* désigne l’adjoint de f.
La norme triple de f est donc sa plus grande valeur singulière. Ceci se généralise en remplaçant ℝⁿ par n’importe quel espace de Hilbert.
C’est ce qui est noté dans Xcas : max(SVL(A)) : c’est la plus grande valeur singulière de A i.e la plus grande valeur de la racine carrée des valeurs propres de trn(A)*A.
Pour tout endomorphisme symétrique g (en particulier pour g = f^*∘ f), la norme de g est égale à son rayon spectral, qui est la plus grande des valeurs absolues de ses valeurs propres.

Démonstration Soient E=Rⁿ et F=R^p munis de leur base canonique
Soit e₁..e_n est la base canonique de E
Soit a_j,k la matrice associée à f dans les bases canoniques de E et F.

Montrons que pour la norme l1norm, la triple norme de A nommée ici matrix_norm(A,1) c’est colnorm.
Soit x=∑_k(x_k*e_k)
On a donc :
l1norm(f(x))=l1norm(∑_kx_k*f(e_k))≤ ∑_k|x_k|*l1norm(f(e_k))
l1norm(f(x)) ≤ ∑_k|x_k|*max_k(l1norm(f(e_k)))=l1norm(x)*max_k(∑_j|a_j,k|)
donc
matrix_norm(A,1)<=colnorm(A)
Montrons que ce maximum est atteint.
Soit k₀ tel que :
max_k(∑_j|a_j,k|)=∑_j|a_j,k₀|=colnorm(A)
On a alors l1norm(e_k₀)=1 et l1norm(f(e_k₀))=∑_j|a_j,k₀|
donc matrix_norm(A,1)=colnorm(A).

Montrons que pour la norme du maximum la triple norme de A nommée ici matrix_norm(A,inf) c’est rownorm.
Soit x=∑_kx_k*e_k avec max_k(|x_k|)≤ 1
On a :
maxnorm(f(x))=maxnorm(∑_kx_k*f(e_k))=
maxnorm(f(x))=max_j(|∑_kx_k*ajk|)≤max_j(∑_k|x_k|*|a_j,k|) puisque max_k|x_k)≤ 1
maxnorm(f(x))≤ max_j(∑_k|a_j,k|)=colrow(A)
Montrons que ce maximum est atteint.
Soit j₀ tel que max_j(∑_k|a_j,k|)=∑_k|aj₀,k|=rownorm(A).
Soit x_O=∑_ksign(a_j₀,k)*e_k alors maxnorm(x₀)=1 et
maxnorm(f(x₀))=max_j(f(x₀))=max_j(|∑_ksign(a_j₀,k)*a_j,k|)=
max(∑_k|a_j₀,k|,max_j!=j₀(|∑_ksign(a_j₀,k)*a_j,k|))
si j!=j₀ on a :
|∑_ksign(a_j₀,k)*a_j,k)|≤ ∑_k|a_j,k|≤∑_k|a_j₀,k|
Donc
maxnorm(f(x₀))=∑_k|a_j₀,k|=rownorm(A)
Donc matrix_norm(A,inf)=rownorm(A).
Montrons que pour la norme l2norm, la triple norme de la matrice A nommée ici matrix_norm(A,2) c’est max(SVL(A)) c’est à dire la plus grande racine carrée des valeurs propres de trn(A)*A.
Soit x=∑_k(x_k*e_k)
On a :
l2norm(x)=sqrt(scalar_product(x,x))
0n note <x,x>=√∑_kx_k²=scalar_product(x,x)
l2norm(f(x))=sqrt(scalar_product(A*x,A*x))
On a : <Ax,Ax>=<x,(A)^tAx> donc
l2norm(f(x))=sqrt(scalar_product(x,trn(A)*A*x))
La matrice M=trn(A)*A est symétrique donc diagonalisable et ses valeurs propres λ_k sont réelles.
Il existe une matrice B diagonale et P une matrice de passage orthogonale (i.e. inv(P)=trn(P)) tels que :
B=tran(P)*M*P i.e. M=trn(A)*A=P*B*trn(P)
On a de plus :
Mv_k=λ_kv_k et
<Av_k,Av_k>=<v_k,Mv_k>=<v_k,λ_kv_k>=λ_k<v_k,v_k>_k
Comme <Av_k,Av_k>≥ 0 on en déduit que les λ_k sont positifs.
Donc l2norm(f(x))=sqrt(scalar_product(trn(P)*x,B*trn(P)*x))
Si y=trn(P)*x=(y₀...y_n−1) on a :
<y,y>=<x,P*trn(P)x>=<x,x>
B*y=∑_k λ_k*y_k et <y,B*y>=∑_k λ_k*y_k²
Donc :
l2norm(f(x))=√∑_k λ_k*y_k²
Or puisque λ_k>0 on a :
∑_k λ_k*y_k²≤ max_k(λ_k)∑_k y_k² et
√λ_k existe
et
√∑_k y_k²=<y,y>=<x,x>=√∑_k x_k²
Donc :
l2norm(f(x))≤ max_k(√λ_k)*√∑_k x_k²
Montrons que ce maximum est atteint.
Soit λ_m=max_k(λ_k) et v_m le vecteur propre associé.
On a alors :
l2norm(f(vm))= sqrt(scalar_product(A*vm,A*vm))
l2norm(f(vm))= √λ_m*<v_m,v_m>=√λ_m*l2norm(vm). Donc puisque √λ_m est la plus grande racine carrée des valeurs propres de trn(A)*A, on a :
√λ_m=max(SVL(A)).
Donc : matrix_norm(A,2)=max(SVL(A))

6.49.4 La triple norme d’une matrice : matrix_norm et l1norm, l2norm ou norm ou specnorm, linfnorm

6.49.4 La triple norme d’une matrice : `matrix_norm` et `l1norm`, `l2norm` ou `norm` ou `specnorm`, `linfnorm`