Théorème de Cramér

En mathématiques et plus particulièrement en théorie des probabilités, le théorème de Cramér^[1] (du mathématicien Harald Cramér) donne une estimation de la probabilité qu'une marche aléatoire S_n dépasse des valeurs de l'ordre de n.

Ce théorème est un exemple du principe de grandes déviations appliqué à des sommes i.i.d de variables aléatoires.

Enoncés

Enoncé simple

Soit $X,X_{1},X_{2},\dots$ des variables aléatoires indépendantes et identiquement distribuées (i.i.d). Notons $K$ la fonction génératrice des cumulants de $X$ , c'est-à-dire :

K(t)=\ln \mathbb {E} [e^{tX}]\in \mathbb {R} \cup \{+\infty \}~~~\forall t\in \mathbb {R}

On note également $K^{*}$ la transformée de Legendre de $K$ , c'est-à-dire :

K^{*}(x)=\sup _{t\in \mathbb {R} }\,\{tx-K(t)\}~~~\forall x\in \mathbb {R}

On dit aussi que $K^{*}$ est la transformée de Cramér de $X$ . Enfin on note $S_{n}=X_{1}+\dots +X_{n}~\forall n\geq 1$ . Le théorème de Cramér énonce alors la chose suivante^[2] :

Théorème de Cramér (1938) — Si $K(t)<\infty$ pour tout $t\in \mathbb {R}$ alors pour tout $x>\mathbb {E} [X]$ on a

{\frac {1}{n}}\ln \mathbb {P} (S_{n}\geq nx)~{\xrightarrow[{n\to \infty }]{}}-K^{*}(x)

En fait sous les hypothèses du théorème on a que pour tout $x\in \mathbb {R}$ :

{\frac {1}{n}}\ln \mathbb {P} (S_{n}\geq nx)~{\xrightarrow[{n\to \infty }]{}}-\inf _{y\geq x}K^{*}(y)=\left\{{\begin{array}{ll}-K^{*}(x)&{\text{ si }}x>\mathbb {E} [X]\\0&{\text{ sinon}}\end{array}}\right.

Cela vient du fait que la transformée de Cramér $K^{*}$ de $X$ est positive, nulle en la moyenne $x=\mathbb {E} [X]$ , décroissante avant la moyenne et croissante après.

Sous les hypothèses du théorème on a que $K^{*}$ est une bonne fonction de taux convexe.

Enoncé en termes de principe de grandes déviations

Le théorème de Cramér peut s'énoncer dans le cadre plus général du principe de grandes déviations^[2]. Notons $\mu _{n}$ la loi de ${\frac {S_{n}}{n}}$ .

Théorème — Si $K(t)<\infty$ pour tout $t\in \mathbb {R}$ alors $\left(\mu _{n}\right)$ satisfait un principe de grande déviation avec pour taux la fonction $K^{*}$ .

Plus précisément, cet énoncé signifie que si $K(t)<\infty$ pour tout $t\in \mathbb {R}$ alors les deux propriétés suivantes sont vérifiées :

Pour tout ouvert $U\subset \mathbb {R}$ , $\liminf _{n\to \infty }{\frac {1}{n}}\ln \mathbb {P} \left({\frac {S_{n}}{n}}\in U\right)\geq -\inf _{U}K^{*}$ .
Pour tout fermé $F\subset \mathbb {R}$ , $\limsup _{n\to \infty }{\frac {1}{n}}\ln \mathbb {P} \left({\frac {S_{n}}{n}}\in F\right)\leq -\inf _{F}K^{*}$ .

Où l'on considère par convention que $\ln(0)=-\infty$ .

Généralisations

Affaiblissement des conditions de finitude

Le théorème de Cramér (son énoncé simple ainsi que son énoncé en termes de principe de grandes déviations) reste vrai même en retirant la condition de finitude sur la fonction génératrice des cumulants $K$ ^[3]. Le théorème peut donc être vrai même si $X$ n'admet pas d'espérance finie.

A noter que si $K(t)=+\infty$ pour tout $t\neq 0$ alors $K^{*}\equiv 0$ . Dans ce cas l'inégalité de la limite supérieure pour tout fermé est triviale.

Sans l'hypothèse de finitude, $K^{*}$ n'est plus qu'une fonction de taux convexe (elle n'est plus forcément bonne).

Pour des variables à valeurs dans un espace vectoriel de dimension finie

Il est possible de généraliser le théorème de Cramér lorsque $X,X_{1},X_{2},\dots$ sont i.i.d à valeurs dans $\mathbb {R} ^{d}$ et non plus dans $\mathbb {R}$ comme précédemment. Dans ce cas il faut généraliser la définition de $K$ . Plus précisément on considère

K(t)=\ln \mathbb {E} [e^{\langle t,X\rangle }]\in \mathbb {R} \cup \{+\infty \}~~~\forall t\in \mathbb {R} ^{d}

ainsi que

K^{*}(x)=\sup _{t\in \mathbb {R} ^{d}}\,\{\langle t,x\rangle -K(t)\}~~~\forall x\in \mathbb {R} ^{d}

où $\langle \cdot ,\cdot \rangle$ désigne le produit scalaire canonique sur $\mathbb {R} ^{d}$ . Dans ce cadre plus général la fonction $K^{*}$ est appelée la transformée de Legendre-Fenchel de $K$ . Notons enfin $D_{K}$ l'ensemble des points $t\in \mathbb {R} ^{d}$ où $K$ est fini et $D_{K}^{\mathrm {o} }$ son intérieur. On a alors le théorème suivant^[3]

Théorème — Si $0\in D_{K}^{\mathrm {o} }$ alors $\left(\mu _{n}\right)$ satisfait un principe de grande déviation avec pour taux la fonction $K^{*}$ .

Sous ces hypothèses la fonction $K^{*}$ est une bonne fonction de taux convexe.

Même sans l'hypothèse du théorème, à savoir $0\in D_{K}^{\mathrm {o} }$ , il est toujours vrai que pour tout $U\subset \mathbb {R} ^{d}$ ouvert convexe :

{\frac {1}{n}}\ln \mathbb {P} \left({\frac {S_{n}}{n}}\in U\right)~{\xrightarrow[{n\to \infty }]{}}-\inf _{U}K^{*}

Pour des variables dépendantes

Le théorème de Gärtner-Ellis permet de généraliser les résultats pour des variables dépendantes vérifiant certaines hypothèses^[3]. En fait le théorème de Gärtner-Ellis s'inscrit dans le cadre d'une suite de variables aléatoires $(S_{n})_{n\geq 1}$ à valeurs dans $\mathbb {R} ^{d}$ qui ne s'interprète pas forcément comme une marche aléatoire.

Références

↑ H Cramér, « Sur un nouveau théorème-limite de la théorie des probabilités », Actual Sci Ind. Colloque consacré à la théorie des probabilités, vol. 763,‎ 1938, p. 5-23
↑ ^{a et b} (en) Achim Klenke, Probability Theory—A Comprehensive Course, London, Springer, 2008 (ISBN 978-1-84800-047-6, DOI 10.1007/978-1-84800-048-3), p. 521
↑ ^{a b et c} (en) A Dembo et O Zeitouni, Large deviations techniques and applications, vol. 38, New York, Springer, coll. « Applications of mathematics », 2^e éd. (lire en ligne)