J
N
y.
"N
'\J
♦:^
f 1 1
^dk\
'^^
Digitized by the Internet Archive
in 2010 with funding from
University of Ottawa
littp://www.archive.org/details/ficalculdesprobaOOpoin
CALCUL DES PROBABILITÉS
COURS DE LA FACULTÉ DES SCIENCES DE PARIS
COURS DE PHYSIQUE MATHÉMATIQUE
CALCUL
DES
PROBABILITÉS
LEÇONS PROFESSÉES PENDANT LE DEUXIÈME SEMESTRE 1893-1894
PAH
H. POINCARÉ,
Membre de l'Institut,
RÉDIGÉES PAR
A. QUIQUET,
Ancien Elève de l'Ecole Normale supérieure.
fe
r
^/ DEPARTMENT OF MATHEMAT1C5
UNIVERSITY OF TORONTO
PARIS,
GAUTHIER-VILLARS, IMPRIMEUR-LIBRAIRE
DU Bl'REAC DES LONGITUDES. DE l'ÉCOLE POLYTECHNIQUE,
Quai des Grands-Augustin?, 55.
1896
(Tous droits réserrés.)
CALCUL DLS PROl] VIRILITÉS
PUEMIÈRE LEÇON
1. L'on ne peut guère donner une délinition satisfaisante
de la Prohabililé. On dit ordinairement : La probabilité d'un
événement est le rapport du nombre des cas favorables à cet
événement au nombre total des cas possibles.
Ainsi, si le premier nom!)re est n et le second N, la probabi-
lilé est -, ■. cette définition, dans certains cas, ne soulève
aucune dilViculté. — Dans un jeu de ^2 cartes, la probabilité de
4
tirer un roi est .— > puisque le nombre total des cas possibles,
c'est-à-dire des cartes, est 32, et que parmi ces caries il y a
quatre rois; on a donc ici X =^ 32, n =4. — Quand on jette
1
un dé, la probabilité d'amener le point 4 est -t car \ .-= 6
et /i = i, le dé ayant 6 faces dont une seule porte le pointa.
— Dans une urne qui contient n boules blanclies et p boules
noires, on tire une boule; la probabilité (pi'elle soit blanche
n
est '
2. Prenons un exemple un peu plus compliqui'. — Deux
CALCUL DES PROBABILITÉS. 1
2 CALCUL DES PROBABILITES
urnes, qui ne diffèrent pas extérieurement, renferment la
première n boules blanches etp noires, la seconde w' blanches
et p' noires.
On fait tirer une boule à une personne, et on demande
quelle est la probabilité pour amener blanche. On pourrait
dire que le nombre total des cas est n -{■ n' -\- p -[- p' et que
la probabilité est — ■. — ^, , ;• On peut dire aussi que
' n -\- n -\- p -{- p ^
deux cas peuvent d'abord se présenter, soit la première, soit
la seconde urne ; le probabilité de prendre dans la première
1 1
est -■> et dans la seconde -' car il y a autant de chances de
mettre la main dans l'une que dans l'autre. Si j'ai mis la
main dans la première urne, la probabilité est • — p — pour
que, prenant dans la première urne, on ait une boule blanche ;
en vertu du théorème de la probabilité composée, que je ne
tarderai pas à établir, la probabilité de mettre à la fois la
main dans la première urne et d'en tirer une boule blanche
1 n
est- — ; — ; la probabilité analosfue pour la seconde urne
2 n + // ^ o t
, 1 n'
6St ^ -,- , — ,'
2 w -f- p
La somme
1 n'
2 w -|- p 2 n' -)- p'
est l'évaluation correcte de la probabilité demandée, et il n'y
aura égalité entre les deux évaluations que dans un cas par-
ticulier :
, , T n n
c est-a-dire - =
n -\- p n -\- p' p p
PREMIÈRE LEÇON 3
A quoi tient cette diveryenee? A ce que les n -f- n -^p -\-p'
cas ne sont pas également probables.
Ainsi, supposons qu'il y ait deux fois plus de boules dans
la première urne
n A-p = ^[n-\- p).
La probabilité pour que je prenne une boule donnée dans
1
cette urne est r-; — ; -; et pour que je la prenne dans la
2 (n -j- p) ^ ^ "* '
1
seconde elle est
n-\- p)
A la définilion de la probabilité, il faut donc ajouter : à
condition que tous les cas soient également vraisemblables.
Citons deux autres exemples dus à M. Bertrand.
3. Problème des trois coffrets. — Trois coffrets iden-
tiques, A,B,C, ont chacun deux tiroirs, x, 8; ceux de A con-
tiennent chacun une pièce d'or, ceux de B une pièce d'ar-
gent, et ceux de C ont l'un une pièce d'or, l'autre une pièce
d'argent :
ABC
a or argent or
& or argent argent.
Quelle est la probabilité pour que, en ouvrant au hasard
un des six tiroirs, l'on ait une pièce d'or? Six cas sont éga-
lement probables : Ax, Ap, Ba, Bp, Ca et C,8; de ces six cas,
trois sont favorables à l'arrivée de la pièce d'or : Aa, Afi, Ca.
1
La probabilité est donc -•
Si l'on prend un des trois coffrets au hasard, la probabi-
lité pour prendre C est -•
CALCUL DES PROBABILITES
J'ouvre au hasard un des tiroirs, j'y trouve une médaille
d'or; quelle est la probabilité pour que la deuxième médaille
soit en argent?
Ou bien, je suis tombé sur le coffret C, ou bien sur le cof-
fret A : dans le premier cas, la seconde médaille sera en
1
argent, dans le second en or. La probabilité semble donc -•
Cette conclusion est fausse.
Avant d'ouvrir le tiroir, je savais que j'y trouverais une
pièce d'or ou une pièce d'argent avec une probabilité égale,
1
c'est-à-dire - ; or, je puis trouver la pièce d'or dans trois
cas, Ax, AS, Ca, et de ces trois cas un seul, Ca, est favo-
rable à l'arrivée de la pièce d'argent dans le second tiroir.
1
Dans la première évaluation de la probabilité à -• les deux
cas envisagés étaient inégalement proba!)les : le cas A cor-
, respond à Ax et à AB, et est deux fois plus probable que le
cas C, qui ne correspond qu'à Ca.
4. Problème du jeu de boules. — Deux joueurs éga-
lement habiles, Pierre et Paul, jouent aux boules; Pierre a
deux boules à lancer, Paul une boule, et la victoire est à
celui des deux dont l'une des boules approchera le plus du
but.
( Hielle est la probabilité pour que Paul gagne ?
Soient A et B les boules de Pierre, C celle de Paul ; six
cas peuvent se présenter, en rangeant les boules suivant
leur proximité du but :
ABC. BCA, CAB, ACB, CBA, BAC.
Ces six cas sont également probables ; ceux (pii donnent
PREMIERE LEÇON 5
la victuire à Pierre sont au iiuinlire de quatre, ceux qui
donnent la victoire à Paul au nombre de deux : la [)roljabi-
lité de gagner est donc r pour Paul.
On pourrait raisonner autrement : la boule A de IMerre
est plus éloignée du but que C, ou bien c'est le contraire.
A > c: ou A < C.
De mémo pour la boule lî :
B > C ou H < C.
Donc quatre cas sont possibles :
A > C avec B > C
A < C .. B > C
A > C .) B :: C
A < C .) B < C.
Un seul cas, le premier, est favorable à Paul, puisque sa
boule est à la ibis plus rapprochée que A et B ; la probabilité
serait donc -•
4
Mais les quatre cas ne sont pas également probables.
A > C avec B > C correspond à 2 combinaisons CAB, CBA
A < C » B > C » 1 ■) ACB
A > C .) B < C » 1 » BCA
A < C .) B < C » 2 ') ABC, BAC
5. La définition complète de la probabilité est donc une
sorte de pétition de principe : comment reconnaître que tous
les cas sont également probables? Une définition mathéma-
tique iii n'est pas possible ; nous devrons dans chaque appli-
6 CALCUL DES PROBABILITES
cation faire des coyivenlions^ dire que nous considérerons tel
et tel cas comme également probables. Ces conventions ne
sont pas tout à fait arbitraires, mais échappent à l'esprit du
mathématicien qui n'aura pas à les examiner, une fois
qu'elles seront admises.
Ainsi tout problème de probabilité offre deux périodes
d'étude : la première, métaphysique pour ainsi dire, qui
légitime telle ou telle convention; la seconde, mathématique,
qui applique à ces conventions les règles du calcul.
6. Nous allons grouper les questions dont nous nous
occuperons, d'après divers points de vue et d'abord au point
de vue du nombre des cas possibles.
Dans une première catégorie, nous rangerons toutes
celles où le nombre de cas possibles est fini, ne dépasse pas
certaines limites ; en général, nous aurons affaire à des jeux
de hasard, à de simples problèmes d'analyse combinatoire.
Dans une deuxième catégorie, le nombre des cas possibles
reste fini, mais devient très grand ; on n'a plus alors qu'une
expression approchée de la probabilité par la loi des grands
nombres, le théorème de Bernouilli, etc. C'est ce qui se
présente en statistique.
Dans une troisième catégorie, le nombre des cas possibles
est infini.
Ainsi, on lance une aiguille sur une feuille de papier où
sont tracées des lignes parallèles : la probabilité pour que
l'aiguille rencontre une de ces lignes dépend d'un nombre
infini de cas possibles .
C'est dans ce cas surtout qu'il faut définir avec le plus
grand soin les conventions préalables.
PREMIERE LEÇON 7
On sait, par exemple, qu'un nombre x, fractionnaire ou
incommensurable, est compris entre 0 et 1, et on demande
1
la probabilité pour qu'il soit compris entre 0 et -: le nombre
des cas possibles est infini. On serait (enté de dire que la
probabilité est-; cependant ou pourrait dire aussi ipu;
i . . 1
si 0 < a: < -' le carré de ce, soil y, est compris entre 0 et -•
Puisque x^ = //, el que x est compris entre 0 et 1, on a
0 < y < 1. Les cas favorables sont tous ceux pour lesquels
1 .
0 < y < -; si l'on divise l'intervalle compris entre 0 et 1 en
quatre parties égales, la probabilift' pour que y soit compris
1 1
entre 0 et -, est -■-
4 4
Ce serait pourtant une erreur grossière d'évaluer égale-
1 ... \
ment à - la probabilité pour que x soit compris entre 0 et -•
En effet, dans la première évaluation, nous considérons
comme également probables les deux bypothèses
l'intervalle e étant le même ; tandis que, dans la seconde
évaluation, nous considérons comme également probables
les deux hypothèses
Xq^ < o;^ < Xq^ -f- e et x^^ < x^ <l x,- -f e ;
ces deux conventions sont contradictoires.
Ici, X est une constante arbitraire ; plus haut, dans le pro-
blème de l'aiguille, il y avait trois constantes arbitraires, les
coordonnées du milieu de l'aio-uille et sa direction. Dans
8 CALCUL DES PROBABILITES
d'autres problèmes de probabilités, il y a encore plus de
constantes arbitraires, il y a même des lois arbitraires.
y = f {x) est une fonction qui peut paraître plus probable que
telle autre, ce qui arrive entre autres quand on interpole.
C'est là une quatrième catégorie de problèmes.
7. Plaçons-nous à un autre point de vue.
Une question de probabilités ne se pose que par suite de
notre ignorance : il n'y aurait place que pour la certitude si
nous connaissions toutes les données du problème. D'autre
part, notre ignorance ne doit pas être complète, sans quoi
nous ne pourrions rien évaluer. Une classification s'opérerait
donc suivant le plus ou moins de profondeur de notre igno-
rance.
Ainsi la probabilité pour que la sixième décimale d'un
nombre dans une table de logarithmes soit égale à 6 est a
1
priori de — ; en réalité, toutes les données du problème sont
bien déterminées, et, si nous voulions nous en donner la
peine, nous connaîtrions exactement cette probabilité. De
même, dans les interpolations, dans le calcvd des intégrales
définies par la méthode de Cotes ou celle de Gauss, etc.
Notre ignorance est plus grande dans les problèmes de
physique ; il s'agit de prévoir un événement, c'est-à-dire un
phénomène conséquent qui dépend d'une part d'un phéno-
mène antécédent, et d'autre part de la loi qui unit l'antécé-
dent au conséquent. 11 peut se faire que nous connaissions
la loi, mais non le phénomène antécédent : quelle est la
probabilité pour que se produise le phénomène conséquent?
Nous connaissons, par exemple, la loi du mouvement des
molécules ; si nous connaissions exactement leur position
PREMIÈRE LEÇON 9
initiale, nous serions capables de dire où elles seront à un
moment donné ; la probabilité pour que ces molécules
occupent telle p(»sition finale dépendra donc de la probabilité
que nous attribuerons par convention à telle ou telle position
initiale. Dans cliaquc cas une liy[)Othèse particulière est
nécessaire.
Ainsi, (piand on cherche la probabilité pour que les
comètes aient des orbites eili[)tiques, ou est obligé de faire
une convention, on suppose quk une grande distance du
soleil ces ast)-es sont uniformément distribués dans l'espace
ainsi que les directions de leurs vitesses.
Autre question analogue : les lacunes qu'offre la série des
petites planètes sont elles dues au hasai-dy Ici encore leurs
positions initiales sont inconnues, mais l'astronome connaît
la loi de leur mouvement. Comment choisir dans ce cas les
conventions à faire sur les positions initiales ?
11 est difficile de le faire sans tomber dans l'arbitraire.
Cependant, certaines hypothèses semblent tout à fait impro-
bables : on n'admettra pas que les vitesses initiales des
comètes soient telles qu'elles aient toutes la même excen-
tricité.
D'un autre côté il peut arriver que certains résultats
soient, dans une certaine mesure, indépendants de la loi
admise pour relier les antécédents et les conséquents. Con-
sidérons un très grand nombre de petites planètes, dont les
moyens mouvements soient tous différents : les rayons vec-
teurs, les longueurs, les vitesses initiales sont distribués d'une
façon quelconque. Au bout d'an tenq)s très long, ces petites
planètes seront également réparties dans tous les azimuts.
Il y en aura un même nombre dans des secteurs égaux.
10 CALCUL DES PROBABILITES
8. Dans d'autres problèmes enfin, il peut arriver que
notre ignorance soit plus grande encore, que la loi elle-
même nous échappe. La définition des probabilités devient
alors presque impossible. Si, par exemple, x est une fonc-
tion inconnue de t, nous ne savons pas très bien quelle pro-
babilité il faut attribuer, au début, à x^^ pour connaître
X
xdl .
On se laissera souvent guider par un sentiment vague qui
s'impose avec puissance, qu'on ne saurait pourtant justifier,
mais sans lequel en tout cas aucune science ne serait pos-
sible. Les lois les mieux étaljlies ne le sont que par des
expériences isolées dont on a été obligé de généraliser les
résultats. Quand Kepler déduisait ses lois des observations
de Tycho-Brahé, on aurait pu lui objecter : a Tycho-Brahé
n'a pas toujours regardé le ciel, et, pendant qu'il ne l'obser-
vait pas, la loi que vous cherchez n'a-t-elle pas changé ? »
Il aurait certainement trouvé l'objection ridicule et aurait
répondu : « Cette hypothèse est bien invraisemblable. » C'eût
été là faire appel à ce sentiment mal défini de la probabilité.
9. Un problème plus délicat que celui de la probabilité
des effets est celui de la probabilité des causes.
Dans notre urne de tout à l'heure, nous savions qu'il y
avait n boules blanches et p boules noires ; quand nous cher-
chions la probabilité de tirer une blanche, la cause était con-
nue : c'était une urne avec n blanches etp noires.
Mais, problème inverse, je puis savoir qu'il y a en tout
n -}-p boules sans connaître comment elles sont réparties. Je
tire une noire : quelle est la probabilité pour qu'il y ait plus
PREMIÈRE LEÇON U
de noires que do blanches? Ccsi une probabilité de cause.
On en recherche constamment de pareilles en physique ;
les lois ne nous sont connues que par leurs effets qu'on
observe. Chercher à en déduire les lois qui sont des causes,
c'est résoudre un problème de probabilité des causes.
10. Sans insister davantage sur le côte métaphysique des
questions de probabilités, et dans le seul but de provoquer
vos réflexions sur ce sujet, je vous ferai encore remarquer
qu'une probabilité peut être subjective. L'on a des raisons
personnelles de croire telle hypothèse plus probable que telle
autre.
La probabilité peut aussi s'objectiver, en statistique par
exemple: le nombre probable des personnes qui mourront
dans une année est tant ; cependant il s'en écartera un peu.
Dans quelles limites nos prévisions seront-elles vérifiées ?
Pourquoi seront-elles vérifiées ?
Il y a là quelque chose de mystérieux, d'inaccessible au
mathématicien.
Quoi qu'il en soit, Tordre que je suivrai dans l'exposé
mathématique des probabilités sera celui que jai indiqué
plus haut.
Je commencerai par des problèmes où les cas possibles sont
en nombre limité ; puis j'étudierai, au sujet des cas en nombre
très grand, le théorème de Bernouilli et ses conséquences, la
probabilité des causes, les problèmes où entrent des cons-
tantes arbitraires: le nombre des cas devenant infini, j'expo-
serai la théorie des erreurs, branche fort importante, et
j'apprendrai enfin à déterminer' des lois ou des fonctions
arbitraires.
DEUXIÈME LEÇON
1. Le calcul des probabilités repose sur deux théorèmes:
le théorème des probabilités tolales ; le théorème des proba-
bilités composée?.
Au sujet de deux événements A et B, on peut se poser
divers problèmes de probabilité, suivant que Fun de ces évé-
nements doit se [)roduire, ou tous les deux, ou aucun.
Ou bien A et B se produiront tous deux, hypothèse que
j'appellerai AB ;
Ou bien A se produira, B ne se produira pas, hypothèse
que j'appellerai AB' ;
Ou bien A ne se produira pas, B se produira, hypothèse
que j'appellerai yV'H ;
Ou bien ni A, ni B ne se produira, hypothèse que j'appel-
lerai A'B'.
Supposons que A B se réalise dans a cas difîérents
» A B' » p »
» A B » Y »
» A'B' » o »
Le nombre lotal des cas possibles est a + [i + y + 2' '1^'^
l'on suppose par convention également probables.
Examinons diverses probabilités.
DEUXIÈME LEÇON ^'^
La probabilité pour que A se produise est
(A) 2>, - T^râqrT^Ts'
les cas favorables étant AB et AB'.
La probabilité pour que B se produise est
fB) P. = 7+7+7+^^'
La probabilité pour que l'un des deux au moins se produise
est
(A ou B) P3 - .^ a_ à + Y -f- V
les trois premières hypothèses AB, AB' et A'B étant favo-
rables.
La probabilité pour que les deux se produisent est
(A et B, P;
-+- ? + 5 4- Y
une seule hypothèse, AB étant favorable.
Nous avons encore à envisager la probabilité pour que A
se produise si B s'est produit :
(A si B, ?'5 = .Tip; '
nous savons d'avance «lue B s'est produit, par suite le nombre
des cas possibles se réduit, ainsi que celui des cas favorables.
La probabilité pour que A se produise si B ne s'est pas
produit est
(A si B') Po ^ ^r^;
les cas possibles étant au nond)re de '; -|- 5.
14 CALCUL DES PROBABILITES
La probabilité pour que B se produise si A s'est produit est
(B si A) Vi = ^rpp" ■
La probabilité pour que B se produise si l'on sait que A
ne s'est pas produit est
(Bsi A') p^ '^- —
y + 8
2. Les théorèmes annoncés se réduisent à de simples
identités.
Examinons p,, p^, P3, p^. Oa a :
P< + P2 = P3 + P.',
a oc a 4- y
de même
P.', =P\Pt
Ainsi la somme des probabilités pour que A se produise et
pour que B se produise est égale à la somme des probabili-
tés pour que l'un des deux au moins se produise et pour que
tous les deux se produisent.
La probabilité pour que A et B se produisent tous deux
est égale à la probabilité pour que B se produise, multipliée
par la probabilité pour que A se produise quand on sait que
B s'est produit.
Ou, inversement, elle est égale à la probabilité pour que
A se produise, multipliée par la probabilité pour que B se
produise quand on suppose que A doit se produire.
DEUXIÈME LEÇON 15
3. Supposons, on particulier, a := o, d'où p^ ^ o, alors
P( + Pi = P:v
Lorsque les deux ('vénements ne peuvent arriver tous deux
à la fois, la prohabililô de A et celle de B oui pour somme
la probabilité pour que 1 un quelconque se produise.
Ainsi, quand un événement peut se produire de deux
manières différentes, mais que ces deux manières ne peuvent
arriver simultanément, la probabilité de l'arrivée de cet évé-
nement est égale à la somme de la probabilité pour (|u'il se
produise de la première manière et de la probabilité pour
qu'il se produise de la deuxième manière.
C'est le théorème des probabilités totales.
4. Il peut arriver que p~ = p^ .
î' -h Y ^ +
d'où
» -f- Y
^ + P + Y
+ 5
a + Y
=
a + 6 + Y
+ 5
a
-. + B
\ -L
y
-..i-ï +
5
a -f" f^ Y "f" °
X y
Quand cette dernière condition est remplie, on a Pj =7)5;
on a aussi ;), = p^, en permutant a avec p, y avec 8; on a
encore p., = p^, car p^ se permute, avec p.^ et p^ avec p^; de
16 CALCUL DES PROBABILITES
Ainsi :
Pi —Vi= 1\-
En d'autres ternies, la probabilité pour que A se produise
reste la même si l'on sait que B s'est produit ou si l'on sait
que B ne s'est pas produit; ou, enfin, la probabilité de A est
indépendante de B.
On dit que les deux événements sont indépendants.
De pj = P|, on déduit
Vk = P\V-i '■
la probabilité pour que les deux événements se produisent,
s'ils sont indépendants, est le produit de îa probabilité de
chacun des deux événements.
C'est le théorème des probabilités composées.
5. Dans un jeu de 32 cartes, on tire 2 cartes.
La probabilité pour que la première soit un roi est
1
la probabilité pour que la seconde soit un roi est
1
P. = -^\
la probabilité pour que les deux cartes tirées soient précisé-
ment deux rois est
4 >ç^3^
On cherche parmi tous les arrangements des cartes deux
à deux, soit 32 X 31, ceux qui sont favorables à l'événement:
DEUXIÈME LEÇON 17
il y en a 4x 3, car il y a 4 rois dans le j'en, el on peut former
avec eux, 2 à 2, autant d'arrangements (iifavec 4 lettres 2
à 2.
La probabilité pour que, dans les 2 cartes, il y ait au moins
un roi est
, 8 X 31 — 12
Vz =P\-\- P-2 — Pu = 3.) - .jj
Il faudrait se garder de dire que la probabilité pour que
l'on ait au moins un roi est le double de la probabilité pour
que l'on ait un roi.
Une urne renferme K boules numérotées de 1 à K. Si l'on
clierche la probabilité d'amener le N° 1 en tirant deux boules
à la fois, le 1 peut figurer soit sur la première boule, soit sur
la seconde ; les deux événements sont incompatibles, et la
probabilité totale est :
Revenons aux rois du jeu de cartes. Les événements sont-
ils indépendants ?
On n'a pas p,^ = p, p,, mais pj =r p, p..
En se reportant à la signification de p-, on voit que, si
le premier événement A s'est produit, il ne reste que trois
rois et 31 cartes, et la probabilité pour que B arrive est
_ 3^
31
Ainsi :
4X3
Pi =
32 X 31
OALCIL DES PBOBABILITÉS.
18 CALCUL DES PROBABILITES
Autre exemple crévénements indépendants: je jette 2 dés;
quelle est la probabilité que chacun amène 6 ?
1
La probabilité que l'un amène 6 est j:; ;
1
— 1 autre — ■^'
b
1
La probabilité que tous deux amènent 6 est r^i car les
deux événements sont indépendants.
6. Celte condition n'est pas toujours aussi évidente, et on
pourrait faire de ce théorème un usage illég-itime qui s'est
rencontré plusieurs fois.
Au tir au pistolet, je cherche la loi probable des écarts: je
ne me suis rien donné, ni sur le tireur ni sur le pistolet.
C'est une question dans le goût de «■ l'âge du capitaine »,
Prenons cependant deux axes de coordonnées, ayant pour
origine le centre de la cible : soient oc ei y les coordonnées
rectangulaires d'un poijit M, p et to ses coordonnées po-
laires.
Le problème reste indéterminé, si nous admettons que la
probabilité des écarts est la même dans toutes les directions,
La probabilité que M se trouve dans un petit élément de
surface da peut se figurer par
/■{x, y) cl':.
Il faut déterminer f [x, y) ; f [x, y) ne doit dépendre que
de p pour que la probabilité reste la même dans toutes les
directions : cette })robabilité s'écrira donc
DEUXIEME LEÇON 19
Clierchons la probabilité pour fjue labscisse du |)()iiil de
chute soit comprise entre x et x -{- dx; elle se représentera
par
■b {x) dx.
De même, la probabilité pour (pie l'ordonnée du point de
chute soit comprise entre y ^\. y -\- dy se représentera par
'\ [y) dy.
Mais on doit supposer que ç. et l sont égaux pour que la
probabilité reste la même dans toutes les directions ; dans le
second cas, on aura donc
? [y) dy.
Le raisonnement va devenir incorrect : clierclions la pro-
babilité pour que M se trouve dans un petit rectangle de
dimensions dx et dy. Deux événements doivent se pro-
duire à la fois : 1° l'abscisse est comprise entre x ei x ■\- dx\
2° l'ordonnée est comprise entre y et y -f- dy.
En vertu du théorème des probabilités composées, la pro-
babilité actuelle sera
cp [pc] 3. (?/) dx dy.
D'autre part, cette probabilité sexprime par /" (p) dz ; on
a donc :
? N ?(y) = /"(?)•
Prenons les dérivées logarilhmi({ues des deux membres
par rapport à ^, en tenant compte de p r=: y'a?- -\- y- .
^' [pc) __ f (p) X
? (•») f (p) ?
20 G.\LCUL DES PROBABILITES
Ainsi :
et par analogie :
X'^ [x] ^f (p)
?' [y) _ r (p)
2/? {y) 9f (?)
Le premier membre de chacune de ces équations dépend
sciil de iT, soit dey; comme ils sont égaux, ils sont cons-
tants.
X'^ [X)
hx"
loge cp [x) ■-= -^ -\- log. C
cp (a?) = Ce ^ .
Ce raisonnement est incorrect : on a appliqué le théorème
des probabilités composées, c'est-à-dire qu'on a supposé les
événements indépendants ; autrement dil, que les écarts
suivant l'axe des x sont indépendants des écarts suivant
l'axe des y.
Décrivons quatre aires égales à <:/<! autour des quatre som-
mets A, B, C, D d'un rectangle dont les côtés sont paral-
lèles aux axes. Appelons a, p, y, o les probabilités respec-
tives pour que M tombe dans chacun de ces éléments.
J'ai supposé que l'écart en ordonnée était le même pour B
et D, situés sur la même parallèle à l'axe des x; que l'écart
en abscisse était le même pour A et B, situés sur la même
parallèle à l'axe des y ; en d'autres termes que - =-^) ce qui
est une hypothèse absolument gratuite.
DEUXIÈME LEÇON 21
7. Maxwell a (•((iniiiis la même erreur dans la tlu'orie des
gaz. Considérons un g'az comme formé d'un très grand
nombre de molécules animées de vitesses différentes; com-
ment les vitesses seronl-elles distribuées entre les molé-
cules ?
Choisissons trois axes de coordonnées rectangulaires, et
par l'origine menons un vecteur représentant en grandeur,
direction et sens, la vil(>sse de ces molécides. Évaluons la
probabilité pour que l'extrémité du vecteur M se trouve
dans un petit élément de volume dr.
Si je suppose, ce qui est naturel, les vitesses susceptibles
de toutes les directions, cette probabilité se représentera
par
r{r)dT.
I.a probabilité pour que la première coordonnée soit entre
X ei X -\- dx s'écrira cp [x) dx ; la probabilité pour que la
seconde coordonnée soit entre y qV y -\- dy s'écrira cp [y] dy ;
la probabilité pour que la troisième coordonnée soit entre
z et z -{- dz s'écrira cp [z) dz,
La probabilité pour que M soit dans un petit parallélipi-
pède de côtés parallèles aux axes étant/ (r) dx dy dz, si le
théorème des probabilités composées était applicable, on
aurait comme tout à l'heure
ce qui est incorrect.
8. Parlons maintenant du problème du scrutin, dont une
solution élégante est due à M. André.
Deux candidats A et B sont en présence ; un électeur bien
22 CALCUL DES PROBABILITÉS
informé sait à l'avance que A aura m voix et B w voix, m
étant plus grand que n. On demande la probabilité pour que
A garde la majorité pendant tout le dépouillement du scrutin.
Pour évaluer le nombre des cas possibles, constatons que
les m bulletins A et les n bulletins B peuvent se présenter
dans autant d'ordres différents qu'il y a de permutations
avec répétition de m lettres A et n lettres B, soit
7)1 -\~ n !
m l ni
Je partage ces cas possibles en trois groupes.
Dans le premier, je range tous les cas où A a la majorité
au début et la conserve tout le temps, soitN, cas tous favo-
rables.
Dans le deuxième, je range tous les cas où le premier bul-
letin est un bulletin B ; A perd donc la majorité au début ; ce
sont No cas défavorables.
Dans le troisième, je range tous les cas où A a la majorité
au début, mais la perd ensuite avant de la retrouver à la
fin; ce sont N3 cas défavorables.
On a
N, + N, + N3 =
I 1) I
m ! n
et il s'agit de calculer :
N.
N, -f N, + N,
Évaluons N, : le premier bulletin dépouillé porte B ; sup-
primons-le, il reste m bulletins A et {n — 1) bulletins B. Le
in — (— H — ^ \ !
nombre des cas possibles est ; ry-' et donne la va-
^ min — 1 !
leur de N,.
DEUXIÈME LEÇON 23
Je vais démontrer que N3 = Xo.
Lemme. — Supposons qu'il y ait égalité do voix dans le
scrutin : A a ^ bulletins, B a q bulletins. Admettons égale-
ment que A a la majorité au début, et qu'il la conserve jus-
qu'au dernier bulletin, où il la perd, puisqu'il y a linalement
égalité ; le dernier bulletin est donc au nom de B. Dépouil-
lons dans l'ordre inverse: B perdra la majorité au dernier
bulletin seulement.
A un moment déterminé du scrutin, on a dépouillé a bulle-
tins A et b bulletins B, et l'on a trouvé a ^ b, puisque A a
la majorité. Il reste à dépouiller q — a bulletins A et g — b
bulletins B.
Dans l'ordre inverse, le scrutin aurait donc montré :
q — b > q ~ a,
c'est-à-dire que B aurait eu la majorité.
Ce lemme établi, revenons au problème qui nous occupe.
Considérons une combinaison a du troisième groupe
OL AABAB I BABAA.
A a la majorité jusqu'au trait, puis, au bulletin suivant, il
la perd pour la première fois. A gauche du trait, s'il y a q
bulletins A, il y a ^ — 1 bulletins B, soit en tout 2q — 1
bulletins.
Considérons une autre combinaison que nous appellerons
« dérivée de a ».
BABAA I AABAB.
On l'obtient en prenant successivement dans a les bulle-
tins de rang
27, 2q -f- 1, 2f/ + i2, ..., >w-fn, 1, 2, ..., 2g— 1.
24 CALCUL DES PROBABILITES
c'est-à-dire en transportant à gauche du trait ce qui était à
droite, et inversement.
Le (2ç)° bulletin étant, par définition, le premier qui fait
perdre à A sa majorité, chaque combinaison a aune dérivée
et une seule.
Considérons maintenant une combinaison [i du second
groupe : elle commence par B.
^ BABAAABA.
A a la majorité à la fin.
Formons une combinaison js' de la manière suivante :
d'abord le premier bulletin B, puis le dernier bulletin de ,8,
puis le pénultième, etc., c'est-à-dire les bulletins de p en
ordre inverse jusqu'au second.
p' BABAAABA
Il est clair que B a d'abord la majorité, puisqa'il finit par
la perdre.
Supposons que le (2p)* bulletin fasse perdre, pour la pre-
mière fois, la majorité à B; ici, c'est le second.
La combinaison fi' sert à 'définir le nombre p : il n'y en a
qu'un.
Le bulletin qui occupe dans p' le (2^3)'^ rang occupe dans p
le [m 4-^^+2 — '^pY rang.
Dans S, je place un trait avant le terme qui occupe ce rang:
p BABAAAB | A
Considérons enfin la combinaison suivante, que je dési-
gnerai par Y et que j'appellerai la dérivée de [il ; je commence
DEUXIÈME LEÇON ^
par les bullclins à droite du trait (ici il n'y en a qu'niij, et jo.
reprends tous ceux qui sont à gauche.
Y A I BABAAAB
Les bulletins de f> ont été pris ainsi dans l'ordre :
m-\-n-\-2 — 2p, ...,m-|-y/, 1,:2, ...,}n-\-)i — ip,m-\-7i-\-i —2p.
Je dis que cette dérivée appartient toujours au troisième
groupe.
D'abord le (m -{- 7i -{- i — ^p]^ .'.ulletin doitêtre A, puisque
dans p' il fait perdre la majorité à B ; donc y commence
par A.
A ne conservera pas tout le temps la majorité. En effet,
les 2p premiers l)ulletins de y sont, dans un ordre différent,
les 2p premiers bulletins de 6': et par hypothèse, après le
dépouillement de ces 2yj bulletins, il y avait égalité entre
les deux candidats.
Donc, dans y, A aura perdu la majorité et y appartiendra
au troisième groupe.
Ainsi, toute combinaison du second groupe a une dérivée,
et une seule appartenant au troisième groupe.
Si, pour une combinaison a appartenant au troisième
groupe, je forme sa dérivée p, puis la dérivée de p, je dis
que je retombe sur a.
Démontrons que le 5' de a correspond au p de 8.
En effet, formons p'
p' BBABAA i AABA.
Si je prends les '2q premiers bulletins de p', ce sont pré-
cisément les 2q premiers bulletins de x dépouillés dans un
26 CALCUL DES PROBABILITES
ordre inverse, et, d'après le lemme, B n'y perdra la majorité
qu'à la fin; or, nous savons, d'autre part, que B ne perd la
majorité dans fi' qu'au [^p)' bulletin; donc
P = 9
et la déri-'^ée de p sera a.
Si j'ai affaire à une combinaison p, j'en forme la dérivée y :
réciproquement la dérivée de [i sera a.
On peut dire que les combinaisons du second groupe sont
conjuguées avec celles du troisième, de telle façon que
chaque combinaison d'un groupe soit la dérivée de sa con-
juguée de l'autre groupe.
Donc :
N3 = N,
N.. + X3^ a'" + "-/,',
^ m In — 1 !
X, + N3 2n
N, + No -f N3 ~ m + n
C'est la probabilité que A n'aura pas toujours la majorité;
et
N, . '■In m — n
= 1
N, + N2 + N3 ?/i + n m -\- n
est la probabilité qu'il la gardera tout le temps.
TROISIEME LEÇON
1. Appliquons à (juolques problèmes simples les principes
précédents.
Problème des dés. — On jette n dés et on demande la
probabilité d'amener un point total égal à K.
Supposons d'abord qu'il ne s'agisse que de deux dés; avec
chacun d'eux, six cas différents peuvent se présenter, et les
deux réunis offrent trente-six combinaisons.
1 \
12 2 1
13 2 2
14 . , etc.
15
16
2 6
Une seule correspond au point K = 2
2 correspondent au point. . . K = 3
3 ~ K = 4
1 — K = 12
1
La probabilité d'amener 2 est . —
2
"" ~ '"^ ~ ' à
- 4- . -^■..
36
28 CALCUL DES PROBABILITES
Prenons le problème plus général de n dés; le nombre total
des cas possibles est 6" : en effet, soit a, a.^ a„ une des
combinaisons, chacun des nombres a est susceptible de six
valeurs, 1, 2, 3..., 6; donc le nombre cherché est celui des
combinaisons avec répétition de six lettres n à >«, soit 6'\
Le point total devant être un nombre donné à l'avance, K,
=^1 -f- '^■i H- •■• + <^n = K.
Considérons l'un des 6" cas possibles, et à ce cas faisons
correspondre le monôme
/a, /a., /a„
Faisons la somme de ces monômes en faisant varier a, ,
a^,. ..., a„ de 1 à 6.
S /?! Ip ... Ifn — n
=(^+/f + - + 'f:)('2+i4---+/^') •••('. + <?. + ••• +'?.)•
C'est un produit de n facteurs; faisons-y:
Le monôme deviendra :
et le polynôme H se réduira à :
Soit N le nombre des cas favorables ; il y a N monômes
égaux k t^ , leur somme est N^'^ , et si l'on fait SN/"^ , pour
toutes les valeurs possibles de K :
TROISIÈME LEÇON 29
La probabilité demandée est ^z
La valeur de N est facile k calculer,
II est la puissance n^ d'une somme de termes en prog-res-
sion o^éométrique :
{t — t')"- et (1 — t]-" peuvent se développer par la fornuile
du binôme; en faisant le produit des deux développements,
j'aurai le coefficient de t^ , c'est-k-dire \.
Reprenons le cas de deux dés. II devient '/ — '')" (1 — 0~'i
et l'on a :
(^_ t-/' = f' —"It^ + /''•
(1 — f2)-2 ^ ^ -\--2t + 31- -f-
Évaluons le coefficient de l^ en faisant le produit de ces
deux développements. D'abord K ne peut dépasser 12 ; puis
nous considérerons deux cas suivant que le point est de 2 à
7 ou de 8 à 12.
Si le point K est au plus égal k 7, K < 8, il n'y a k faire
intervenir ni l'^ ni <'' dans le premier développement, et
l'on n'aura k considérer que
f2 4- 9/3 ^ 3^4 _^ _>_ Or.
Ainsi pour les points 2, 3, 4 , 7, X a les valeurs res-
pectives 1, 2, 3, , 6.
Si K est égal ou supérieur k 8, il ne faut pas envisager /' ■,
et l'on n'aura affaire qu'k :
l2 i ,|_ -2/ -I- ) — 2^s [l -f 2i -f )•
30 CALCUL DES PROBABILITES
Le coefficient de t^ dans le premier monôme sera K — \ .
Le coefficient de t^ dans le second monôme sera — il ;
celui de i'\ — 4 ; ... celui de ^^, — 2 (K — 7). Ainsi :
N = K — 1 — 2 (K — 7) = 13 — K.
On trouverait des expressions plus compliquées pour
w > 2.
2. Problème de la loterie. — Dans une urne, il y a ;/.
boules numérotées de 1 à (j. ; on en tire », quelle est la pro-
babilité pour qu'il y ait K boules désignées d'avance ?
Les n boules tirées portent des numéros différents entre
eux et compris entre 1 et [jl.
Les cas possibles sont en môme nombre que les arrange-
ments de [/.lettres n à n, si l'on tient compte de Tordre de
sortie :
g!
ij. — n \
Quand il reste ;ji. — i -\- 1 boules, chacune d'elles a môme
chance de sortie que les autres ; nous supposerons toutes
les sorties également probables.
Si on ne considère pas l'ordre, le nombre des cas pos-
sibles ne sera plus que celui des combinaisons de j. lettres
n k n.
., t
Je ne considère plus comme distinctes les hypothèses qui
ne diffèrent que par l'ordre de sortie. Toutes les combinai-
sons restent-elles également probables comme les arrange-
ments? Oui, car chacune correspond à n ! arrangements.
TROISIÈME LEÇON SI
Le nombre des cas favorables est celui des combinaisons
où entrent les K boules désig'nées ; il en reste, après leur
suppression, a — K dans l'urne. Donc le nombre des cas
favorables est le nombre des combinaisons de u. — K lettres
n — K à il — K.
UL — K !
a — n\ n — K !
La probabilitf d'amener K numéros désignés à la loterie
est donc :
'j. — K\ il]
a! n— K!*
3. Problème de la poule. — Trois joueurs A, B, C
jouent aux conditions suivantes. Deux d'entre eux A et B
jouent ensemble ; C ne joue pas. Le perdant sort et est rem-
placé par C. Après chaque partie, le perdant est remplacé.
Le jeu prend fin quand un joueur gag'ne deux fois de suite.
On suppose naturellement que le jeu est un jeu de hasard,
1
et que la probabilité de gagner une partie est - pour cliaque
joueur.
Par exemple on peut avoir :
l""* partie AB ; A gagne ;
2^ partie AC; si A gagne, il est le gagnant définitif;
si C gagne, B rentre;
3* partie BC; si C gagne, il est le gagnant définitif;
si B gagne, A rentre ;
4" partie BA ; et ainsi de suite.
Admettons que A ait gagné la .première partie. On de-
mande la probabilité pour chacun des joueurs d'être le ga-
32 CALCUL DES PROBABILITES
gnant définitif. Soit x, y, z, cette probabilité pour A, B, C.
Deux hypothèses sont d'abord possibles. Si A gagne la
deuxième partie, c'est le gagnant définitif, et les probabi-
lités des trois joueurs deviendront 1 , 0, 0.
Si A perd, A prend la place de C, B se trouve dans les
conditions de A et C rentre comme B; les probabilités de-
viennent z. X, y.
Appliquons le théorème des probabilités totales et le théo-
rème des probaljilités composées.
A peut devenir gagnant définitif par deux hypothèses
qui s'excluent l'une l'autre :
1° En gagnant la partie considérée ;
2° En la perdant.
La probabilité pour que A soit gagnant définitif est donc:
B ne peut gagner que d'une manière : A perd la partie
considérée et B devient gagnant définitif ensuite.
1
y = Zy^-
De même pour C la probabilité sera :
D'où :
1
•^ — 7' '^-7' ^—7'
On remarquera que x + y -\- z = V \ lorsqu'il y a plu-
sieurs événements possibles et de telle façon que l'un d'eux
TROISIÈME LEr.ON 'S:\
et un seulement doive nécessairement arriver, la somme do
leurs probabilités est 1, mais ce n'est pas ici absolument le
cas, car la partie pourrait se prolong-er indéfiniment. Ici
notre somme est l parce que la probabilité pour que la partie
se prolonge indéfiniment est 0.
On vient de supposer que A avait gagné la première
partie. Plaçons-nous au commencement du jeu; avant la
première partie, C est dehors.
Deux hypothèses: A gagnera ou B gagnera.
Si c'est A, B sortira, C entrera et les probabilités pour
chacun deviendront
4 -2 1
Si c'est B, elles deviendront :
1 4 2
7' :' r
A peut devenir gagnant définitif: soit en gagnant la pre-
mière partie, soit en la perdant. La probabilité de la première
hypothèse s'obtient par le produit de la probabilité pour A de
gagner la première partie et de la probabilité pour devenir
.14
gagnant définitif, soit - X -• La probabilité de la seconde
hypothèse est de même ^X z'
On arrive ainsi aux probabilités totales suivantes.
PourA.^X-^ + ^X. = ^-;
Pour B, la même, — ;
4
Pour C, sans la calculer autrement — •
14
CALCUL UES PROBABILITLS "î
3 4 CALCUL DES PROBABILITES
4. Espérance mathématique. — A un certain moment
d'un jeu, lin joueur a la probabilité^ pour qu'il gagne;
l'enjeu à empocher est a.
Par définition, l'espérance mathématique est pa. Bien
entendu, si a est une perte, pa est négatif.
Si plusieurs hypothèses, de probabilités respectives p,,
p.,,... Pn: amènent des gains respectivement égaux à a^, «g, ..
a„, la définition de l'espérance mathématique sera :
Un jeu est équitable lorsque l'espérance m.athématique
est la même pour tous les joueurs.
Pour faciliter certaines questions, on convient d'introduire
des joueurs fictifs dont on évalue l'espérance mathématique.
Soient deux événements, A et B.
La probabilité de l'arrivée de A est p,
» » B est P2
» » A ou de B est p^
» » A et de B est p^
On a
lu + P-2 =P3 +P/.-
Si les deux événements étaient incompatibles, on aurait
dans cette formule p^ = 0, c'est-à-dire le théorème de la
probabilité totale; mais je suppose qu'il n'en soit pas ainsi.
Le gain à réaliser est de 1 franc si A se produit ; de 1 franc
également si B se produit.
L'espérance mathématique totale en tenant compte des
deux événements sera p^ -\- Pj-
Ainsi, que les événements soient compatibles ou non,
TROISIEME LEÇON 33
lespérance matliématique totale est la somme des espé-
rances inalhématiques partielles.
Si les deux événements se produisaient, le joueur tou-
cherait 2 francs.
Cas plus compliqué: Uu certain nombre d'événements A,,
Aj, ... A^ sont possibles : la probabilité pour que A, se pro-
duise est Pi, la probabilité pour que A,- et A;;, se produisent
à la fois est pn-, la probabilité pour que A,, \j et A/, se pro-
duisent à la fois est pij/,.
On promet à un joueur de lui payer 1 franc pour chaque
événement qui se produit ; s'il y en a /«, il touchera n francs.
Son espérance mathématique totale est la somme de celles
que lui assure chacun des événements, c'est-à-dire Sp,-.
On lui promet autant de francs qu'il y aura de combinai-
sons de deux événements pris dans la série. Si deux événe-
ments se produisent, il touche 1 franc; si trois événements
A, B, C se produisent, il touche 3 francs, car il y a trois
combinaisons AB, BC, CA ; si 7i événements se produisent,
. a (n — 1)
11 touche -^ iraiics.
Quand deux événements x\, et A^. se produisent, cette
combinaison lui assurant 1 franc, l'espérance mathématique
est pi/,, et l'espérance mathématique totale est alors :
n (n — 1] ^
-^ ^Pa-
Si n événements se produisent, et qu'on donne au joueur
1 franc par groupe de 3, il touchera alors '—- ' ~
et son espérance mathématique sera
7) 'il — 1 n — :i ^^
d.^2 3
36 CALCUL DES PROBABILITES
Jouons maintenant avec les conventions suivantes : je
paie 1 franc par événement qui se produit ; le joueur me
paie 1 franc par combinaison de deux événements; je lui
paie 1 franc par combinaison de trois événements ; il me
paie 1 franc par combinaison de quatre événements, etc.
Événements : 1, 2, 3, 4, ...
Gain du joueur : 1, — 1, 1, — 1, ...
Son gain est :
n iyi — 1) , 71 in — 1) (w — 2)
quand il y a n événements réalisés.
Si n = o, (I ^ o.
On a, en général :
, n[n- — 1) - nin — l]fn — 2) , ,. .n
Donc, pour w >■ o, «i ^ 1.
Ainsi, quand aucun événement ne se produit, le joueur
ne touche rien ; quand il s'en produit n, il touche toujours
1 franc.
Son espérance mathématique est:
D'où une généralisation du théorème des probabilités to-
tales : la probabilité pour que l'un, au moins, des événe-
ments se produise est :
5. Application au problème de la rencontre.
TROISiÈxME LEÇON 37
Dans une urne, il y a a boules numérotées de 1 à jj.; je
les tire les unes après les autres, jusqu'à ce que l'urne soit
vide. II y a rencontre si, au i^ tirage, je tire la boule numé-
rotée i.
Cherchons la probabilité pour qu'il y ait au moins une
rencontre.
D'abord la probabilité pour qu'il y ait rencontre au rang i
1 . , .
est - En effet, il y a en tout autant d hypothèses possibles
V-
que de permutations de [j. lettres, soit u. ! Combien sont fa-
vorables? celles où la /^ boule est au rang /; je puis y per-
muter les <x — 1 autres, donc a — 1 ! cas favorables. La
probabilité est :
a — l ! 1
tx ! [X
Cherchons la probabilité pour qu'il y ait rencontre au i"
et au h'^ tirage. Deux boules ont un rang déterminé : si
nous permutons les a — 2 autres, nous verrons que le
nombre des cas favorables est a — 2 ! ; la probabilité est :
1
Vile
IX. (a — 1)
De même :
1
P'J/^ = TT. TYTT—
2)
Toutes les Pi sont égales ; comme il peut y avoir u. ren-
contres :
S/5, = 1.
Pour calculer 2p,A-, remarquons que le nombre possible
38 CALCUL DES PROBABILITES
a (u. — 1 )
des doubles rencontres est
i.i
[i.l[X
(fx — 1 1 ^ 1
Pi/c = S^/t =
De même
-Dfp^ — 2)
[i-^jx — ij i[x
;)/yi. = i]p,y/,
1.2.3. ' -^ '^'■"^ 1.2.3
Si je promets à un joueur autant de francs que de ren-
contres simples, son espérance mathématique sera 1 ; elle
1
sera -> s il reçoit 1 franc par combinaison de 2 rencontres ;
i .
-> s'il reçoit 1 franc par combinaison de 3 rencontres ; etc.
Quelle est la probabilité pour qu'il y ait une rencontre
au moins? C'est ce que nous avons appelé tout à l'heure P.
1 ! 2! ^3! ij.\
le dernier terme correspond au cas de <j. rencontres simul-
tanées. Les termes de P sont les <j. premiers termes du déve-
loppement de 1 — 6"', et cette série converge avec une rapi-
dité extrême. L'erreur est d'autant plus petite que [;. est plus
1
grand, et, pour y. = 20, elle est inférieure à ^-- jj c'est-k-dire
insignifiante.
La probabilité cherchée est 1 — e- *.
6. On promet à un joueur (toujours sans remettre les
boules dans l'urne) de lui donner un franc à chaque maxi-
mum de la liste que l'on obtient, en écrivant les numéros
sortis dans leur ordre de tirage. Quelle est son espérance
mathématique?
TROISIÈME LKÇON 39
Supposons f[u'il y ait luaxinnim au i" tirage; on a tiré
trois boules «, b, c, la U — 1)*, la i^ et la [i -f- 1 % et puis-
qu'il y a maximum, a <i b ^ c.
Il y a a! cas possibles. Sans toucher aux autres boules, je
permute entre elles a, b, c ; six combinaisons sont pos-
sibles, dont deux sont favorables, a, />», c et e, b, a.
Dans ce g-roupe, la probabilité pour un maximum est dune
1 a !
-• Or, il y a^ de ces groupes, correspondant au /" liraye,
o u
1
mais, pour ce tirage, l'espérance matliématique est •
L'espérance mathématique totale sera la somme des espé-
rances mathématiques partielles ; d'autre part, sauf conven-
tions spéciales que je ne suppose pas, ni le premier, ni le
dernier tirage ne peuvent donner lieu à paiement.
u — 2
L'espérance mathématique totale est donc ' —
QUATRIÈME LEÇON
1. n joueurs ont chacun un dé et mettent chacun 1 franc
comme enjeu: celui qui amènera le point le plus fort ramas-
sera les n francs; et si plusieurs joueurs obtiennent le môme
point, plus fort que celui de tous les autres, ils se partage-
ront l'enjeu.
Le premier joueur, A, amène le point K : quelle est, à ce
moment, son espérance mathématique?
-La probabilité pour qu'un autre joueur déterminé amène
1 .
le point K est - ; pour qu'il amène un point plus petit que K,
K — 1
6
Quelle est la probabilité pour que A partage l'enjeu avec
i — 1 joueurs déterminés? Ces / — 1 joueurs doivent amener
le point K, les n — i autres un point inférieur à K. La
probabilité cherchée est donc une probabilité composée, le
produit de (-1 pai' i
Ainsi la probabilité pour que A partage avec i — 1 joueurs
(K — 1)"-'
déterminés est ^ — 7^,731 0" peut former autant de groupes
de / — 1 joueurs qu'il y a de combinaisons de n — 1 lettres
^ — 1 a ^ — 1, soit -; r,'
i — 1 ! n — il
K — 1\«-
QUATRIÈME LEÇON ^1
Chacune de ces combinaisons donne à A la probabilité
ci-dessus, et le gain correspondant est "; l'espérance ma-
thématique de A est :
n_l! (K — 1"-' /' '^ '• l
K — 1 "-
Il ,1 — il 6" - ' i i\ n — i
^n-\
Il faut faire la somme de ces espérances mathématiques
depuis i = 1 jusipi'à i = n, ce dernier cas étant celui où
l'enjeu est partagé également entre tous.
ZJ i ! H - i ! 0"-*
C'est le développement du binôme
6" - '
(K — 1)«
à part le terme qui correspond a i = o, soit — -~^,
•.rt - 1
L'espérance mathématique totale est donc :
K" — (K — 1)"
0"-'
2. La théorie de l'espérance mathématique a donné lieu à
un paradoxe célèbre, le paradoxe de Saint-Pétersbourg :
Paul lance une pièce de .monnaie ; si elle retombe pile, il
paiel franc à Pierre et la partie est terminée ; si elle retombe
face, on recommence. Si au deuxième coup on amène pile,
Pierre reçoit -2 francs et la partie est terminée ; si on amène
face, on recommence. Au troisième coup, Pierre recevra
4 francs, ou bien la partie continuera, et ainsi de suite. Si la
pièce présente face n fois de suite et que le (n -f 1]" coup
soit pile, Paul paie 2" francs.
42 CALCUL DES PROBABILITES
Quelle somme doit donner Pierre à Paul au commence-
ment de la partie pour que le jeu soit équitable ? En d'autres
termes, quelle est l'espérance mathématique de Pierre ?
.1
La probabilité d'amener pile au premier coup est r ; l'es-
i
pérance correspondante est -•
La probabilité d'amener face au premier coup, puis pile
au second, événements indépendants, est une probabilité
i . 1 i
composée, j. — L'espérance mathématique est - x 2 =r -•
11
Au troisième coup, cette espérance est - X 4 = -•
1 1
Au n« coup, ^;;-;^ X 2" = -•
l
Tous les termes de la série sont égaux à - ; l'espérance
mathématique de Pierre est infinie : il n'achèterait jamais
trop cher le droit de jouer.
On a voulu expliquer ce paradoxe de plusieurs manières.
Paul n'est pas infiniment riche, a-t-on dit : sa fortune est
comprise, par exemple, entre 2'' et 2'' + * ; si Ton amène
pile au {p -f- ly coup, il devra 2'' francs et pourra payer ;
mais si l'on amène pile au coup suivant, il devra 2'' + ' francs,
et sera insolvable. Pierre ne peut donc toucher que 2'' francs ;
son espérance mathématique devient
111 1 11
-4--X2-I--X-4-I- -1 — -—■x^lP-\-——'if-\-——'iP4-
La série devient
11 111,
2 + 2~^ ••• "T~2'~4"'~8~'~
QUATRIÈME LEÇON 43
p -\- i termes sont égaux à -• le reste a pour soinnie -•
l'espérance mathématique est :
p-\- i , i ;H-_r
Si la fortune do Paul est, par exemple, dun milliard, ou
pourra faire p = 30. et l'espérance mathématique de Pierre
3-2
sera— =: IB. On voit qu'elle se réduit considérablement.
On a dit aussi que le plaisir de gagner 1 000 francs est
plus grand pour celui qui n'a rien que pour le millionnaire ;
que le plaisir de doubler sa fortune est indépendant de cette
fortune.
Le plaisir, quand on possède une fortune x. de gagner
une somme A sera mesuré par
^ X
On a remplacé l'espérance mathématicpe par l'espé-
rance morale.
Pu étant la probabilité de réaliser un gain h, l'espérance
morale sera
^ 1 X -{- h
^Pk log
^ X
ou
- loff 1 \- — Ino- ■ L . J loo- !
pour le paradoxe de Saint-Pétersbourg.
Cette série est manifestement conversfente.
3. Deux joueurs, dont l'un, A. possède m francs, et l'autre,
44 CALCUL DES PROBABILITES
B, n francs, jouent à l franc la partie et poursuivent le jeu
jusqu'à ce que l'un des deux soit ruiné. La probabilité
pour que cet événement se produise sera fonction de m et w,
cp (m, n), et comme la somme des fortunes, w -|- n = s, est
une constante, cp sera fonction de s et n, c'est-à-dire de n.
Appelons cp {n) la probabilité pour que B finisse par être
ruiné : nous supposerons ici que les conditions ne sont pas
équitables.
Si A à chaque partie a la probabilité p de gagner, B a la
probabilité 1 — p.
On joue une partie nouvelle. Deux hypothèses se pré-
sentent: A va gagner et B aura n — 1 francs; B gagnera et
aura n -j- i francs.
cp {n) comprendra donc la probajjilité pour que B perde
cette partie et finisse par être ruiné, soit p cp (n — 1), et aussi
la probabilité pour que B gagne cette même partie, mais
finisse également par être ruiné, soit (1 — p) cp (n -j- 1).
(1) cp {n)=p:f (n - 1) -h (l -p) cp {n + 1).
Cette relation de récurrence servira à déterminer cp (n). Il
faut en outre connaître les conditions limites.
Si n = o, B serait déjà ruiné ; si w =: s, ni = o, A n'aurait
rien. Donc cp (0) = 1, cp (s) = o.
4. Résolvons Téquation de récurrence plus générale :
AKcp(n+K)^-AK-,cp(/i-f-K-lj-f -f-A^cp(«+lj+Aocp(H) = o,
où les A sont des coefficients constants. C'est une équation
aux différences finies, linéaire et à coefficients constants,
dont l'intégration rappelle celle des équations différentielles
linéaires à coefficients constants.
QUATRIEME LEÇON 43
Supposons que Ton ait trouvé K solutions -i), (/<), a-al")' •••i
i-K {>i), Je telle sorte que:
S, A,»,- (n -j- (?) = o.
Nous aurons encore une solution en posant :
0) bi] = a,î,, (»i -\- 7.2Œ.2 («) + ••• + ^K'rK f»)-
En clTet, multiplions le X précédent par 7.,, et faisons la
somme des termes obtenus en faisant varier i.
S,a,SçA,,ç>,- (« + q) = i:,/A,/i:,a,Y/ ['l -{- q) = O
Si cp,, Çoi î îK sont linéairement indépendants, on aura
ainsi la solution générale. Supposons, en effet, que ce ne
soit pas la solution générale ; alors :
Je vais choisir a^, a,, ... ïk de façon à satisfaire au sys-
tème suivant :
cp (Oj = a,cp, (0) + a^cpa (0) -f- .. . -f aK'fK (0)
cp (1) = a<9, (1) -f- a.cp. (1^, -I- ... + aKSK (1,
<p(K— i;. = a,cp, (K— l)-]- a2cp2(K — 1^4- ... 4-aK=.K(K— 1)
Ces K équations linéaires déterminent a,, a,, ..., aK, à
condition que leur déterminant soit différent de zéro, ce qui
aura lieu quand s,, So, ..., ok seront linéairement indépen-
dants. Dans ce cas, on aura :
,]. (0) = J; (1) = ^ (2) = ... = 'l K —1=0,
et par suite la relation suivante :
AK4'(n-f-K) + AK_i'H" + K-i;-f...+A,^(n-fl:+AoJ'(î2)=o.
46 CALCUL DES PROBABILITES
Je fais il := o, tous les termes s'annulent sauf Ak^ (K):
donc <\> (K) est nul.
Si je fais n = i, •]/ (K -j- 1) est nul...
Donc <\> {n) est identiquement nul, et cp [n] se réduit à
a|Cp, -j- (x^di.^ -\~ ... -{- KKCpK. Ainsi, il suftit de connaître K
intégrales particulières linéairement indépendantes pour
connaître l'intégrale générale.
Pour trouver K intégrales linéairement indépendantes, je
pose cp {n) = p". Alors :
AKr-'''-f-AK-ifJ"^'^-'+ ... +Aor = o
ou
AkP'^H- AK_i^'^-' + -" + Ao = o,
d'où K valeurs particulières de p, et par suite K intégrales
particulières.
Il se présente une exception, quand l'équation en fi offre
des racines multiples, par exemple une racine double,
p^ := §2 5 ^'^ faisant varier les coefficients d'une manière
continue, il peut arriver que deux racines deviennent égales.
On n'a plus alors K solutions.
k'i J3«
p'I et p 2 sont des solutions ; — ' r^ est une combinaison
linéaire, et par conséquent une solution. Quand p^ tend vers
li.2, par raison de continuité, à la limite on a encore une
solution. Cette limite s'obtient en différentiant par rapport
à p^ les deux termes du rapport, ce qui donne — ^ — ;
n^"-^ ou, si l'on veut, wp'^ est donc une nouvelle solution.
Avec une racine triple, on aurait en outre n^ pf , etc.
QUATRIÈME LEÇON 47
5. Appliquons colle règle au problème qui nous occupe,
c'esl-à-dire à l'équalion (1) du paragraphe 3.
Faisons cp (w) = fJ", il viendra
OU
Celte équation du second degré a une racine évidente,
P ^ 1 ; l'autre est r—^ — : c'est cette valeur que nous appel-
lerons désormais p. Les deux solutions ^" et 1 donnent pour
la valeur générale de cp (n) :
(p (n) = rt8« -f- b.
Les conditions limites donnent les deux constantes arbi-
traires.
1 = a-\- b,
0 = cif,' + b ;
d'où
et
1 , — 8^
a = r-.' b = . '~,
'l — 8^-
Cette expression devient illusoire, si l'on suppose 8 = 1.
1
Quand ^ = 1, p = - ; le jeu serait équitable. On cherche
la vraie valeur de cp (n) par la règle de l'Hôpital :
$ CALCUL DES PROBABILITES
Trois cas sont à considérer :
1" 13 > 1. Le jeu est avantageux à A, p > 1 — p,
p .s- fJ II
2° p = 1. Le jeu est équitable, p = 1 — p,
s — w
o n) =
3° 8 < 1. Le jeu est avantageux à B, p < 1 — p,
La probabilité pour que B se ruine est '— 4 — Pour avoir
la probabilité pour que A se ruine, on permute p et 1 — p ;
P se change en — et n en m :
e-^-
- s-'"
P--
— 1
1 -
- 8"
c'est-à-dire :
1 — 8^-
6. La somme des deux probabilités
9/ — 6" 1 — 8«
^.- _ 1 + YITf
est égale à l'unité, ce qui n'était pas évident a priori. En
effet, la probabilité pour que la partie se prolonge indéfini-'
ment pouvait avoir une valeur finie.
Supposons s très grand. Quand p > 1, (3* est très grand
et cp (n) a le signe de 8^; sa limite est \. Quand 8 = 1, sa
QUATRIÈME LEÇON 49
limite est encore 1. Quand p < 1, S' tend vers 0 à mesure
que s augmente, et la limite de :p (n) est P".
Conclusion: Si donc s est très grand et n fini, on a la cer-
titude d'être ruiné dans un jeu équitable ou avantageux à
l'adversaire. Mais si le jeu est avantageux au joueur, la pro-
babilité d'être ruiné devient d'autant plus petite que sa for-
tune est plus grande.
Un joueur de profession, un banquier, joue avec tout le
monde, c'est-à-dire avec un adversaire infiniment riche,
mais le jeu lui réserve des, avantages. Au contraire le punie
qui jouera indéfiniment est sûr d'être ruiné.
7. M. Bertrand a calculé le momen( probable de sa ruine.
Pour le banquier, p < 1, la probabilité pour que labanqie
saute est P''. 8 est le rapport des chances favorables au
ponte, aux chances favorables au banquier; supposons
19 1
6 = -7777» c'est-à-dire 8=1 — ^ - •
20 ' 20
n est la fortune du banquier, ou prenant pour unité l'enjeu
■de chaque partie ; il y a un maximum pour cet enjeu, d'où
pour n un certain maximum ; soit ?i = 1 000.
La probabilité pour que la banque saute est :
/ i\)ooo r/ i\20n:;o
('-s) =[('-S5)]
ou, à peu près, e-'^^, quelque chose d'extrêmement faible.
Nous arrêterons ici l'étude des cas qui se ramènent à de
simples problèmes d'analyse combinatoire.
CALCn. riES PROBABILITÉS.
CINOLIEME LEÇON
1. Nous abordons maintenant les théories qui se rap-
portent à la formule de Stirling, au théorème de Bernouilli
et aux probabilités des causes déduites d'épreuves répétées.
Supposons que les deux événements A et B, de probabi-
lités respectives p et q^ soient contradictoires. A chaque
épreuve, l'un d'eux se produit certainement, et ils ne peuvent
se produire tous deux ; alors
p + (^ = 1,
la probabilité totale est égale à la certitude.
On répète m fois l'épreuve : à chaque épreuve l'un des
deux événements se produit. Ainsi, avec un dé, l'événement
A peut être l'arrivée du point 6 et l'événement B celle des
autres points ; p = -' et 5- = -•
A se produira un certain nombre de fois et B aussi. On
demande la probabilité pour que A se produise a fois, et B
m — a fois.
On suppose que la probabilité reste la même à chaque
épreuve. Avec le dé, la probabilité est toujours - pour amener
le point 6. Au contraire, avec un jeu de 32 cartes, la proba-
CINQUIÈME LEÇON 51
bilité de tirer un roi est - ;i la première épreuve ; elle est
n
T77 OU — à la deuxième, suivant (lu'on n'a pas amené ou qu'on
oi Si *
a amené un roi à la première.
2. Cherchons d'abord la probabilité pour que les événe-
ments se succèdent dans un ordre déterminé.
AABAABBAB ;
les probabilités de chacun de ces événements seront
ppqppqqpq,
et la probabilité composée, la probabilité pour que tous ces
événements se produisent à la fois, est
p^q*.
En général, la probabilité pour qu'il se produise dans un
ordre déterminé a événements A et m — x événements B est
Elle est indépendante de l'ordre considéré.
3. Si l'on veut <{ue les m épreuves donnent dans un ordre
quelconque % événements A et m — a événements B, en
vertu du principe de la probabilité totale, la probabilité
cherchée sera la somme d'autant de termes égaux à p^q'"-^
qu'il y a d'unités dans le nombre des permutations avec
répétition de a lettres A et de m — x lettres B ; ce nombre
est :
m !
y.liu — a !
S2 CALCUL DES PROBABILITES
La probabilité pour que les événements se succèdent dans
un ordre quelconque est :
m !
(Xi m — a ! ■'
c'est l'un des termes du développement de {p -f" q)"\
Si je fais la somme de tous les termes que je puis obtenir
en faisant a égal à 0, à !,.••> à m, j'obliens :
Zu^ = {p + q)"' = 1.
La somme des probabilités de tous les cas possibles doit
être égale à l'unité, puisqu'il est certain que l'un de ces cas
possibles se produira, et un seul.
4. Quelle est la plus grande de toutes ces probabilités ?
Je vais calculer le rapport d'un terme au précédent.
}/? '
„ : r>'^+\ f.m-a.-\
(L -\- \\ m — X — 1 !
-' ' "• — ^ ' _ j m — a p
pq-
-\-\\m — -i. — i\'' a + 1 q
De même en changeant tx en a — 1
m — a -|- 1 p
Pour que iiy. soit la plus grande de toutes les probabilités,
il faut que
Wa+1 <- '*a ^ ^^(x—i
Donc :
^^^^ < 1 et ^^ > 1,
Uix Wa — <
CINQUIÈME LEÇON 53
c'est-à-dire :
7)1 — %p m — Jîj- 1 P ^ I
— ; — r < 1 et — ' — - > 1-
a -f 1 ^ 'j. q
OU :
[m — X] p < {% -\- 1) q et [m — a -1- 1; p > a</,
mp — 1-P < 't-q -\- q et mp — ■xp -\- p > xq .
Comme :
xp + a<7 = a /; + ry, = a,
mp < x -\- q et mp > a — p.
De telle façon que nous arrivons aux inégalités
mp + p > !x > mp — q.
D"où une limite supérieure et une limite inférieure pour a.
La différence de ces deux limites esi p -\- q = i\ ainsi a est
compris entre deux nombres, généralement fractionnaires,
qui diffèrent d'une unité, et comme a est entier, ces deux
limites déterminent -j..
Il y a exception quand mp -j- p est entier ; alors mp — q
l'est aussi. On pourrait hésiter pour a ; deux termes consé-
cutifs dans le développement de p -\- 7 '" sont égaux entre
eux.
a ,1
Si m est très grand, le rapport — est compris entre P + ~
et )) — — ' donc — sera voisin de p.
m m
C'est une forme d'établissement du théorème de Ber-
nouilli.
Si je choisis a de façon que «a soit le plus grand possible,
le rapport du nombre des événements A au nombre des évé-
nements B sera à peu près celui des probabilités p ei q.
54 CALCUL DES PROBABILITES
5. Quelle est la probabilité pour que a s'éloigne d'une
quantité donnée h de mp ? Soit :
a — mp = h.
J'appelle h l'écart et je vais cliercber la valeur probable
«de la valeur absolue de cet écart, ainsi que la valeur pro-
bable de son carré.
Soit p^ la probabilité pour qu'une certaine quantité a soit
égale à a^ ;
Soit P2 1^ probabilité pour qu'une certaine quantité a soit
égale à a^ ;
Soit Pn la probabilité pour qu'une certaine quantité a soit
égale à «„•
La valeur probable de a est, par définition,
a^p^ + «22^2 -\- ... -\- a„p„,
c'est l'espérance mathématique d'un joueur à qui on pro-
mettrait une somme égale à a.
La valeur probable de a- n'est nullement égale au carré de
la valeur probable de a. Par définition, la valeur probable
de a?' est
^a?p,,
tandis que le carré de la valeur probable de a est
Soit h la valeur probable de d^, c celle de a.
b-c^ = Y.pi ^a^pi - [llaiPiW
car Hpi = 1 .
CINQUIEME LEÇON 35
Nous transformerons le second membre à l'aide de l'iden-
tité de Lagrange :
SX2. vX'2 _ [SXX']2 = i: (XY' — YX')2.
Nous poserons
X' = Ui \lp'i,
d'où
et:
XX' = ûiPi
2X2 = -Ip,,
i:x'2 = s«,2p.,
SXX' = i-a,p/.
Par conséquent
i — c"- = Z (\'ih ak \!pk — \pk ai \Jpi)-
b — c^ =z '^pip;, [cik — a.:t'\
Pi et Pi- sont essentiellement positifs ; donc b — c^ est supé-
rieur à zéro, et la valeur probable du carré de a est toujours
plus grande que le carré de la valeur probable de «, sauf
quand a^ = ai.
6. Occupons-nous maintenant de la valeur probable de h,
de la valeur probable du module \ h \ de /i, de la valeur
probable de h^.
Je vais considérer la valeur probable d'une quantité quel-
conque M ; c'est
SMwa. ,
■ >/?'
SMwa = -M -j ^ T p^f/'"-* ;
7.\ m — a
S6 CALCUL DES PROBABILITES
le second membre est un polynôme entier, homogène et de
degré m par rapport à p et r/, que je désigne par F (p, q).
Cherchons la valeur probable de Ma; c'est
SMa
a ! ni — al
p^q'
Nous avons passé d'une expression à l'autre en multipliant
par a les ternies successifs ; en différentiantp*(/"'-<^ par rap-
port à p, nous aurions eu ap«-< q'"--^ ■ la valeur probable de
Ma est donc :
pdF
dp
Les nombres p et q ne sont pas indépendants, puisque
leur somme est 1. On a fait la différentiation comme s'ils
l'étaient, on a différentié par rapport à p comme si q était
constant. De plus, M peut dépendre de p : h dépend de p.
J'éviterai cette confusion de la manière suivante :
A la place de p et q j'introduis deux variables auxiliaires^
ce et y, et je considère
SM
^aj,.«-a
0.1 m — a !
que j'appelle F {œ, y). Si M dépend de p, je n'y remplace pas
p et q para; et y ; la valeur probable de M est bien alors
F [p, q), et
SMa -r^ r T.^U"
0.1 m — a ! "^
.1- ^P
est bien œ -7—
dx
On y remplacera x et y par jo et 5- après la différentiation.
CINQUIÈME LEÇON 57
7. Appliquons co qui précède au problème qui nous
occupe.
Soit d'abord M = 1.
t' (^> ^) = E a!»!- a! ""'y'" "" = («' + yT ;
si je fais ensuite :
il vient :
F(/3, î) = (p + r/j- = l,
et en effet la valeur probable de 1 est 1.
Pour avoir la valeur probable de a, je différentie F (a?, y] par
rapport à x^ et je multiplie par x^ ce qui me donne
mx{x-\-y)"^-^ ; puis je fais x =^ p, y = q. La valeur pro-
bable de a est mp.
Pour avoir la valeur probable de a^, je différentie le terme
mx {x -\- y)'"^-^ par rapport à x, puis je multiplie par x; ce
qui me donne d'abord
m [x -j- î/)'" ■" ' -\~ m [m — i) x [x -{- ?/)'" -^
puis :
mx [x -f- y)'"~* -f" '^ (^^'^ — 1) ^^ ("^ ~1~ y)"^~'-
En faisant x = p et y ^ q, j'obtiens pour la valeur pro-
bable de x^ :
77ip -f- ?n^/3^ — rnp'^.
Cherchons maintenant les valeurs probables de h et h^.
La valeur probable de 7i sera la valeur probable de a,
moins la valeur probable de rnp, c'est-à-dire
mp — 7np = o.
58 CALCUL DES PROBABILITES
La valeur probable de l'écart est donc nulle.
La valeur de li^ est :
h^ = x^ — 'impx -\~ m^p'^ ;
sa valeur probable est donc :
[mp -f m^p^ — mp^) — 'imp.mp -}- m^p^,
ou :
mp (1 — p),
c'est-à-dire mpq.
La valeur probable du carré de Ji est mpq.
On vérifiera en passant qu'elle est eiïectivement plus
grande que le carré de la valeur probable de 7^, qui est
nulle.
8. Passons à la valeur probable du module de h ; cher-
chons d'abord quelle serait l'espérance mathématique d'un
joueur à qui on promettrait une somme 1 si l'écart était posi-
tif, et 0 s'il était négatif?
S «a doit se borner aux termes dont l'écart est positif.
Soit wp le dernier terme de S?«o( pour lequel l'écart est posi-
tif; on a:
p > mp, et fJ — 1 < mp,
ett l'espérance mathématique de ce joueur serait :
yyi/ 777,
p'" + jr - ' </ + + 3;^^_^ vh"' - ^
c'est-à-dire F (p, q) en posant :
F [x, y) = X"' 4- j x'"-'y H- + , J'j_p; ^'Y"- !^-
CINQUIÈME LEÇON 59
Si l'on supposait maintenant (ju'on ait promis à ce joueur
une somme a, son espérance mathématique sera x —•> en
faisant a; =p, y = </ après la difîérentiation. Enfin, la valeur
probable d'une fonction qui est égale à h pour A > o et à o
pour h <. o sera donc l'espérance mathématique de ce joueur
à qui l'on promet a — mp quand y. > mp; c'est donc :
d¥ „
^ ~7~ — "'Pr .
F est un polynôme homogène et de degré m en o; et y ;
donc :
L'espérance mathématique ci-dessus devient :
dF dF (/F
X -r- — px PU ~r''
dx ^ dx ^ ^ dy
ou :
dF dV
en faisant x =: p, y =^ q^ après différentiation. On a d'abord :
/dF dF\
"^"^KTx-^jY
d'autre part :
— = w^-«-< + m(w — l)a;"'-î?/4- A-TT^ — rSa;?-'^;'"-?
dx ^ ' -^ ' ' 3 ! ;/i — S î '
dF
—-= mx'"-* -|- m [m — 1) x"'-'^y -\-
Il entre un terme de plus dans la somme qui représente
60 CALCUL DES PROBABILITES
^F. 1 . , , c?F clF ^ ., ^ , ^ ,
-r- , ce dernier terme représente -, -r-' et il est effal a
ax *" dx dy ®
^\ m — ^\ • x
et après qu'on y a fait a? =/>,?/= (7, il devient :
p^q
p ! m — ^ ! ^ ^ p
Pour l'espérance mathématique de notre joueur, nous
avons donc :
On y reconnaît le produit par p^, du terme z^p, le dernier
qui corresponde à un écart positif.
9. On promet à un joueur une somme égale à la valeur
absolue de l'écart : soit E son espérance mathématique, en
admettant qu'il ne doive être payé que si l'écart est positif,
E' en admettant qu'il ne doive être payé que s'il est négatif.
La valeur probable de h est E — E'.
La valeur probable du module de h est E -|- E'.
Comme la valeur probable de h est nulle :
E — E' = o,
et la valeur probable de [ h \ est 2E.
10. Ainsi la valeur probable de l'écart h considéré en
valeur relative est zéro ; la valeur probable de 1t? est mpq ;
celle de I /i I est 2E ou
28^ ^' pP^'"- P.
m
CINQUIÈME LEÇON 61
S correspond au dcinior terme pour lequel l'écart est
positif, et il difTère peu de mp.
A cette expression on peut sidjstituer la valeur approchée
^'^'"'J^lm-^l^'^'^'"'^'
Ce terme est beaucoup plus grand que tous les autres,
mais il est très petit.
La valeur probable de \ h \ est beaucoup plus petite que
vipq. Suivant une remarque déjà faite, le carré de la valeur
probable de \ h \ est plus petit que la valeur probable de
A- : donc la valeur probable de \ h \ est certainement plus
petite que sjmpq.
SIXIÈME LEÇON
1. Je vais montrer comment on peut connaître une valeur
approchée de ««, du terme maximum, de la valeur probable
de I A I , etc.
Le calcul de ces valeurs approchées se rattache à la for-
mule de Stirling.
On a :
: = r x"e-"dx = r (n -f- 1),
c'est-à-dire la fonction eulérienne; cette intégrale conserve
un sens quand n est positif, mais non entier. Si l'on pose
r (w -f- 1) = n"e-" v'^TT»,
le rapport du premier membre au second tend vers l'unité
quand n augmente indéfiniment.
Je ne donnerai pas la démonstration générale, mais seule-
ment pour n entier.
La formule de Stirling sert à calculer la factorielle d'un
nombre entier
n ! =: n"e~"-
\]l-Kn^
c'est une formule asymptotique. L'erreur absolue que l'on
commet en prenant le second membre comme valeur du pre-
SIXIEME LEÇON 63
mier augmente indt-rmiinciil avec », mais l'erreur relative
tend vers zéro.
Il en résulte que l'erreur absolue sur le logarithme de n\
tend vers zéro.
Je puis d'abord écrire :
n\ = n"e-'* sjn F («)
et je vais dénionlrer que F [ii) tend vers une limite finie et
déterminée C quand n augmente indéfiniment; de telle sorte
que l'on aura alors :
7i\ = Cn"e-" \/n.
2. Considérons le produit
F (2) F (3) F(n 4- 1)
F (1) F (2) '" F (n)
Ce produit infini est convergent, ou, ce qui revient au
même, la série, dont le terme général est :
^ F (n)
est convergente.
Nous avons
{71 -f 11! = (n-f- 1)"+' e-(«^i) ^,i ^ 1 F n -{- l]
F n -\- Il _ n 4- ^ • »"e-" \ n
Fin) "~ 7i\ (n -j- iji + ie-'" + ^^ \n -f 1
_ ^ + ^ n 4 /ZZT
, , 1
•'•^fr = '-KI)K' + .-)
64 CALCUL DES PROBABILITES
Le second membre se transforme à l'aide du développe-
ment de L (i -}- ^) en série :
V^ > ^.) U' ~" 9^2 + ôTâ ~" ■" )
ou:
1 l
2>i 3n2
_1 + _L_
c'est-à-dire
1 c),,2 T^
12^2
Si j'appelle m,j le premier terme de cette dernière série
— _L
€t:
limite nhc^ = — r^'
En vertu d'une règle de Gauss, cette série est convergente.
3. Reste à calculer la valeur de C.
Rappelons la formule de Wallis :
TT 2 2 4 4 2« 2n
2 1335 2w— 12^+1 '
on en déduit, pour n plus grand que toute quantité donnée:
2.4 ... 2n
\/ï=
2 1.3 ... (2n — 1) \j2n + 1
Au numérateur figurent les n premiers nombres pairs, au
SIXIÈME LEÇON 65
dénominateur les n premiers nombres impairs ; je multiplie
haut et bas par 2.4 ... 2w,
(2.4 ... 2»)^ _ 2^" (n ! ;^
2w ! V2n + i ~ 2w ! V2n~+1
Cette fraction a pour limite v/ ^ quand n augmente indé-
finiment. Si nous y remplaçons les factorielles par leur
valeur approchée pour n très grand, elle devient :
2^"n^"e-'^" C^n
ou
V 2w
(2w -f 1)'
, . . C
et, quand w grandit indéfiniment, elle se réduit a -^-
Wî'
Cette limite étant la même que la précédente, y ■^■> on a :
C = \/^..
4. Quand deux événements contraires, A et B, ont pour
probabilité respective p et ry, de telle sorte que p^q = \,
nous avons vu que, sur m événements, la probabilité pour
qu'il s'en produise a égaux à A et m — a égaux à B, est :
m
(X ! m — a !
I
Calculons une valeur approchée de u», en supposant m
très grand, et de plus
CALCUL DES PROBABILITES.
66 CALCUL DES PROBABILITES
OÙ :
2lv^ < 1.
mp
X \Jm est très grand quand m est très grand, mais nous
supposerons X fini et par conséquent l'erreur relative très
petite, quand on prend mp pour valeur de a, c'est-à-dire —
voisin
del.
oc
mp ~~
1 +
p\Ji
'n
On
a comme
conséquence
•
m — a =
mq
— À
\m.
puisque :
p-\-q = i.
Je remplace dans w» chaque factorielle par sa valeur cal-
culée à l'aide de la formule de Stirling.
m
niQ-m y/^Tt^i p^r/'"-"
a'='c-« \/27ra. [m — a)'«-«e-('«-a' ^2:: [m — a)
_ m"'p^q"^-'^ I m
^* " oc* (m — a)'"-« V 27ra(m — a)*
En réunissant les termes qui ont pour exposant a et ceux
qui ont pour exposant m — a.
\ a y \m — a/ y 27ra
[m — oc)
Or:
a [m — a) [mp -\- \ \Jm) [mq — 1 \jt
SIXIEME LEÇON 67
— tend vers l'unité ainsi que ; le radical qui entre
nip ^ mq ^
dans ?<a a pour limite.
s^>.
m
"iTzmp.mq sl-nmpq
Nous pouvons écrire :
1
LiUg. = L /- — aL — (7n — ai L
\2i:mpq 7np mq
ou :
1 — / X \
Lxg, = L ! — (mp + X \'m) L ( 1 -f- — ^ I
— {mq — X \Jm) L ( 1 — - -7- ) .
V q s'm/
Pour m très grand, nous pouvons développer les loga-
À X
rithmes de 1 + /— et de 1 — r= par la formule qui
p \m q s/m '
donne le développement de L '1 -{-00).
Ainsi,
dnp + X \/m) L (l -f- — ^ )
' \ * p s/m/
= {mp -\- X \/m) ( ~ — --^— 4- .7~. r= — *•• )
Je cherche en ce moment une valeur asymptotique de ??a,
c'est-à-dire une valeur telle que le rapport de m» à cette valeur
tende vers 1 quand m augmente indéfiniment; je pourrai
donc, dans le produit précédent, négliger tous les termes
qui tendent vers 0, ceux qui contiennent m ou \fm au déno-
minateur.
68 CALCUL DES PROBABILITES
Il restera :
A ym — - — h ~' ou ^ V^ + ^'
2p ' p 2p
J'en déduirai la valeur du produit :
(^ry - X \/m) L (l - ^ ^-)
en changeant dans le résultat précédent X en — X et p en ^7 ;
et la somme de ces produits sera, en définitive :
ou :
— I - 4- - h c est-a-dire :; —
2 \p qf 2pq
Ainsi :
T T ^ À2
sj'i^rnpq ^Vq
En repassant des logarithmes aux nombres, on aura
comme valeur approchée de Ug, :
e -P'i
sJ'i-Kmpq
Lorsque )n croît indéfiniment, le rapport de ?<« à l'expres-
sion précédente tend vers l'unité.
5. J'observe d'abord ce qui se passe pour le terme maxi-
mum.
Le maximum de te» s'obtient en donnant à a une valeur
SLXIÊME LEÇON 69
qui diffère très peu de mp\ alors X est nul, et la valeur du
1
terme maximum est /.
\J-li:mpq
Cette expression diminue avec m. 11 ne faut pas croire
que, si m augmente indéliniment, la probabilité attendue
s'approche de la certitude; au contraire, elle tend vers zéro.
C'est là le théorème de Bernotdlli, que nous préciserons
tout à l'heure.
6. Quelle est la probabilité pour que X soit compris entre
X et  4- dl?
Je considère dl comme très petit; (Ca \m est cependant un
A-
nombre entier, ce qui veut dire que cD. est de l'ordre de ^;--
Si je donne à X un accroissement très petit, l'exponentielle
ne changera pas, m» sera sensiblement constant.
La probabilité cherchée est une somme de termes tels que
a varie de (x à a + ^, a et x + A étant définis par :
t = mp -{- X \/H,
a-\- k = mp + fX + cD.) \Jm,
c'est-à-dire :
k = cCa s! m.
a doit être compris entre les limites :
a — mp
X + cVk ^ — r^ > X
c'est-à-dire qu'il doit être égal à l'un des nombres
a + 1, =c + ^2, ..., a + A.
70 CALCUL DES PROBABILITES
La probabilité totale est :
U(x+f -\- Wa + 2 -\- ... -j- Ma+ k-
Il y a A termes sensiblement égaux a u^; la probabilité
cherchée est :
ke 2m
ou, en remplaçant A par dl \m^
dXe'
,2l.
•2pq
sj^
m
7.
Nous sommes donc ramenés à
considérer,
en
posant :
-
h? =
1
2pg
'expression
suivante :
hdxe-
- A2x2
Elle représente la probabilité pour qu'une quantité x soit
comprise entre x ei x -\- dx \ pour qu'elle soit comprise entre
^Q et x^ , la probabilité deviendra :
-•a-,
hdxe - ''^^-
pour qu'elle varie de — oc à -|- oc
»+oc
hdxer2_^'
SIXIEME LEÇON 71
En posant hx = y, celte dernière intégrale se transforme
en :
C'est une intégrale connue, dont la valeur est 1.
8. Arrêtons-nous sur quelques conséquences de ce calcul.
La probabilité pour que l soit compris entre — oj et
-\- X est 1, ce qui paraît une tautologie. Cette conclusion
n'était pas si sûre: la formule dont nous nous sommes servis
était approchée, et vraie seulement si X est petit par rapport
à y/m»
Soit d'abord :
a = 772p -\- A \m,
la probabilité pour que À soit compris entre À^ et À, tendra,
d'après ce qui précède, vers :
quand m croîtra indéfiniment. D'autre part, quand À^ et 'k^
augmentent indéfiniment, l'intégrale tend vers l'unité.
Posons maintenant
a > mp (1 — e),
et -
a < mp (1 -|- e).
Soit F (s, m) la probabilité pour qu'il en soit ainsi. Je dis
72 CALCUL DES PROBABILITES
que je puis prendre m assez grand, t étant donné, pour que
la différence
1 — F (e, m),
soit plus petite qu'une quantité donnée yj. Choisissons
d'abord un nombre A assez grand pour que
1 — / -= e ^P<1
soit plus petite que ^- Cela est possible puisque l'intégrale
tend vers 1 quand X augmente indéfiniment. Une fois X choisi,
je prendrai m assez grand :
i'' Pour que
X < ep ym,
d'où:
X
F (e, m) > F ("-4=
\p \m
2° Pour que la différence :
? m 5
_3i
). v^-i^pfy
<1;
cela est possible, car, pour X donné, la limite de la proba-
bilité
est représentée par l'intégrale /
pour m = <xi
+ x
SIXIÈME LEÇON 73
On aura alors :
1 — F (e, m) < 71.
En résumé :
La probabilité pour que a soit compris entre mp
(1 — e) et nip (1 -|- SI, quelque petit que soit s, tend
vers l'unité quand m augmente indéfiniment.
9. On peut se demander quelle est la valeur probable de
x" ; ce sera par définition
/ hx'^dx ,., „
OC V
r.
Si n est impair, cette intégrale est nulle.
Si n est pair, elle vaut :
,^ / hx"dx ., „
0 V^r
Nous avons cherché la valeur probable de l'écart en valeur
absolue ; cherchons la valeur probable de la valeur absolue
de x'\ \ x'- \ . C'est
A I a;" 1 dx
■ /l2x2
La fonction sous le signe / est paire ; cette intégrale vaut
donc
2 / '-r^e-/r..^
0
10. Ainsi, dans tous les cas, nous sommes ramenés à cette
74 CALCUL DES PROBABILITES
intégrale, qui se ramène elle-même aux intégrales eulé-
riennes.
Posons
h^x^ = y,
d'où :
_i
'2 "
hdx — xy ^ dy.
L'intég-rale ci-dessus devient
) / 1 dy y '-^ ;
1 n
ou :
n - 1
"?/ y ^ ^
C'est l'intégrale eulérienne :
Si n est pair et égal à 2[j. :
et comme :
a valeur probable de | a? ' | est :
\_ i.3...(3;/. — 1)
A" 2!^
SIXIÈME LEÇON 75
Si n est impair et égal à 2a +1, la valeur probable de
I X" I est :
ou :
-El-.
Faisons n = o, la valeur probable de ] 1 | est égale à 1.
1
Faisons n = 2, la valeur probable de | œ'^ | est — -^•
Nous avons cberché la valeur probable de (a — irip)'^ et
nous avons trouvé mpq. Ici nous cherchons la valeur probable
de X^, c'est-à-dire du carré de r=^' ce doit être pq.
\m
Cela se vérifie sans peine, puisque :
1
La valeur probable de | a; | est —'
h Vît
Nous avons cherché la valeur probable de | a — mp \ ;
c'est le produit par 2mp</ du terme maximum de ÏWa, ^mpqua.,
où a diffère très peu de mp.
Pour calculer ce terme maximum il suffit de faire À = o,
on trouve
\I^-Km2jq
Donc la valeur probable de | x — mp \ est ^ , c'est-à-
sJ'^Tzmpq
j . \l^mpq
dire -î^ — —■•
On en déduira la valeur probable de X en divisant par \lm ;
on trouve :
h\l%
SEPTIÈME LEÇON
1. Nous avons posé
a = mp -j- X \lm^
et nous avons cherché la probabilité pour que X soit compris
entre deux limites X^ et >^ ; cette probabilité est représentée
pour m très g'rand par l'intégrale suivante :
^ e 2m ^X.
Nous avons été conduits ainsi à rechercher ce qui se passe
lorsque la probabilité, pour que x soit compris entre .x^ et x^ ,
est représentée par l'intégrale
Je dirai, pour abréger, que la loi de probabilité est nor-
male^ lorsque la valeur de la probabilité est représentée par
cette intégrale.
Je suppose que x soit positif; la probabilité devient :
1
c'est-à-dire ;;•
2
SEPTIÈME LEÇON ^7
Si je considère :
Q—h-ix-i clx,
celte intégrale ira constamment en croissant quand a;„
augmente de o à -f x , puisque tous ses éléments sont posi-
tifs. Klle atteint en particulier la valeur -•
1
La quantité x^ pour la({uelle elle est égale a - est ce qu on
appelle l'écart probable. La probabilité est la même pour
que I a; I atteigne ou n'atteigne pas cette valeur.
Xq est proportionnel à - • et les tables calculées pour cette
intégrale permettent d'en trouver la valeur.
Soit X une quantité dont la loi de probabilité est normale.
1
La valeur probable de x est — p-
1
La valeur probable de x- est ^r^-
La loi de probabilité de 'xx est encore normale.
Posons a.r = x' ; la loi de probabilité de x' est:
— ^ e ^ dx .
et il suffit de poser h' — -•
La valeur probable du carré de a.t; est —^^
2. Supposons que la probabilité pour que x soit comprise
78 CALCUL DES PROBABILITES
entre aj^ et x^ est exprimée par l'intégrale :
I -j= e- ''^^•■-' dx,
et que la probabilité pour que y soit comprise entre î/,, et y^
est exprimée par l'intégrale:
Supposons en outre que ces deux quantités sont indépen-
dantes, ce qui peut se traduire par les termes suivants: la
probabilité pour que la première soit comprise entre x^ et
x^ est indépendante de la probabilité pour que la seconde
soit comprise entre y^ et y,.
1 1
La valeur probable de x~ est tctt.^ celle de v^ ——•
Quelle est la probabilité pour que le point, dont les coor-
données seraient x et y, soit compris à l'intérieur d'une aire
donnée ?
Occupons-nous d'abord d'une aire rectangulaire.
La probabilité pour que le point xy tombe à l'intérieur du
rectangle, c'est-à-dire pour que les deux systèmes d'inéga-
lités
â/i\ <^ CO *\ OC I
y(s<y <yK
soient satisfaits à la fois, est représentée par la double inté-
grale suivante, étendue à tout le rectangle :
— e-Wx2-A'2y2 fXxdy.
SEPTIÈME LEÇON 79
Si l'aire est quelconque, je la découpe en rectangles infi-
niment petits. La probabilité totale sera la somme des inté-
grales doubles relatives à ces rectangles élémentaires, ce
sera en définitive l'intégrale double étendue à tous les élé-
ments de l'aire.
3. Supposons maintenant que Ton ait :
x-{-y = z.
La probabilité pour que z soit compris entre ^^ et z -f- dz
est celle pour que le point y
[x, y) soit compris entre
deux droites parallèles infi-
niment voisines ; la proba-
bilité cherchée sera celle
qui est relative à cette aire
infiniment petite.
Je vais décomposer cette
aire infiniment petite en élé-
ments.
Fk;. 1.
Pour cela je partage l'axe des x en une infinité d'éléments,
et par les points de division je mène des parallèles à l'axe des
j) y ; j'obtiens ainsi une infinité de petits parallé-
logrammes : quelle est l'aire de l'un d'eux, ABCD r*
Les points A et B sont sur la droite
FiG. 2
x-^y = z\
les coordonnées de A sont x ei z — x, celles de B, a; -]- dx
ei z — X — dx.
Les points C et D sont sur la droite :
X -\- y ~ z -\- dz\
80 CALCUL DES PROBABILITES
les coordonnées de D sont x et z -\- dz — x\ celles de C
X -f- dx, et z -\- dz — x — dx.
L'aire du parallélogramme est dxdz.
L'intégrale double sera la somme des éléments relatifs à
chaque parallélogramme :
dxdz — Q-mx'i—Ki{z-xyi.^
71
Dans une première intégration :
y qX. z doivent être regardées comme constantes et x varie
de — 00 à -}- 00 .
L'intégrale est donc :
■hv /.+ao
dz—\ e-'^^^''-'^n-^-x)-^dx.
Posons :
P = h^x^ + h'-^ {x — z)\
c'est-à-dire :
P = (/l2 _|_ h'-i^ ^2 _ 2//2^^ -p h'^z-\
ou :
P = (ax — hf -f- c
en posa
nt :
a
—
\]h^
+ h'\
h
h'^z
a
1
c =
h'
2^2 _
-b^.
Nous
avons
à
évaluer
I
e— p dx
SEPTIÈME LEÇON 81
OU :
ÇQ-{ax-b)-i-c clx.
Posons :
ax — b = \\
celte intégrale est :
/ a
et comme a; ou ; varie de — x à -}- x ,
a
La probabilité cherchée, pour que s soit compris entre z
et ^ + clz^ est donc :
, hh' (?-'■
dz •
7c a
On a d'autre part :
c = h'^z-'
h' -\- h'- A2 -\- h'-i
La pi-obabilité en question est donc :
, hh' e ''i^ + t<^^
dz :•
La loi de probabilité est normale.
La valeur probable de z- ou de (^-f~ yf sera :
1 1 1 .
CALCUL DES PROBABILITÉS.
82 CALCUL DES PROBABILITES
c'est-à-dire que la valeur probable de [x -f- yf est la somme
de la valeur probable de x- et de la valeur probable de y"^.
La valeur probable de 'ixy est en effet nulle ici, et nous
nous ne l'aurions pas su a priori, si la loi de probabilité
n'avait pas été normale.
Cette élégante démonstration est due à M. d'Ocagne.
4. Problème des épreuves répétées. — Deux événe-
ments contraires, A et B, ont pour probabilité respective
p et q. Ainsi une urne contient a boules blancbes et v boules
noires,
p =
-f- V [^ +
on en tire un très grand nombre de boules m, en remet-
tant chaque fois la Ijoule sortie dans l'urne. Si l'on a tiré a
boules blanches, il y a beaucoup de chances, d'après le théo-
rème de Bernouilli, que — diffère peu de l'unité.
^ mp
La valeur probable de X^ sera égale à pq.
Changeons un peu les conditions, de manière que le
hasard ne préside plus seul à la distribution des coups. Con-
sidérons deux urnes, la première renfermant [x boules
blanches et v noires, la seconde u.' blanches et v' noires, et
convenons de tirer alternativement dans l'une et dans
l'autre.
Après un très grand nombre, m, de tirages, % blanches
sont sorties et m — tx noires. — sera très voisin de p qui est
m
ici égal à :
1 a ,1 ji."
2 a + V "^ 2 |x' + v'*
SEPTIÈME LEÇON 83
Mais la loi des écarts sera-t-elle la même? Il ne peut en
être ainsi.
Supposons que la première urne ne renferme que des
blanches, la seconde que des noires : nous aurons tiré —
blanches et — noires. — sera ée-al à - ' et l'écart sera nul,
p étant aussi -• La valeur probable de À^ sera zéro; elle
devrait être égale à - » car :
1 1 1
^^=2^2 = -V
La loi des écarts n'est donc pas la même.
5. Je veux montrer que, si une autre cause que le hasard
intervient, l'écart probable (ou la valeur probable de À') sera
plus petit que si le hasard seul avait agi.
Les m. épreuves forment deux catégories, l'une de fim,
l'autre de p'm épreuves, et l'on a :
p -f 8' = 1.
Supposons que les événements A et B aient respective-
ment, pour probabilités, p et q dans la première catégorie,
jo' et q dans la seconde.
L'événement A se présente a fois dans la première, a.' fois
dans la seconde ; B se présente ^m — a et fl'm — % fois.
Le nombre total des épreuves favorables à A sera a -{- ac' ;
OC oc
a sera très voisin de S»?», et ac' de S'm»'; ;: et —, , s'écar-
^ 'imj> \i mp
teront très peu de l'unité; et -f- a' sera très voisin de
pmp 4- ^'tnp'- c'est-à-dire que l'écart sera de l'ordre de
84 CALCUL DES PROBABILITES
grandeur de y^m, de sorte que la répétition des événements
sera à peu près la même que dans une seule série d'épreuves,
où les probabilités de A et de B seraient respectivement :
Sp -\- p'p' et S7 + f^'q'.
Cherchons la loi des écarts. Je vais poser :
a = p?np -{- X \/<^m
a = p'mp' -{- X' s/i^'m.
Pour l'épreuve totale, ce serait :
a 4- a' =: m (^p + (i'p') + X" \Jm,
PP ~\~ P'P étant la probabilité de A dans Tensemble des
épreuves.
Il s'agit de calculer la valeur de X"-. D'une façon générale,
elle est égale à pq. Si. le hasard agissait seul, ce serait ici :
(3p + py) (8g -f P'q').
Cherchons sa véritable valeur :
X" \'m = X \/pm-\- X' \'(i'm,
ou :
Les deux événements sont indépendants : la probabilité
pour que X soit compris entre deux limites données est indé-
pendante de la probabilité pour que X' soit compris entre
deux limites données. Les lois de probabilités de X y/ fi et X' \'fi>
seront normales, et la loi de probabilité de leur somme
X vp -}- X' v^8' sera aussi normale.
SEPTIÈME LEÇON 85
La valeur probable de À"^, (X"^), sera :
(X"2| = p (X-^) + p' (X'2) = ^pq + p'p'</.
Telle sera la véritable expression de la valeur probable
du carré de l'écart.
Comparons les deux valeurs ; la différence est :
(3p + p'p') [pq -I- fiVy') - {^pq -\- Pp'q'),
ou, eu rappelant que (i -\- 'i' ^ \,
{^p + b'p') (Sry + r^'q) - (bpq -\- p'p'q') (8 + 3'),
c'est-à-dire :
^^' {p'ï -f p'î — i^Y — p'9)
ou :
Or :
p^'(p_p')(,/_^).
P — P
La différence envisagée est donc positive.
6. On utilise cette propriété dans la statistique. On a
relevé des observations dans un tableau, et on veut voir si
les différences observées sont dues au hasard, ou si le
hasard n'intervient pas seul.
On compare, pour un certain nombre de cas, le rapport
des arrivées de A à celles de B, et on calcule la loi de répar-
tition des écarts.
On répète cet examen sur plusieurs séries, et on observe
si la loi des écarts suit bien la formule. Si une loi indépen-
dante du hasard existe, elle agit toujours dans le même
sens.
HUITIÈME LEÇON
1. Nous avons cherché la valeur asymptotique pour m
très grand, du terme :
■}n !
a ! m — a ! ^ ^
en supposant :
0. =: ?np -|- X v^?î.
Cette valeur asymptotique de u^. est :
e ''P'i
Je pose a r=: w£ ; £ diffère de p, et je cherche la valeur
asymptotique du terme correspondant. On a:
1 = [z — p) \Jni.
On pourrait donc être tenté de croire que la valeur asymp-
totique est :
— m (c — ff)2
e ~PQ
sj'i-nmpiq
mais cette expression est inexacte.
Nous avons supposé qu'on pouvait négliger des ternies tels
HUITIEME LEÇON 87
que y=^ 1 étant fini et s tn infiniment grand. Nous allons
V m
chercher à former l'expression correcte du ternie cherché.
La valeur exacte de u^ est :
m !
a,,//i— a
a . m — a ;
Si m et a sont très grands, l'expression asymptotique de
Ma est :
m"'e-"' V 2twÏ „ „ „
= ^ — pat<y>w-a
a*e-=' \ ^Tra . (w — a)'"-* g- ("'-*) \±r. [m — a)
Le rapport de ces deux expressions de u^ tend vers Tunité
toutes les fois que w et m — a augmentent indéfiniment, et
que Ion a
a = £/W,
e tendant vers une valeur finie.
Je vais simplifier Texpression asymptotique de Wa :
m
a* (m
— a)'"-« V 2:ra (»w — a) ^ ^
Soit a = z'in ; je pose :
m — a =: s'/n,
d'où:
e' = 1 — e.
L'expression asymptotique devient :
88 CALCUL DES PROBABILITES
et, comme m'" = ?n'"^ X »'t"^^ '■
'int J \me.' J y '^■Kmtt'
Soit
alors
!*î
A
t'a =
2. Nous avions trouvé, pour expression asymptotique
de Ua,
-IL
e -P^
Si nous avions donné à X la valeur (e — p) sjm,
'Ipq
y^Tzjnpq
Ce n'est pas le même nombre constant qui est élevé à la
puissance m dans les deux expressions, et je dis que A est
toujours plus petit que 1 .
e, t' restant constants, je fais varier p et q^ en les laissant
liés par la relation :
p-f <7 = 1.
Quel est le maximum de A ?
Ce maximum a lieu quand ]fq^ est maximum, c'est-à-dire
quand p et 5' sont proportionnels à leurs exposants :
£ _ i _ PjrJI _ X
e e £ + e
HUITIÈME LEÇON 89
Ainsi le niaximum sera atteint quand
et alors
A = l.
Le raisonnement suivant nous fera d'ailleurs mieux con-
naître les variations de A.
3. Je vais supposer p et ^ constants et faire varier e et e'.
Pour cela, je considère
A p q
Comment varie ce nombre? Je prends sa différentielle
totale
rfe L - + fW L - + rfs + ch'\
P '1
elle doit s'annuler pour qu'il y ait maximum. Mais e, t ne
sont pas indépendants.
dt +■ d=J = o
Donc :
p Q
P q p-\- q
Le maximum sera atteint pour
£ = p, £'='?,
et ce maximum sera égal à l'unité.
Comment variera A? Je fais e = o, A est égal à ç; je fais
e = 1, A est égal à p.
90 CALCUL DES PROBABILITES
A part de q^ croît jusqu'à 1 pour e = p, puis décroît
jusqu'à p.
4. La formule qui donne une valeur approchée de n ! est :
n ! = n"e~" \Jn F (w).
F [n) tend vers une limite, V'^t, quand n augmente indé-
finiment.
n + 1! =(n+ 1)" + ' e-"' + ') Vw -f 1 F (n-j-1)
On en tire :
F (n -f 1)
)" ' V'-r
F {n) \n -\- Ij V w + 1
Il s'agit de savoir si F [n] va en croissant ou en décrois-
sant avec w, c'est-à-dire si le logarithme du premier membre
est positif ou négatif.
1
Je divise le second membre par n -|- -; il reste :
" + ï
0+^)
1
Je pose 7) =: — et je considère la fonction
{
? i^) = ï î — L (1 + ^').
c'est-à-dire
x'^ ^
'2x
HUITIKME LEÇON 91
<p {x) est-il posilil" ou néf^atil' x varie de 0 ii 1.
2
Pour a; == 0, 5 (o) = o; pour a; = 1, ;. (1) = q — L2.
Comme L2 = 0,69 , cp (1) est négatif.
Il faut voir si la dérivée s'annule :
2 (a; 4- 2) — 2a; 1
[x + 2)--« a; + 1
*? 1^- ~ (07 + 2j2 iC + 1 ~ (07 4- 1) (£C + 2j =
Le dénominateur est toujours positif; le numérateur est
égal à — x^. ^' (x) est toujours négatif, par conséquent f(x)
décroît; donc elle reste négative et
Si :
et l'on a :
c'est-à-dire :
On a aussi
F (« 4- 1)< F in)
1 =e-' F (1)
F (l) = e.
F (x) = v"2^.
F(n) va toujours en décroissant, mais la décroissance n'est
pas très grande, car
e = 2,8 et \^. = 2,3. ...
5. Ecrivons la valeur de «a '■
m'" „ ^ ^ / f^ F (''w)
_ ^m-x 11 y 3^ („j — a) F (a) F (//« — a)
92 CALCUL DES PROBABILITES
Il s'agit de trouver une limite supérieure de cette expres-
sion. D'abord
F [m) < F [m — a),
donc :
F im) 1
<
F (a) F (m — a) F (a)
Or pT^- est lui-même plus petit que"^; la valeur asymp-
totique de m» est en même temps une limite supérieure.
6. Quelle est la probabilité pour que a soit plus petit que
tm ?
Cette probabilité, II, est :
n = wq + ^u + ••• + "p.
avec :
|3 < £?;i, P + 1 ^ t)n.
Je suppose :
t < p.
Je vais d'abord écrire.:
p -f- 1 =z em.
Uq, k,,... up vont en croissant.
n<«p+, (p + 1).
Nous avons une limite supérieure de u^ + ^•, si donc
8 + 1 zzz em,
„ A'"em
n < i
HUITIÈME LEÇON 93
OU :
Soit maintenant :
P + 1 > em.
Alors :
n < wp (8-I-1)-
Il s'agit de trouver une limite supérieure de up; je pose :
A = cp (e).
Si -^ était éffal à e, on aurait :
m "
"? < h Ci)] " n/îs
!zB (m — ^)
Or A est une fonction de e qui va en croissant avec e
jusqu'à £ = p. el 9 ^s) > o (^^j-
Comme il s'agit d'avoir une limite supérieure,
, , / m
D'ailleurs ^ est supérieur à em — 1 :
fj > em — 1, m — p > s'??? — 1.
Donc :
MS < A''
s/^
[em — 1) [t'm — 1)
Pour en revenir à n, inférieur à ur^i (S 4- 1), nous remav-
94 CALCUL DES PROBABILITES
querons que [i -f- 1 est lui-même inférieur à tm -f- 1 ; et nous
arriverons finalement à une formule un peu plus compliquée
que pour em entier :
tm entier, 11 < A'
I tm
un non
entier, n < A'" \/ r-y =^j--^^ tt
V 27t {=m — 1) (e m — 1)
Ainsi :
La probabilité pour que a soit plus petit que ew, si e est
plus petit que p, est toujours inférieure à l'une ou l'autre
quantité que nous venons de calculer ci-dessus.
Cette probabilité tend vers zéro quand m croît indéfini-
ment, pourvu que e < p. C'est le théorème de Bernouilli,
qui peut s'énoncer encore ainsi :
La probabilité pour que a soit compris entre mp(l — 6)
et mp(l -|- ô) tend vers l'unité quand, 6 restant constant,
m croît indéfiniment.
7. Nous avons été amenés à considérer un nombre très
grand de cas possibles, mais ce nombre restait fini. A cer-
tains moments, nous avons envisagé des questions de limites
et remplacé les S par des •
Nous allons arriver aux problèmes où le nombre des cas
possibles devient infini.
Il faut bien définir ces cas, et un paradoxe de M. Ber-
trand mettra bien en évidence le genre spécial d'erreurs que
ces problèmes peuvent entraîner; il s'agit de la question
suivante :
Quelle est la probabilité pour qu'une corde d'une circon-
HUITIÈME LEÇON 9o
férence donnée soit plus grande que le côté du triangle
équilatéral inscrit?
M. Bertrand traite le problème de deux manières, et les
résultats sont absolument op-
posés.
Soit AB la corde ; nous
prendrons le rayon OA comme
unité, les coordonnées polaires
de A seront 1 et 'd.
Soit 'j. l'angle AOM , OM
étant la perpendiculaire abais-
sée du centre sur la corde, P
le point où cette perpendicu-
laire rencontre la courbe et M le milieu de la corde.
L'angle POo-, ou 0, est égal à a -|- «).
FiG. 3.
8. Premier raisonne inenl. — Le point A peut se trouver
en n'importe quel point de la circonférence. La probabilité
pour que c.j soit compris entre co^ et w, est proportionnelle à
la différence
Le point A déterminé, la corde peut
prendre toutes les directions possibles, c'est-à-dire que, A
étant choisi, je puis faire prendre à a toutes les valeurs
possibles entre'O et -^
La probabilité pour que a soit compris entre a^ et a, est
proportionnelle à a, — ocq. Si AB était le côté du triangle
équilatéral inscrit, % serait égal à 60°.
Comme a peut prendre toutes les valeurs de 0° à 90°, la
probabilité pour que la corde soit plus grande que le côté
96 GS.LGUL DES PROBA.BILITES
du triangle est :
900 _ epo _ 1
900 _ O» ~ 3*
9, Deuxième raisonnement. — La corde peut avoir une
direction quelconque. La probabilité pour que 0 soit compris
entre 0^ et 6^ est proportionnelle à 0, — 0^.
Cette direction une fois choisie, je trace OP : la droite AB
sera définie quand je connaîtrai le point M, c'est-à-dire la
distance OM = p = cos a.
p peut prendre toutes les valeurs de 0 à 1 ; on doit admettre
que la probabilité pour qu'il soit compris entre Pq et p, est
proportionnelle à p, — p^.
Si OM est compris entre 0 et -< la corde est plus grande
que le côté du triangle.
1
La probabilité sera donc •
Pourquoi cette contradiction ? Nous avons fait des hypo-
thèses difl'érentes dans les deux cas, nous avons défini la
probabilité de deux manières différentes.
10. D'une manière générale, on demande de définir la
probabilité pour qu'un nombre x soit compris entre x^ et x^ :
en général, nous pouvons dire que nous n'en savons rien du
tout.
Cette probabilité doit dépendre de Xq et de x^ : ce sera
donc une fonction telle que P {xq, x,).
Si nous cherchons la probabilité pour que x soit comprise
entre x^^ et X2,
Xq <c. x^ <c Xij^
en vertu du principe de la probabilité totale, cette probabi-
HUITIÈME LEÇON 97
lité sera :
P (iCo. X.;,) = P (o^o, a;,) + P (a;^, x^).
Si:
x.^ = -^'i -{- C?«^( 1
on a :
P (a;.,, X,) - P {x„ 0-,) = P (.^0- ^. -h ^^.)-
Cette probabilité sera infiiiimeiit petite, et, en divisant par
dx^ , elle ne dépendra que de «;^ .
On aura donc dans tous les cas :
P{x^,Xi) = o {x) dx.
Mais nous ignorons la nature de cp (x) qui reste arbitraire :
il faut nous la donner au début du problème par une conven-
tion spéciale pour qu'il ait un sens.
De même, la probabilité pour que le point {x^i/) soit à l'in-
térieur d'une aire donnée est :
Il cp {x^y) dx dy,
l'intégrale double étant étendue à tous les éléments de l'aire ;
mais nous ne connaissons pas s [x,y) .
Le mathématicien n'a plus aucune prise sur le choix de
cette hypothèse; mais il doit, une fois qu'elle est choisie,
porter son attention à ne pas en faire une autre ({ui la con-
tredise.
11. L'on peut avoir plusieurs paramètres x^,x.2y..^, Xp.
L'intégrale d'ordre p,
1 z, {x^,x.;^, ... Xp) dx^ (/tTo ... dx,,^
CALCUL DES PROBABILITÉS.
98 CALCUL DES PROBABILITES
définira alors la probabilité pour que les paramètres x satis-
fassent à certaines conditions, quand la fonction cp eU
définie; il n'y aura qu'à étendre l'intégration à toutes les
valeurs des x qui satisfont aux conditions données. Mais
cette définition n'aura de sens que quand on se sera donne
la fonction cp par une convention préalable.
Je suppose qu'on change de variables et qu'on prenne
2/n y %•,••• -l'y p 'i l'intégrale va se transformer en
à l'aide du jacobien ou déterminant fonctionnel des x par
rapport aux y.
Cette nouvelle intégrale multiple est entièrement déter-
minée ; on étendra l'intégration aux limites des y qui corres-
pondent à celles des x, et qui sont connues, puisqu'on con-
naît les relations qui lient les x et les y.
12. Appliquons ceci au paradoxe de M. Bertrand.
Dans la première manière de raisonner, les variables
étaient co et a, dans la seconde 0 et p.
Dans la première manière, la probabilité pour que w fût
compris entre coq et w^ était proportionnelle à w, — co^ ; pour
que a fût compris entre t^ et a^, elle était proportionnelle à
a, — ag.
Cette probabilité se représentait par
di» d%
If'
étendue à tous les systèmes de valeurs de w et a qui satis-
faisaient à ces conditions.
HUITIEME LEÇON 99
Dans la seconde manière, nous avons supposé que 0 et p
pouvaient prendre toutes les valeurs possibles avec une
égale probabilité, et nous avons représenté la probabilité
cherchée par
c/0 dp
ff^
Ces deux hypothèses ne sont pas les mêmes, comme nous
l'avons déjà constaté directement. Ciierchons le déterminant
fonctionnel ; on a :
dp = — sin a da. ; c/0 = dia -f- dx.
Ce déterminant
0 — sin
1 1
est égal à sin a. Donc la deuxième intégrale est :
1 sin a dw dx,
ce qui n'est pas la même chose que la première.
13. Autre exemple. — Soit une droite AB, dans un plan ;
1 1
ses coordonnées tangentielles sont- et -«La probabilité pour
que a ei b prennent toutes
les valeurs comprises entre
certaines limites peut être
par une première conven-
tion représentée par :
ffda bd,
Fid. 4.
où è = a tg w, si w est l'angle de AB avec Ox.
400 CALCUL DES PROBABILITES
On peut aussi dire : to peut prendre toutes les valeurs
possibles ; d'où pour la probabilité
//
da du
Ce n'est pas la même chose, et cette seconde convention,
qui, après un examen superficiel, pourrait sembler aussi
légitime que la première, est en contradiction avec elle ; en
(i
effet, le déterminant fonctionnel est — tt-i et
cos^'œ
II
da db ^= Il — da do
} / COS- 0)
DEPARTMENT OF MMH£MM>CS
UNWERSnV OF TORONTO
NEUVIÈME LEÇON
1. On partage un bâton, do longueur 1, en trois parties
X, y, z.
X -\- y -\- 3- — : 1 .
La probabilité pour que x soit compris entre x q\x A^ dx
sera par définition proportionnelle à dx\ entre aj^ et a-,, à
X^ X'q.
La probabilité pour que y soit compris entre y^ et y^ sera
proportionnelle à ?/, — y^, etc.
La probabilité pour que x et y satisfassent à certaines posi-
tions est l'intéo-rale
Jj dxdy
étendue à toutes les valeurs de a; et de ?/ qui satisfont à ces
positions.
Cette probabilité serait aussi
/ / dxdz,
et aussi
JJdydz,
puisqu'on peut prendre x et z, ou l)ien y et z comme variables.
102 CALCUL DES PROBABILITES
Ces trois définitions sont ici équivalentes, on a
jj^* =£/;.* g^
et le déterminant fonctionnel est bien égal à 1.
z = \ — X
y-
2. Quelle est la probabilité pour que x, y ei z forment un
triangle ?
Traçons un triangle équilatéral dont la hauteur soit 1 : d'un
point M, intérieur à ce Iriangle, abaissons des perpendicu-
laires sur les trois côtés. La somme
des trois longueurs ainsi obtenues sera
égale à la hauteur du triangle, c'est-à-
dire à 1 ; elles repré-
senteront les trois
morceaux, x, y, z, du
bâton.
Le point M peut être considéré comme représentant le
mode de division du bâton : quelle est la probabilité pour que
ce point soit à l'intérieur d'une certaine aire ?
La probabilité pour que x soit comprise entre x eix-\- dx^
et pour que y soit comprise entre y çX y A^ dy, est propor-
tionnelle à dxdy. Le point M sera alors dans une aire con^-
prise entre deux parallèles à BC menées à des distances x et
œ -\- dx àe BC, et deux parallèles à AC menées à des dis-
tances y ei y -{- dy de AC. Le parallélogramme ainsi formé
Fu
FiG. 6.
NEUVIEME LEÇON
103
a pour angles 420 degrés et 60 degrés, et son aire est
dxdy
sin 60°
La prohabilité sera, dans ce cas, proportionnelle à l'aire du
parallélogramme; et, en général, elle sera proportionnelle à
l'aire envisagée.
Le point M devant être à l'inlérieur du triangle ABC, la
probabilité pour qu'il soit à l'intérieur
d'une certaine aire est le rapport de
cette aire à la surface du triangle.
Joignons par des droites les milieux
A' B' C des côtés du triangle. M doit
être à l'intérieur de A' B' C pour
qu'on puisse former un triangle avec
a;, ?/, z \ si le point M est sur l'un des côtés de A'B'(], Tune
des équations suivantes est satisfaite:
z = x-\- y,
y + ^.
y
X -\- z\
si le point M est en dehors de ABC, l'une des trois gran-
deurs x,y^ z est plus grande que la somme des deux autres.
La probabilité pour que l'on puisse former un triangle
1
avec x^ y, z est donc -•
3. Problème de l'aiguille. — Sur une feuille de papier,
sont tracées un certain nombre de droites parallèles et équi-
distantes ; leur distance commune est d^ et l'on jette au ha-
sard sur la feuille une aiguille également de longueur d.
Quelle est la probabilité pour que cette aiguille rencontre
l'une des droites?
104
CALCUL DES PROBABILITES
La question peut se poser d'une manière plus générale.
Soient deux axes fixes ox^ oy, et une fîg-ure fixe F invaria-
blement liée à ces axes.
<— O^.
FiG. 8.
Soient d'autre part deux axes mobiles OX, OY, et un
figure Fj invariable de forme, mais invariablement liée à ces
axes, et par conséquent mobile avec eux.
Définissons la position de la figure mobile par rapport
aux axes fixes.
FiG. 9.
Soit M un de ses points, MP une droite passant par M et
invariablement liée à la figure V ^ : il suffît de définir la posi-
tion de MP par rapport à xoy. Cette position est définie par
NEUVIÈME LEÇON 105
les coordonnées xy du poiiil M et lanyle to de MP avec ox.
La probabilité pour ([ue M satisfasse à certaines conditions
est proportionnelle à
/ // clxdydM.
Pour justifier cette définition, je vais montrer qu'elle est la
même quand je prends un autre point M' delà figure mobile,
ainsi ([u'une autre droite M'P'.
La droite M'P' sera invariablement liée à MP.
Soient / la longueur MM', a l'angle de MM' avec MP et p
l'angle de M'P' avec MP : /, a, p sont des constantes.
La droite M'P' est définie relativement aux axes xoy par les
coordonnées x'y du point M , et l'angle w' de M'P'avec ox.
Si la probabilité pour que la figure mobile satisfasse à cer-
taines conditions est, d'après la première évaluation,
/ / / dxdydiM,
elle sera aussi :
/ / / dx'dy'dM .
Le déterminant fonctionnel est en effet égal à l'unité; on a,
par projections,
X ■^= X -\- l COS ('(0 -f- 3t)
y' = y ~\- l sin Uo -f- x)
to r= oi -j- S
et le déterminant fonctionnel \ , ! est :
c ix,y,(i>)
l 0 — l sin (m -j- a)
0 1 ^ COS (co + y.)
0 0 1
c'est-à-dire 1.
106 CALCUL DES PROBABILITES
La loi de probabilité est donc la même, quelle que soit la
droite MP choisie.
4. Si je considère deux figures cp, 'f', égales entre elles et
invariablement liées aux axes
mobiles, la probabilité pour que
^' satisfasse à certaines condi-
tions est égale à la probabilité
pour que tp satisfasse aux mêmes
conditions. Considérons une
droite MP invariablement liée à
(f et une autre droite M'P' dont la
FiG. 10. ... t ' f ^ 1
position par rapport a f est la
même que celle de MP par rapport à cp ; soient ir, ?/, w, d'une
part, sc\ y\ w', d'autre part, les quantités qui définissent la
position de ces deux droites.
La position de <y est définie par x, y et oj; celle de ^', par
x\ y', co'. Pour que cp satisfasse à certaines conditions, œ, t/, to
devront satisfaire à certaines inégalités. Pour que cp' satis-
fasse aux mêmes conditions. x\ y\ co' devront satisfaire aux
mêmes inégalités. A la dilïérence près des notations, on re-
tombe donc sur la même intégrale.
La valeur de la probabilité est donc la même dans les deux
cas.
5. On demande la probabilité pour qu'un segment de droite
limitée, MP, rencontre les parallèles du problème de l'ai-
guille. Si une seconde droite, M'P', de même longueur, est
invariablement liée à MP, la probabilité pour qu'elle rencontre
les parallèles sera la même.
Si, au lieu de MP, on considère une droite deux fois plus
NEUVIÈME LEÇON 107
long'ue, MQ, la probal>ililt' sera doublée, puisqu'elle secoui-
pose de deux droites égales à MP, à savoir MX et NQ, X étant
le milieu de MQ.
Je suppose qu'on promette à un joueur autant de francs
qu'il y aura de points d'intersection de la droite avec les
parallèles ('). T/espérance niatliéiuatique du joueur avec MQ
sera double de son espérance avec MN, puisqu'elle sera
celle qu'il tire de MX augmentée de celle (ju'il tire de
NQ. En général, elle sera proportionnelle ii la longueur de
la droite.
Si NQ n'est pas dans le prolongement de MN, l'espérance
mathématique est encore doublée. L'espérance mathéma-
tique est donc proportionnelle à la longueur totale de la
ligne, qu'elle soit droite ou brisée, ou même, en allant plus
loin, quelle que soit sa forme.
Si on promet autant de francs que de points d'intersection
de la courbe avec les parallèles, l'espérance mathématique
sera ainsi proportionnelle k la longueur de la courbe.
Si la courbe est une circonférence de diamètre f/, sa lon-
gueur sera -kcI; dans ce cas il y aura toiijours deux points
d'intersection, l'espérance mathématique sera donc 2. Pour
une courbe de longueur s, cette espérance sera ~-\\ pour une
droite de longueur f/, —
6. Revenons sur le paradoxe de M. Bertrand, la probabi-
lité pour qu'une corde d'une circonférence soit plus petite
que le côté du triangle équilatéral inscrit.
Traçons une circonférence C, concentrif|ue à la première
C et dont le rayon soit la moitié du sien. Plaçons au hasard
(') Bien entendu, si l'une des extrémités de MX tombe sur une des
parallèles, cela comptera pour 1/2 intersection.
108 CALCUL DES PROBABILITES
une droite dans le plan. Si nous adoptons la convention faite
tout à l'heure au sujet de l'aiguille, la probabilité dépendra-
t-elle d'une nouvelle et troisième hypothèse, ou bien do Tune
des deux précédemment examinées ?
Je puis supposer la droite fixe et les circonférences mobiles.
La pro])abilité pour que l'une des circonférences coupe la
droite est proportionnelle à sa longueur; la probabilité pour
que C rencontre la droite est donc le rapport des longueurs
{
des deux circonférences, c'est-à-dire -• On retombe ainsi sur
l'une des hy})othèses de M. Bertrand.
7. Voici un problème analogue :
Sur une sphère S on trace une figure mobile ; quelle
est la probabilité pour que cette figure satisfasse à
certaines conditicns ?
Comment définir d"al)ord la position de cette figure?
Soit P„ la position initiale, P, la position finale de la figure
mobile: on passe de l'une à l'autre par une rotation conve-
nable, définie par l'axe de rotation et l'angle de rotation.
Soient a, 8, y les cosinus directeurs de l'axe, et 26 l'angle
de rotation ; posons
X = cosO, jj. = IX sinO, v = p sinO, p ^= Y sinO,
et prenons X, a, v, p comme variables.
Elles sont liées par une relation :
X- -|- [x- -\~ \- -\- ^- ==■ i.
Je retrouve la même rotation, si je change les signes de
X, [jL, V, p, et il suffit de connaître trois de ces quantités.
NEUVIÈME LEÇON 109
Je suppose la probabilité représentée par une intégrale
triple
l chxrNch
elle sera représentée aussi par
J !^
Cherchons en effet le déterminant fonctionnel des nouvelles
variables À, v, p par rapport aux anciennes a, v, p, et sup-
posons X défini en fonctions de ;/., v, p.
"kdl = — u.(/a — vo?v — po^p.
Le déterminant fonctionnel est
A
X
X
0
1
0
0
0
1
Ainsi, au signe près, par le changement de variables
l'élément de l'une des intégrales triples devient l'élément de
l'autre intégrale après multiplication par ^•
d[xdydp
et
dhd^do
donnent donc bien la même définition pour la probabilité.
Voici comment se justifie cette convention : considérons la
110 CA.LOUL DES PROBABILITES
sphère :
a;2 -f y2 _|_ ^2 _|_
Supposons que la probabilité pour qu'un point quelconque
de la sphère se trouve à l'intérieur d'une certaine aire sphé-
rique soit proportionnelle à cette aire. Cette aire s'exprimera
par
l'intégrale
r>'
dxdy
cos «S
dœdy
cos nS étant le troisième cosinus directeur de la normale à
la sphère au point considéré.
Nous avons fait ici une hypothèse tout à fait analogue, car
X^ -f ,j.2 _[- v2 -}- p^ = 1
serait l'équation d'une sphère dans l'espace à quatre dimen-
sions.
8. Je suis parti précédemment de la position initiale P^.
La rotation X, a, v, p ne dépend pas seulement de P,, elle
dépend aussi du choix de la position initiale P^.
Je vais démontrer que la probabilité reste la même, si, au
lieu de la position initiale P,,, on en considère une autre P'^.
La rotation de P'^ à P, sera définie par X',[i.',v',p', et la pro-
babilité sera définie par
/ d\K dV dp
J ^
Je dis qu'elle sera proportionnelle à la précédente.
/, m, n, ?' définissant la rotation de P'^ à P^, la rotation
X',[x',v',p' sera la résultante de deux autres. Les formules con-
NEUVIEME LEÇON
nues de la composition des relations sont
111
X' = ; / — 'j.m — vn — p>'
a = hn -\- \j.l — yr -\- on
V = hi -f- [j.r -j- v/ — pw
c' = Ar — !^^ 4" ''"^ + 9^-
Il s'agit de calculer le déterminant fonctionnel de X',[j.',v',p'
par rapporta /, a, v, p. Je pose :
V ^''" + [J-- -j- ''" + p'-
Ici 5 =^ i, mais je puis supposer à X, a, v, p des valeurs
quelconques au lieu des valeurs véritables.
De même :
(J =^ V X" -f- IJ. -f~ ^ -\- 0 " .
Quelles que soient ces valeurs, on a :
c' = a \ P 4" "■'"'' + ■'^' + '"^î
et si /, m,n, r ont les valeurs constantes données,
Il s'agit de calculer :
^ (.«■, V, p)
en supposant 5 = 1, c'est-à-dire
7>u'
Da
?.;'
7)<j.
Dv
cV
7>V
Sv'
3v'
Da
ôv
c^p
Dp'
^p'
Dp'
?a
^/
2>p
112
CALCUL DES PROBABILITES
Mais je vais porter le nombre des variables à 4, et consi-
dérer d'une part s, ;j., v, p, d'autre part (T',a',v',p'. Comme
c' = (7, les dérivées partielles de a seront 1,0,0, 0.
1
0
0
0
V
V
7),/
Sa'
?a
3./.
Sv
Sp
3v'
Sv'
Sv'
Sv'
Sa
Sa
Sv
Sp
7>p
K
Sp'
Sp'
D(T
^^
Sv
Sp
C'est bien le même déterminant fonctionnel; on peut donc
déjà écrire :
S ([a',v',p'j S(g',a',v ,p') _S (q',a',v',p")^S (X',a',v',p') ^S('X,a,v,p)^
S (!-«•, v,p) S ((7,;j.,v,p) S(X',a',v',p') S (X,[/.,v,p) S(ff,[x,v,p)
Evaluons successivement les trois derniers déterminants
fonctionnels. Le premier est
Sa'
S(t'
Sa
Sa
Sv'
Sa
Sp
0
1
0
0
0
0
1
0
G
0
0
1
Sa;
SA'
Le second est :
l
— m
— n
— r
m
/
— r
n
n
r
l
— VI
r
— n
m
l
[P -\- m^ -h n^ + r2)2 - l.
NEUVIÈME LEÇON 113
Le troisième est :
<) À,a.v,p 1 1 ff
Le produit des trois est donc ,-> et l'intégrale:
se transforme en
J
( da'dV
dp
1 ^
d'xd'^dp
X
X'
A
X
ou
/■
d^xdvdc
La définition de la probabilité reste donc la même, quelle
que soit la position initiale.
9, On demande la probabilité pour que cette figure P^
satisfasse à certaines conditions.
Si on considère une autre figure P'^ égale à la première et
invariablement liée à celle-ci, on peut demander aussi la
probabilité pour que cette seconde figure satisfasse à certaines,
conditions. Soient alors À, [a, v, p les paramètres de la rotation
qui amène Pq en P,, et )/, a', v', p' ceux de la rotation qui
amène P'q en P,.
La probabilité pour que P^, venu en P^, satisfasse à cer-
taines conditions, est représentée par
/d'j-d^id:)
CAI.CVL DE? PROBABILITÉS. 8
114 CALCUL DES PROBABILITES
les paramètres l, jj., v, p devant satisfaire à certaines inéga-
lités.
La probabilité pour que P,, venu en P, satisfasse aux mê7nes
conditions est représentée par
X'
les paramètres )/, ij.', v', p' devant satisfaire aux mêmes inéga-
lités. Les intégrales, ne différant que par les notations, sont
identiques, et la probabilité reste la même.
Les probabilités pour que deux figures mobiles, égales, et
invariai )lement liées l'une à l'autre, satisfassent à une même
condition, sont donc égales entre elles.
10. Choisissons une autre forme où n'apparaîtront pas
X, [7., V, p.
Je définis la position d'un point M de la figure mobile par
ses coordonnées a?, y, z et celle d'un arc de grand cercle MP
par l'angle w que faitMP avec MA, MA étant un arc de grand
cercle qui passe par un point fixe A.
La probabilité s'écrira
où W est une fonction de a?, y, z et co.
En prenant
dxdy = zdc^
dd est l'élément de surface de la sphère et l'intégrale devient
/ *hd<sd(jy.
NEUVIÈME LEÇON 115
Cette intégrale doit être étendue à tous ceux des éléments
c de la surface de la sphère et à toutes les valeurs de l'angle
w qui satisfont aux conditions. En revenant k x et y comme
variables, elle s'écrit:
C^dxdy
11. .Te dis que la forme de *i> reste la même quelle que soit
la position de A. ^p'
Considérons un autre point iixe B, et
soit co' l'angle de MP avec MB, p celui de MB
avec MA.
A.
= co + 8.
Fin. 11.
Au lieu de x, y, to, les variables seront a?, y, w'.
Le determmant lonclionnel -^7 — '- est égal a :
t> {x, y, co)
1
0
'bx
0
1
= 1
12. La fonction $ est indépendante de co.
En effet, considérons un autre arc de grand cercle MP', et
soit m" langle de MP' avec ^lA, 7. l'angle de MP' avec MP.
co = 0) -j- a.
La loi de probabilité ne sera pas changée.
/
<ï)C?(JC/oj
116
CALCUL DES PROBABILITES
exprime la probabilité pour que MP satisfasse à certaines
conditions.
f^d^diû"
exprimera la probabilité pour que MP' satisfasse à ces mêmes
conditions. Ces deux probabilités doivent être égales, <î> ne
dépendra donc pas de co.
13. La fonction <i> ne dépend pas non plus de x et y.
Soient en effet de et dtr' deux éléments de surface de la
sphère égaux entre eux. Soient /, w, n, r les paramètres
d'une des rotations qui change
f/ff en drs . Soient X, ij., v, p ceux
d'une rotation qui amène la
figure mobile dans une posi-
tion telle que M soit intérieur à
d(s. Soient X', [jL, v',p' ceux d'une
rotation qui amène M à l'inté-
rieur de d(s' .
Soient x^ y les coordonnées
du centre de gravité de ds,
x\y celles du centre de gravité de c/a.
Les paramètres X', a', v', p' seront des fonctions linéaires
de X, [jL,v, p d'une part, de l, m, n, r d'autre part; on n'a en
effet qu'à se reporter à la formule de composition des rota-
tions citée plus haut. On aura d'ailleurs, comme nous l'avons
vu plus haut :
FiG. 12.
/du.d-^d^ / du.'dVdç,'
X = I "^r~
NEUVIÈME LEÇON 117
La probabilité pour que M soit intérieur à du est :
Tc/u) Ç^d<s — i~^{x,y)d<5 = j -^/ •
les paramètres X, (jl, v, p devant satisfaire à des inégalités qui
expriment que la rotation correspondante amène M à l'inté-
rieur de f/ff, et l'intégrale étant étendue à toutes les valeurs
de ces paramètres qui satisfont à ces conditions
La probabilité pour que M soit intérieur à da est :
^ ^ , , . , ( dxxd-t'dù
'iT:^(x,y)d<:= ' ^- ' •
On a donc :
<ï> (x, y)d<s z= 4> (x , y) d<s
ou, puisque d<s = de' :
<^(x,y) = ^{x\y'),
l'intégrale étant étendue à toutes les valeurs de [/.', v', p' qui
sont telles que la rotation X', a', v', p' amène M à l'intérieur
de de'] ou, ce qui revient au même, telles que la rotation
1, a, V, p amène M à l'intérieur de de.
14. Nous avons ainsi écrit la loi des probabilités sous une
autre forme, mais c'est la même hypothèse que celle que
nous avons faite quand nous prenions pour variables X, ix, v, p.
Eu résumé, la probabilité pour que M soit à l'intérieur d'une
certaine aire du, et en même temps pour que MP fasse un
angle w avec MA, est
(lidedo),
S
et <!> est une constante à déterminer,
118 CALCUL DBS PROBABILITES
Étendons l'intégrale à tous les éléments de la sphère;
l'angle w variera de 0 à Stt, et a de 0 à Ai:. L'intégrale aura
pour valeur
47r* X 271 = Stt-* ;
mais alors la probabilité sera égale à 1. Donc
1
et
est la loi des probabilités.
15. Soient, sur la sphère, une courbe fixe et une courbe
mobile ; on promet à un joueur autant de francs qu'il y aura
de points d'intersection: quelle est son espérance mathéma-
tique ?
Elle est proportionnelle au produit des longueurs des deux
courbes.
DIXIÈME LECOX
1. Si l'on considère une figure mobile z> et deux ligures
fixes :p,, 521 ^^ probabilité pour que o ait une position rela-
tive donnée par rapport à z,^ est la même que la probabilité
pour que z, ait la même position relative par rapport à cpj.
Autrement dit, supposons que À, a, v, s définissent la rotation
qui amène cp, dans une position o' ; prenons comme variables
nouvelles À', a', v', p' qui définissent la rotation qui amène z,.^
dans cette même position «' : nous retrouverons la même
loi de probabilité et nous aurons comme plus haut :
d'xd^'dà
La rotation À', ;/, v', p' est la résultante de deux autres,
\. a, V, p et /, m, n. r : cette dernière, celle qui amène ï.., dans
la position o^, peut être considérée comme donnée, et le
calcul du déterminant fonctionnel de u., v, p par rapport à
|j.', v', p' est le même que dans la leçon précédente.
Cela posé, je ne conserverai pas les paramètres À, a, v, p,
dont la signification géométrique nest pas simple, et nous
reviendrons aux variables x, i/ et m de la fin de la leçon
précédente.
120
CALCUL DES PROBABILITES
2. Soient, sur la surface sphérique, M un point de la figure
mobile ayant pour coordonnées x, y^ z \ et MP un arc de
grand cercle appartenant à la figure mobile et faisant un
angle w avec l'arc de grand cercle MA qui passe par un
point fixe A,
1° Quelle est la probabilité pour que M soit dans une aire
rfff, lorsque w varie de 0 à Stt ?
C'est :
dndii
cU
2° Quelle est la probabilité pour qu'un cercle mobile de la
splière coupe un cercle fixe ?
Soient P le pôle du cercle fixe, A le point où il coupe le
tableau, et 6 langle POA.
FiG. 13.
FiG. 14.
Soient P', A', 6' les données analogues pour le cercle
mobile.
Soit cp l'angle POP'.
I.a condition nécessaire et suffisante pour l'intersection.
DIXIÈME LEÇON 121
est que l'on ait k la fois
cp < 0 -|~ 0',
cp > 0 — 0',
en supposant 0 > 0'.
Représentons la zone BCB C dans laquelle le pôle P' du
cercle mobile doit se trouver ; par projection sur le plan du
tableau, les deux petits cercles qui la limitent seront figu-
rés par des droites BB', CC; Tang-le POB sera égal à 0 — 6\
et Tangle POC à 0 + 0'.
La probabilité cberchée sera proportionnelle à la liauteur
bc de cette zone. Or,
bc = Ob — Oc = cos (6 — 0') — cos 0 + 0')
bc = :2 sinO sinO'.
3. Le problème peut être plus général. Soient :
1° n arcs de grands cercles fixes CpCa,--. C„, égaux entre
eux et de longueur l; 1° n arcs de grands cercles mobiles ^
invariablement liés les uns aux autres, de même longueur
Je clierche les points d'intersection des arcs mobiles avec
les arcs fixes et je promets autant de francs que de points
d'intersection.
L'espérance mathématique du joueur sera proportionnelle
à nn'.
La probabilité pour que G,' rencontre C, est la même que
pour que Ci rencontre C,, etc., d'après la démonstration
de tout à l'heure.
Elle reste encore la même pour que C,' rencontre Co, etc.
L'espérance mathématique sera d'autant de francs que
122 CALCUL DES PROBABILITES
l'on peut faire de combinaisons de l'un des n premiers
arcs avec l'un des n' seconds. Supposons même que ces
derniers aient une longueur l' différente de l : l'espérance
mathématique sera nn'll'.
Si l'on considère deux lignes brisées formées darcs de
grands cercles, l'espérance mathématique sera encore pro-
portionnelle à leurs longueurs, car. si l'un des éléments
était double, l'espérance mathématique correspondante dou-
blerait.
A la limite, cette conclusion sera encore vraie, et en
général l'espérance mathématique sera proportionnelle aux
longueurs s et s' des courbes. Elle sera Kss'.
Cherchons K.
Supposons deux grands cercles : leur longueur commune
sera 2::, et ils se coupent en 2 points ; l'espérance mathé-
matique sera K X -iTr^, et comme elle sera égale à 2,
Pour deux petits cercles, l'espérance mathématique sera
r— j- S'il y a intersection, il y aura deux points d'inter-
section. Or :
s := 27r sin 0,
/ = 27: sinO'.
L espérance sera :
2:1 sin 6 X 2:1 sinO'
= 2 sinO sin 0'.
C'est ce que nous avons trouvé plus haut d'une autre
manière.
DIXIÈME LEÇON 123
4. Supposons sur la sphère céleste un nombre N d'étoiles
placées au hasard.
Promettons à un joueur un franc pour chaque couple
•d'étoiles tel que la dislance angulaire des deux étoiles,
P et P', soit plus petite que y. Quelle est son espérance
mathématique?
P' devra être à l'intérieur d'une certaine zone. La sur-
face de cette zone est proportionnelle à sin^l'Pour v = tt,
la surface est celle de la sphère entière; la probabilité est
■donc :
V
.2 JL
- = siu-
sur
Y.
9.
sin- 1
Comme les étoiles sont au nombre de N, elles peuvent
former groupes de 2. L espérance mathématique
€st :
N fN — 11
sm
2 I .
ç) 2
5. Considérons un système mécanique, dont les équa-
tions sont mises sous la forme de Ilamilton ; n variables,
a;^, a?2--M ^/ji définissent la position du système; n variables,
^n 2/21 ••• y ni définissent les vitesses.
F étant une fonction donnée qui dépend des x et des ?/,
les équations auront la forme suivante :
dxi _ d¥
dt ~ diji
dyt _ d¥
dt dXi
424 CALCUL DES PROBABILITES
On connaît F, c'est-à-dire la loi du mouvement, mais on
ne connaît pas les positions initiales.
Représentons les valeurs des variables, au temps / := o,
pard?o,a;0,... a;» et ?/?,3/!j,... y,?.
Quelle est la probabilité pour que ces variables aient cer-
taines valeurs à un temps t donné ?
Si je me donne la loi de probabilité pour que les variables
aient les valeurs initiales ci-dessus, le problème devient
déterminé. Je suppose que l'on se donne cette loi de proba-
bilité pour les valeurs initiales.
6. Je suppose cette probabilité proportionnelle à
Jk dœ^\dxl.. dx^,dy^]dijl... di/ll,
k étant une constante.
On peut supposer qu'on ne sait rien sur les valeurs ini-
tiales, et qu'on sait seulement que F est compris entre F^
et Fo ; comme F = const. est une intégrale des équations du
mouvement (c'est l'intégrale dos forces vives), si la valeur
initiale de F est comprise entre F^ et F.^, F restera com-
prise entre F, et Fj.
L'intégrale précédente, étendue à toutes les valeurs qui
satisfont à
F, <F<F„
sera égale à 1.
Si cette loi de probabilité est vraie pour les valeurs ini-
tiales des variables^ elle le sera encore pour les valeurs
finales.
11 suffit de démontrer que le déterminant fonctionnel des
DIXIÈME LEÇON 125
valeurs finales par rapport aux valeurs initiales est éga\ à
l'unité.
Soient x',... y\.., les valeurs des x^... y,... au temps
t'\ X,... y,... leurs valeurs au temps t.
Il n'y a qu'à établir cette proposition pour t et t' très
voisins.
Soit :
t' = t -{- t.
Je vais, pour simplifier, examiner le cas de deux variables
X et de deux variables y.
. (^Xy dY
' _ I i^-
et
dY
y-^^y^-'d^.
Le déterminant fonctionnel est :
d'^Y f/-F fPF d?¥
1 +
c/a;,c/t/, c/^^'o^^^yi ^^^f dy^dy
d'-F , , fZ^F d-'F d'-F
1 -]- £ -: ; — e -; ;; — £
C?J?,cZy2 C^^2^3/2 f^y2^^y< ^2/2
cZ^F f^^p ^2p f^ap
1 £
c^a:| dx^dx.^ d.x^dy^ dx^dy^
d'^F d'F d'^F , d^F
— e ";~:: — £ -; — r~ 1 — £
dx^dx^ dx\ dx^dy^ dx^dy^
Je développe en négligeant le carré de £. Tous les élé-
126 CALCUL DES PROBABILITES
ments du déterminant sont infiniment petits du premier ordre,,
sauf les éléments de la diao:onale.
Tous les termes seront du second ordre au moins, sauf
dans
dx^diij \ dx.4yj \ dx^dyj \ dx./ly
ou
L ^ \dx^dyj \\_ ^ \dx.^dyj y
c'est-à-dire 1, aux termes près en e ^.
7. De tout ce qui précède il résulte qiiil faut apporter un
très grand soin à définir le choix de la loi de probabilité qu'on
adopte.
La probabilité pour que x soit compris entre x^^ et x^ s'ex-
prime par une intégrale
/ cp (a.-) dx :
^ [x] sera une fonction sur laquelle nous devrons faire des
hypothèses pour connaître la loi de probabilité, mais en
général on sera conduit à regarder ^ [x) comme continue.
En général, la probabilité pour que x satisfasse à une con-
dition donnée dépendra du choix de <p ; cependant il n'en est
pas toujours ainsi, et certains problèmes sont indépen-
dants de la loi de probabilité.
Exemple. La probabilité pour que x soit incommensu-
rable sera toujours égale à 1, quelle que soit la fonction con-
tinue ^ que l'on choisisse, et celle pour que x soit commen-
surable, toujours infiniment petite.
DIXIÈME LEÇON 127
8. Autre exemple. Soit une roue divisée en un trùs
grand nombre de parties égales, alternativement rouges et
noires ; imprimons-lui une rotation rapide. Lorsqu'elle s'arrê-
tera, une de ses divisions se trouvera en regard d'un point
de repère fixe : quelle est la probabilité pour que cette divi-
sion soit rouge ou noire ?
Pour être complètement résolu, le problème exigerait la
connaissance d'une fonction arbitraire; il dépendra de l'im-
pulsion, de la vitesse angulaire initiale. La probabilité pour
que cette vitesse soit comprise entre w^ et co, est
/
(p i (oj c/o),
<U0
la fonction ^ étant entièrement inconnue.
D'un autre côté, la roue aura tourné d'un angle total 0. La
probabilité pour que 0 soit compris entre O^ et ()^ est
"0
Nous ne savons rien non plus sur f{b). Néanmoins, la pro-
babilité pour que la division obtenue soit rouge, sera tou-
jours très voisine de 1/2; elle est donc indépendante de /.
Je suppose que chaque division corresponde à un angle s ;
je divise l'axe des abscisses en parties égales à s, et par les
points de division je mène des ordonnées jusqu'à la ren-
contre de la courbe
Comme les divisions changent de couleur, je couvre de
hachures les aires qui correspondent aux divisions rouges,
par exemple.
128
CALCUL DES PROBABILITES
La probabilité cherchée sera le rapport de l'aire couverte
de hachures à l'aire totale.
Quelle que soit la forme de la courbe, quand le nombre des
divisions augmente indéfiniment, ce rapport tendra vers -•
Fici. 15.
Soit, en effet, A l'angle maximum dont la roue peut tour-
ner de telle sorte que 6 < A. Supposons la fonction f (6)
continue et admettant une dérivée. Admettons de plus que
cette dérivée ne dépasse pas un certain maximum, M,
Je divise A en n parties égales ; soit e Tune d'elles.
_ A
n
Considérons deux divisions consécutives : la différence des
deux aires est plus petite que s ((x — i>.'), où u. etf^' désignent
respectivement le maximum et le minimum de f (0) dans
cet intervalle. Or ([x — a') est plus petit que 2Me : la diffé-
rence des deux aires est plus petite que 2M£^.
Comme il y a - aires couvertes de hachures, il faut multi-
DIXIÈME LEÇON 1-29
plier par - pour avoir la dilîérence des deux aires totales, ce
qui donne Me*/i ou MAe.
La dilîérence des deux aires tendra donc vers zéro avec
£ et la probabilité sera bien -•
Si on ne savait rien du tout sur a, ou sur f^ on no pour-
rait rien calculer: c'est parce qu'on sait quelque chose que
l'on peut entreprendre le calcul. Mais ici il nous suffit de
savoir que /"a une dérivée limitée.
9. Donnons encore un exemple.
Considérons un grand nombre de planètes, dont les
orbites soient sensiblement circulaires. Soient a le moyen
mouvement de l'une de ces planètes, h sa longitude à un
instant donné pris comme origine. Sa longitude l au temps t
sera :
l-.-at.-^b.
La probabilité pour que a et J satisfassent à certaines con-
ditions est
/ 3) («,6j dadh.
Je dis qu'au bout d'un temps très long les planètes seront
également distribuées dans tous les signes du zodiaque.
La probabilité pour que l soit comprise entre des limites
données sera donc indépendante de cp.
Cherchons la valeur probable d'une fonction e""' : si
m est différent de 0, la valeur probable tendra vers 0 quand
l augmentera indéfiniment. Cette valeur probable est repré-
sentée
CALCUL ntS PROBABILITÉS. , 9
130 CALCUL DES PROBABILITES
par
f Ce'"' <«' + '^' cp (a,b) dadh.
Intégrons par parties.
1 : a>db — / / — ^ V dadb.
f zmt ^ J J imt da
Si nous supposons seulement cp continue, les deux termes
ci dessus tendront vers zéro.
Je demande la valeur probable d'une fonction périodique
quelconque, f{l). La formule de Fouriernous donne :
Chacun des termes de cette série aura pour valeur pro-
bable 0, sauf le terme constant A,,. La valeur probable
de f[l) sera donc :
Supposons que l'on ait :
0 < /o<^ < 27r;
la probabilité pour que l soit compris entre I^^ et I^ est :
1 f'^ „ l, —h
2Ju 27:
C'est la valeur probable d'une fonction f (l) égale à 1 si T
est compris entre Iq et /^ et à 0 dans le cas contraire.
Si t est quelconque, quel que soit cp, la probabilité sera
sensiblement proportionnelle à If-l^ ; la distribution des pla-
nètes sera uniforme
ONZIÈME LECOX
1. Nous allons aborder les problèmes connus sous le
nom de probabilités des causes.
Les problèmes que nous avons traités rentraient dans
renoncé suivant: étant donné que telle cause est mise en
jeu, quelle est la probabilité que tel effet en résultera.
Les problèmes inverses sont : étant donné que tel effet
s'est produit, quelle est la probabilité que telle cause a été
mise en jeu.
Le type de ces problèmes est celui de deux urnes dont la
première contient beaucoup plus de boules blanches que
l'autre : on a tiré une boule blanche, mais on ne sait pas de
quelle urne ; il y a plus de raisons de croire la boule sortie
de la première urne que de la seconde.
Pour donner une définition, il faut l'aire une espèce de
convention, comme au début de toute question de probabi-
lité.
Quand on compare le nombre des cas possibles au nombre
des cas favorables, l'on doit avoir soin que tous les cas soient
également probables. La convention qui repose sur des cas
regardés comme également probables contiendra toujours
un très large degré d'arbitraire.
D'un jeu de .32 cartes, on tire une carte : on sait que c'est
une figure ; quelle est la probabilité que l'on a tiré un roi?
132 CALCUL DES PROBABILITES
Avant Févénement, la probabilité était le rapport du
4
nombre des rois au nombre total des cas possibles, soit —
1
ou^-
Après l'événement, le nombre des cas favorables est tou-
jours 4; le nombre des cas possibles est diminué, c'est celui
4 \
des figures, soit 12. La probabilité est devenue — ou - ; elle
a augmenté.
2. Formule de Bayes. — n causes différentes peuvent être
mises en jeu, C^, Ca, ... C„ ; la probabilité pour que la cause
C/, si elle est mise en jen, produise l'événement A est p,.
Si nous savions que C, est en jeu, nous pourrions affirmer
que la probabilité de A estp,.
Il faut supposer que deux causes ne peuvent être mises en
jeu simultanément.
Avant l'événement, chacune de ces causes avait un^ pro-
babilité a priori que je suppose donnée : la probabilité que
la cause C,- soit mise en jeu était ct,-.
L'événement A a eu lieu : quelle est la probabilité que ce
soit la cause C, qui l'ait produit ?
Énumérons les cas possibles et les cas favorables, et, pour
fixer les idées, considérons un exemple particulier.
M urnes contiennent chacune Q boules; il y a MQ boules,
soit MQ cas possibles, que je suppose également probables.
Les urnes sont réparties en catégories C,, Cj..., C„.
Les urnes de la catégorie C, seront au nombre de ct<M;
de la catégorie Ca, au nombre de is.JA; ... de la catégorie C„,
au nombre de cj^M.
ONZIÈME LEÇON 133
La probabilité pour que la cause C„ soit en jeu sera :
cî„M
M
CTa-
Dans les urnes, les boules sont noires ou blanches. L'évé-
nement A est, par exemple, la sortie d'une boule blanche. La
probabilité pour tirer une boule blanche de la première
catégorie sera p, .
Dans la catégorie C,, il y aura j),Q boules blanches ; dans
la catégorie C2, il y en aura PoQ •••• ^^^^ ^^ catégorie C„, il
y en aura PnQ.-
On a tiré une boule blanche : on demande la probabilité
pour que l'urne qu'on a choisie appartienne à la catégorie C,-.
Le nombre des cas favorables est le nombre des boules
blanches de la catégorie C,-, soit cT,p,MQ.
Le nombre total des cas possibles est celui des boules
blanches :
nT,p,MQ + us^Pi^lQ + ••• + nT„,"«MQ
Le rapport de ces deux nombres est, par définition, la
probabilité cherchée :
r:î,pi
^iPi + ^2^2 H- ••• "h ^"P"
3. On peut dire encore :
La probabilité que la cause C, ait été mise en jeu, puis
que, mise en jeu, elle ait produit l'événement A, est une
probabilité composée.
D'abord la cause C, doit être en jeu, et sa probabilité a
priori est cr, ; ensuite, mise en jeu,- elle donne à A la proba-
bilité Pi. La probabilité composée est CT,p,.
134 CALCUL DES PROBABILITES
Mais la question se pose autrement.
Il faut que l'événement se soit produit, et ensuite qu'il
doive être attribué à la cause Cj. C'est encore une probabi-
lité composée.
La probabilité pour qu'il se produise est :
nj,p, + UoPa -f ... -f- nj„p„;
la probabilité [si l'on sait qu'if s'est produit) pour qu'il soit
dû à la cause C, étant x, la probabilité composée pour que
l'événement se soit produit et soit dû à la cause C, sera donc
d'où :
^iPl + ^^2^2 + ••• + ^'iPn
4. A l'écarté, votre adversaire donne et tourne le roi ;
quelle est la probabilité que ce soit un grec ?
Soient cT^ la probabilité pour qu'il ne soit pas grec; Wg»
pour qu'il le soit. Dans le premier cas, la probabilité pour
1
qu'il tourne le roi est-; dans le second, elle est 1. La pro-
o
habilité a posteriori qu'on a affaire à un grec est :
8 ^""^
Si l'on suppose cr, = ci, , dans l'ignorance où l'on est de
l'honnêteté de son adversaire, cette probabilité est de - • Elle
serait donc énorme.
Fort heureusement il est permis en général de supposer a
ONZIÈME LEÇON 13.i
priori :
5. Dans une urne, Jonl la composition est inconnue, il y
a N boules; nous elTectuons a tirages, en remettant chaque
fois la boule tirée, et nous ne tirons que des boules blanches.
Quelle est la probabilité pour que l'urne contienne n boules
blanches ?
Soit cy,j la probabilité a priori jxjur qu'il y ait n blanches;
■et soit j)„ la probabilité pour qu'on amène a blanches.
Pn =
n\\>-
Après les tirages, la probabilité pour que l'urne renferme
n blanches est donnée par la formule, et, après la suppres-
-j ) 5 commun aux deux termes de la frac-
tion, elle est égale à :
n, l!^- -f- rr.-i;^- + ... -f- rTv-X^-
6. Il faut connaître a priori n,, w.^... ctn, sur lescjuelles on
peut faire plusieurs hypothèses.
Supposons, par exemple, que toutes les compositions de
l'urne sont également probables, c'est-à-dire tous les cj
ég-aux. Chacun d'eux vaudra r; — \ — . • car il v a N -|- 1 com-
positions possibles de lurne, en y comprenant celle où il
n'v a aucune boule blanche. La fraction précédente se réduit
la_|_2|J- + ... -j-N!^
136 CALCUL DES PROBABILITES
Supposons, en second lieu, que l'on ait placé successive-
ment les N boules dans l'urne, les unes blanches et les
autres noires, en laissant au sort chaque fois le soin de
décider la couleur.
La probabilité que l'on mettra une blanche sera chaque
.1
fois -' et la probabilité que finalement, sur N boules, l'urne
en contiendra n blanches sera évaluée par la formule :
m !
a ! 7« — a !
où l'on fera :
m = N, a = «,
ce qui donne :
N!
1 .
9 5
î« ! N — w ! \ 2
Ainsi la probabilité a priori nT„ pour qu'il y ait n blanches
sera proportionnelle à un coefficient du binôme, et, dans
l'expression de la probabilité a posteriori pour qu'il y ait n
blanches, nous n'aurons qu'à faire les rj égaux à ces divers
coefficients.
N!
77„
N
7. Le résultat sera très différent du précédent.
Soit N très grand ;
sera un polynôme de degré [j^ 4" 1 ^n N, que je puis réduire à
son terme de degré le plus élevé, — — r*
ONZIÈME LEÇON 137
La probabilité dans la première hypothèse deviendra
ainsi :
w!'- ig -t- 1)
et, pour u. =: 2, par exemple, elle vaudra -^ •
Dans la seconde hypothèse, évaluons d'abord vs.,n'^-, pour
la même valeur 2 de a.
Evaluons ensuite le dénominateur :
rô,ll^-f-njo2S^ + ... -f cjnN!^.
Pour cela considérons l'expression :
1 -f- e^cT, -j- e-^nio + •■• "h e^^'ris,
qui n'est autre que le développement de :
(1 + e^}^'.
Je difîérentie deux fois par rapport à x :
l^^CT, + 22e2a:^^ + ... + N^e^'-^r^N-
Il suffit de faire a; =: 0 pour retrouver le dénominateur
que nous voulons connaître quand a = 2.
Ce dénominateur est donc le double du coefficient de x-
dans le développement de (i + e^j^ suivant les puissances
de j: : or, en nous arrêtant aux termes en x-,
(1 + ,x)x = (^2 + x + f )' ^ 2^ (l + f + ff^
138 CALCUL DES PROBABILITES
c'est-à-dire :
Le terme du degré le plus élevé en N à l'intérieur de la
parenthèse est — j?^. Le dénominateur dont nous cherchons
W
la valeur est donc approximativement le double de 2"^ — j
o
•c'est-à-dire vaut 'î>^-~ ]\3.
Ainsi, dans la seconde hypothèse, la probabilité pour que
l'urne contienne n boules blanches est :
N! ^2 1
n! N — «! N-2^--'
elle est beaucoup plus petite que dans la première hypothèse.
En effet, comme on l'a vu à propos du théorème de Ber-
nouilli,
N! 1
w ! N — n ! 2^
«st très petit, sauf quand net N — n sont sensiblement égaux
, ,. ... 1
-a p et ^, c est-a-dire ici a -•
8. Deux joueurs d'échecs ont joué n -\- m parties : le pre-
mier en a gagné n, le second m. Si n > ?«, on doit supposer
le premier plus fort.
Si une nouvelle partie s'engage, le premier aura plus de
chances de la gagner.
Quelqu'un de bien informé pourra se représenter par p la
probabilité pour que ce joueur gagne. Mais, pour moi qui '
n'ai jamais vu jouer cet individu, je ne connais pas p; je vais
chercher à m'en faire une idée.
ONZIEME LEÇON 139
La probabilité pour que p soit compris entre p^ et p, se
représente par :
où la fonction f(p) est inconnue.
La probabilité pour que p soit compris entre p et p -f~ '^^P
sera a priori f[p] dp; c'est elle qui correspond à cr,.
A la probabilité p,- correspond :
y , P"q"'.
La cause considérée est en effet que la probabilité de
gagner soit p pour le premier joueur.
La probabilité que ce premier joueur gagne n parties, p
étant sa probabilité de gagner à chacune des n -f- m parties,
sera
J , p"q"'.
Quelle est la probabilité a posteriori que p est compris
entre p et p -\- dp'î
Ici C7/P/, en remplaçant q par 1 — p, est égal à :
r{i-p'-"-^^^r[p'cip.
La somme des rsipi sera :
fi —I— vy) '
p"^^-pri^i^f{p)dp-^
0
cette intégrale doit être prise de 0 à 1, car la probabilité p
€st comprise certainement entre ces limites.
140 CALCUL DES PROBABILITES
On fait généralement l'hypothèse
r{p) = ^.
faute d'autres renseignements.
L'intégrale s'évalue alors simplement :
n -\- ml
! J 0
L'on est ramené à l'intégrale eulérienne de première
espèce :
B [n -f 1, m + 1 = — — ^ \^ ,
les r sont ici des factorielles, et cette expression n'est autre
que :
n [ m^
n -\- m -{- l\
' Ainsi l'intégrale qui représentait la somme des zs,- pi est
1
simplement égale à — -r- -— ; > et la probabilité a posteriori
pour que p soit compris entre p ei p -\~ dp est:
, , , n A- m -\- i\ ,. , ,
"^ ^^^ ^^ "^ '^iÂm\ ^ ^ ~ ^^ ^'
9. Quelle va être la probabilité pour que ce joueur gagne
la partie suivante ?
Cette probabilité s'obtient facilement. La probabilité pour
que p soit compris entre p ^i p -\- dp est cp (p) dp ; la proba-
bilité, lorsqu'il en est ainsi, de gagner la partie suivante
pour le joueur est p ; en vertu de la probabilité composée, la
réunion de ces deux conditions a pour probabilité pi^ (p) dp.
ONZIÈME LEÇON 1 il
On intégrera cet élément de 0 à 1, d'où
J^P? (P) dp-
Si l'on remplace :j. (jjj par sa valeur :
ni ml J 0
C'est encore une intégrale eulérienne, et l'on arrive k :
n -f m + 1 ! n-\-i\ oïl
n ! ??i ! n -\- m -\- ^\
ou :
n-f- 1
n -\- m -\- ^
Si j'avais appliqué le même raisonnement à un jeu de
hasard, je n'aurais pas eu le droit de supposer /"(p. = Y. A
priori, en effet, p devait égaler -• Donc / [p] devait être
infini pour yj = -•
DOUZIÈME LEÇON
1. Représentons par N le nombre total des petites
planètes ; parmi elles, un certain nombre M sont connues.
Dans une année, on en observe n parmi lesquelles ?n planètes
connues.
On demande la valeur probable de N.
La valeur de N ne peut différer beaucoup de —^ » mais
cette évaluation au jugé ne suffit pas : il faut s'occuper de
l'écart probable entre le nombre véritable et le nombre
probable.
Voici comment nous procéderons :
En premier lieu, nous supposerons connue la probabilité
pour que, pendant l'année d'observation, une planète exis-
tante ait été observée, soitp cette probabilité: nous admet-
trons qu'elle est la même pour les planètes connues et
inconnues.
Comme nous avons observé n planètes, la valeur probable
n
de N semble au premier abord devoir être ég-ale à - ; mais
r ^ p
il n'est pas possible que cette valeur soit tout à fait exacte :
les nombres 1, 2, ..., N ont des probabilités propres que
j'appelle cy<, tjs^., ..., ctn, et la valeur probable de N sera :
DOUZIÈME LEÇON 1^^
Si Ton suppose p doniu', et tous les nombres 1, 2, .. , N
également probables, on arrivera, comme nous le montrerons,
à " "^~ '^ pour la valeur probable de N.
P
Ce premier point résolu, nous nous poserons un autre
problème ; nous avons supposé p connu, nous ne le sup-
poserons plus, et nous déterminerons ensuite la valeur
probable de N en fonction de 7n et M, ce qui nous donnera
un résultattrès voisin de — comme nous l'avons prévu plus
haut,
2. J'appelle donc cjn la probabilité a pnore pour qu'il y ait
N planètes ; ^n la probabilité pour que, s'il y a ainsi N pla-
nètes, on en observe n dans l'année.
La probabilité a posteriori pour qu'il y ait en tout N
planètes est une probabilité de cause; elle s'exprime par:
ctnPn ,
SctnPn
Comme première hypotlièse sur les rj, supposons-les tous
égaux ; la formule précédente se réduit à :
Pour calculer Pn, appliquons le théorème des épreuves
répétées. La probabilité que, sur N planètes, on en obser-
vera n dans l'année est •
N'
P^ = n\^-n\^'^
»j^N — n
•144 CALCUL DES PROBABILITES
p étant la probabilité pour qu'une planète, si elle existe, soit
observée ; q la probabilité pour qu'elle ne le soit pas.
n est une valeur constante : c'est la plus petite que puisse
prendre N. Faisons croître N indéfiniment :
w 4- 1 , (n 4- 1) (w 4- 2)
= p" (1 — (^)-(" + ') = F (p, ^).
Si j'introduis maintenant la relation p = 1 — q :
1
Avec l'hypothèse faite sur les ni, la probabilité pour qu'il
y ait N planètes est donc pp^.
3. La valeur probable de N est:
SNp__N
Il est un peu plus simple de calculer la valeur probable de
N — w, soit :
S (N — n) Pn
SPN
N!
Posons
! N — n ! '
alors :
SpN = SAp"g^-"
S (N — r?) Pn = SAp" (N — n) q^-'\
Pour évaluer le second membre il suffît de différentier
DOUZIÈME LEÇON 145
F(p, q) par rappurt à </, et de multiplier le résultat par q :
dF
faisons après cette différentiation 1 — q =z p.ll reste :
{n-^i)q.
En vertu d'une précédente démonstration, cotte expression
1
est égale à SAp" (N — n) q^~'\ Comme d'autre part S^n = -»
la valeur probable do N — n est :
{n + i) g
P- _ [n + ^) 7
i V
P
i*ar suite, la valeur probable de N est :
n
Cette quantité diffère très peu do -' comme il était prévu.
En effet :
p p
4. Considérons maintenant la valeur de p comme incon-
nue ; je supposerai qu'on veuille connaître quelle est la pro-
babilité pour quep soit compris entre p et p -|- dp.
Ici, la probabilité a priori., zôï, pour qu'il en soit ainsi,
sera :
cT/ = r{p) dp, .
où / (p) est une fonction inconnue de p.
CALCUL DES PROBABILITÉS. 10
146 CALCUL DES PROBABILITES
Pi sera la probabilité pour que, si p a une valeur déter-
minée, l'événement observé se produise, c'est-à-dire pour
que, sur M planètes, on en observe m.
M'
Toutes les valeurs possibles de p sont comprises entre 0
et 1. On a donc:
M'
T3,pi 7n] M — m! -^ ^ _
SC7,-P/ _ _ M_
m\ M — m !
C p"hf~'"f[j)) dp
' 0
Quel est le nombre probable pour N? Nous multiplierons
le numérateur par ■ ? et nous intégrerons do 0 àl. Cette
^ p
valeur probable N est égale à :
N=^
P
f p"'(/^-"'f{p) dp
'J 0
Ce résultat dépend de f [p) ; supposons cette fonction égale
1 ■ '^ -\- Q n -\- l
al, et remplaçons aussi par — 1 .
I pmçM-»i ! dp — \ p"'q^^—"'dp
I P «^ 0
N = -^
/ p'"q^-'"dp
^ 0
_|_ Y) { p"'-^q^'-"'dp
7-, *•
DOUZIEME LEÇON 147
Posons :
N = (n 4- 1) J — 1.
J est le rapport de deux intégrales qui sont encore des
intégrales eulériennes.
r (m) r (M — m -f- i )
"' r (M 4- i) _ r (M + 2) r (m)
~ r (m 4- 1) r (M — m + ij ~~ r (M + i) r {m + 1)'
r (M + 2)
in
et par conséquent :
-^ 0^+l)(M + i) _ ^
Mn'
Cette valeur est très voisine de — ) ainsi que nous l'avons
m ^
annoncé.
THÉORIE DES ERREURS. — 5. Je suppose (pu)
l'on ait effectué différentes mesures
d'une même grandeur : quelle est la probabilité pour que la
véritable valeur soit comprise entre ^ et ^ -f" ^^ '*
Il faut introduire une loi des erreurs. Je suppose que la
véritable valeur de la grandeur à mesurer soit z ; quelle est
la probabilité pour que le résultat de l'observation soit com-
pris entre Xj^ etx^ -\- dxj^'? Je pourrai dans tous les cas re-
présenter cette probabilité par
dXf(^ (a?,, z).
148 CALCUL DES PROBABILITES
Cette loi des erreurs étant admise par convention, quelle est
la probabilité pour que z soit compris entre z qI z -\- dz'^
C'est un problème de probabilité des causes, et nous
allons calculer :
Toi est la proljabilité a 'priori pour que z soit compris
entre z et ^ -|- '^^ ! cette probabilité sera représentée par :
^i = '\ (^) dz,
tj; étant une fonction qui dépendra de ce que nous savons
sur z.
Pi est la probabilité pour que, à supposer que la quantité
observée soit 2-, les observations aient donné des rés-ultats
compris entre :
ce t GL CO t *H CtOG t ^ ^*2 ^^ ^^ xXOdy^ ..> OGji Gt CG^i '\' ' (XOOfi,
La probabilité respective de ces événements est :
c/^jCp (a;^, z\ dx^^Sf (a;^, ^), ... dœ„^ {oc„^z).
Pi est la probabilité pour que tous ces événements se soient
produits à la fois ; comme ces événements sont indépendants,
c'est une probabilité composée :
Pi z= dûo^dx.2 ... dx„^ (-r,, z) cp (a;,! -s") ••• » (a;„, z).
La probabilité a posteriori cherchée a pour numérateur :
dzdx^dx.^ ... dxn'\ [z] cp (a?,, z) cp (a?^, ^) ■■■ ? [^n^ -S").'
Pour obtenir le dénominateur ^rsiPt., il faut intégrer cette
expression par rapport à z seulement. Dans le quotient.
DOUZIJBME LEÇON 149
dx^, doo.y,... dùc„ sont dos constantes (jui disparaîtront, et il
restera pour la probabilité :
dz<\ [z] (0 {x^, z) 9 [x.^, -3-) ■■■ 9 {x„, z)
/ dz^\ [z] o (x^, z) (f [x.^, z) ... û {x„, z)
6. Cela ne nous apprendrait pas j^rand'chose si nous
n'avions aucune donnée sur cp et il/. On a donc fait une hypo-
thèse sur cp, et cette hypothèse a été appelée loi des
erreurs.
Elle ne s'obtient pas par des déductions rigoureuses ;
plus d'une démonstration qu'on a voulu en donner est gros-
sière, entre autres celle qui s'appuie sur l'affirmation que la
probabilité des écarts est proportionnelle aux écarts. Tout
le monde y croit cependant, me disait un jour ]M. Lippmann,
car les expérimentateurs s'imaginent que c'est un théorème
de mathématiques, et les mathématiciens que c'est un fait
expérimental.
Voici comment Gauss y est arrivé.
Lorsque nous cherchons la meilleure valeur à donner à ^,
nous n'avons pas d'autre ressource que de prendre la
moyenne entre Xf, x.2,... x,i, en l'absence de toute considé-
ration qui justifierait un autre clioix. Il faut donc que la
loi des erreurs s'adapte à cette façon d'opérer. Gauss
cherche quelle doit être z, pour que la valeur la plus probable
soit la valeur 'moyenne.
7. Si dz est constant, la probabilité pour que z soit com-
pris dans l'intervalle c/s- est:
^ (-2-) Cp (.^^, 3-)-C5 (a?2) ^)--- 'f [^n: z) dz.
150 CALCUL DES PROBABILITES
La valeur la plus probable sera celle pour laquelle cette
fonction sera maximum. Supposons ce maximum atteint
quand ^ est la moyenne.
flauss a d'abord égalé la fonction <|^ à 1, puis il a admis
que (f (ix;, , z) était de la forme cp (,j — x^).
Quelle doit être alors la fonction cp pour que :
cp (^ — .v^) ^ {z — x^)... cil' {z — x„)
soit maximum avec cette valeur de -3r ?
Egalons à zéro la dérivée logarithmique de l'expression
précédente par rapport à z :
<ù' {z ~ x^) cp^(^ — x.;^) I iK^^L^_Q_
c^ (z — œ^) ' C6 (3- — x^) "'■■■"'" cp (3- — x„)
Je pose
^7; ~ !'! = F (-.)•
L'équation à vérifier devient :
F(a^,) + F(^-,) + ...+F(.T„) = o.
Cette condition devra être réalisée toutes les fois que
d?, -\- X., -\~ ... -\- x„ = nz.
Je donne à a;^ , a;^ , • • ■ ^« des accroissements dx^ , dx^ , . . . dx^i ;
z restant constant, la somme des x doit rester constante et
on doit avoir :
F' (icj dx^ -\- F (^'2) dx^... -|- F' (a;„) dx^ = o,
dx^ ■\- dx^ -j- ••■ ~f" d^n = 0.
Ces deux équations doivent être identiques, d'où :
W{x,) = Y{x^) = ... = F'(^„),
DOUZIÈME LEÇON irjl
c'est-à-dire que F' (27/1 est une constante que je représente
par — a.
F [x^] ^ a (z — x^) -\- ^'.
et :
Lcp (z — x^) = ^—^-^ -|- * (2 — ^1) -)- Ç-
Déterminons les constantes a, b, c.
F {x^) -}- F (a;.,) + ... + F {x„\ = ^a [z — x^) -\- nb = o,
x^ -\- x^ -{-..■ -\- x„ — nz =^ — ^ [z — x^) := o.
Comme ces deux é([uations doivent être identiques, on a :
* = 0,
et l'on peut écrire :
a{z — X\)"
'jf {z — x^) = e^e - ;
c se détermine par la condition :
/+ 00
31 (s- — x^) dx^ = 1.
-5p
En posant
on trouve
a = 2A
— x^ = y.
?w = \/;
e-^v--
8. M. Bertrand présente les objections suivantes.
La l'onction o a été prise sous la forme [z — a;,), tandis
qu'en réalité elle devrait être o (^, x^.) De plus, on a fait
•]/ [z) = 1, et Ton ne peut l'aftirmer a priori.
Autre objection : La moyenne est-elle la valeur la 'plus
probable ou la valeur probable? Ce n'est pas la même chose.
152 CALCUL DES PROBABILITES
Supposons qu'une certaine grandeur x puisse prendre
pour valeur :
1, 2,..., w — 1 ou w,
et que chacune de ces valeurs ait pour probabilité :
de telle sorte que :
La valeur probable de x sera par définition :
^ = Pi H- 2p2 + ... + np„.
La valeur la plus probable de x sera celle qui correspond
au plus grand des nombres p.
Dans le cas du problème des erreurs, la valeur probable
de z est donc représentée par le rapport :
/+00
dz Z']) [z) ^ [x^, z) cp [x.^, .?)... cp [xn.
dz ']/ {z) cp [Xf, z) tp [x.j^, z) ... cp {x„, z)
M. Bertrand dit que Gauss aurait dû chercher, non pas la
condition pour que la moyenne soit la valeur la plus pro-
bable de z, mais la condition pour que la moyenne soit la
valeur probable de z.
9. On peut chercher à s'affranchir des hypothèses que
nous avons faites, à savoir que cp {x^^ z) était de la forme
cp [z — Xf) et que <]> [z] était égale à 1 ; on peut se demander
quelle forme on pouvait donner à ces deux fonctions pour
DOUZIÈME LEÇON 153
que la moyenne arithmétique de a?,, a?.,,... Xn fût bien la va-
leur la plus probable de z.
En d'autres termes, cette moyenne arithmétique, comme
nous l'avons déjà dit, doit rendre maximum :
J; [z) c& {x^, z) ^ [x.^, z) ... cp (a;„, z).
Quand il y a maximum, la dérivée logarithmique est
nulle; c'est-à-dire que si Ion pose :
©'. (x,, z) j^ , ,
'h(z) ''
on doit avoir :
F {x,, z) + F {x.,, z) + ... + F {x,„ z) + y = o.
Cette égalité doit être satisfaite par la valeur de z que
définit l'équation :
x^ -{- X. 2 -{-... -\- x„ = nz.
Je donne à 07^, x.^,....,x,t des accroissements dx^., dx^., .••,
dxr,. Je suppose que z ne change pas et que la dernière
égalité continue à être satisfaite ; / est alors une constante, et :
dV {x^) . . d¥ [x^ j . . d¥ {x„)
dx^ -\- dx^ -|~ ••• ~h ^^" ^= O-
Ceci ne peut avoir lieu que si :
. d¥ [x,] d¥ ix.^ - r/F ix,)
dx^ dx^ '" dx„
134 CALCUL DES PROBABILITES
Donc :
— —A'
où A' est fonction de z seulement ; et :
F = A'x^ -h B',
B' étant aussi fonction do z seulement.
La condition à remplir devient :
A' {x^ + ^2 + ••• + ^'») + ^^' -\- '/. = O'
c'est-à-dire :
n {A'z + B') + X =- o.
Cette relation doit être satisfaite quels que soient 3- et w ;
donc:
c'est-à-dire que '} {z) est constant, et :
A'z J- B' = o.
Voilà ce que deviendrait l'analyse de Gauss si on voulait
la reprendre en tenant compte de la première observation
de M. Bertrand.
10. De :
F [x^ ,z) = Kx^ + B
on déduit aisément :
Lcp [x^,z) =z Aœ^ + B -}- LO [x,].
LO [x^) représente une fonction de x^ seulement; A et B
sont des fonctions de z, admettant des dérivées A' et B',
telles que :
Ainsi :
DOUZIÈME LEÇON l»^
A'^ -^ B' = o.
Ax, + B
Tel sérail le résultat sans autre condition que le postulat
de Gauss sur la valeur moyenne.
11 entre encore deux fonctions arbitraires, 0 et A; B est lié
k A par une relation.
TREIZIÈME LEGON
1. Une autre objection a été faite à Gauss.
La quantité que l'on doit prendre pour z, ce n'est pas la
valeur la plus probable, c'est la valeur probable. En effet, la
valeur la plus probable est celle qui correspond à la plus
grande valeur de p ; elle peut être très différente de toutes
les autres, tandis que celles-ci peuvent se grouper très près
l'une de l'autre, ce qui donne fort à croire qu'elles diffèrent
très peu de la véritable valeur. Elles n'interviennent pas
dans la valeur la plus probable, tandis qu'elles contribuent
toutes à la valeur probable qui est par définition :
^{P\ "T~ '^iPi ~l~ ••• I '^"Pii-
La valeur probable de z est : ,
/ z^ [z] cp {x^, z) cp (.^2, -) ... cp {x„, z) dz
/4ac
i|/ (s-) cp [x^, z) cp (a-2, z) ... cp {Xu. z) dz
(Les deux quantités sous le signe / ne diffèrent que par le
facteur z qui figure en haut).
TREIZIÈME LEÇON 137
Il Tant clioisir •]/ et cp de façon que cette valeur probable
soit la valeur moyenne :
^\ ~\ "^2 1" ••• ~T" "^'1
n
2. Pour cela, je suppose que p observations aient donné
le résultat a:^ ; p autres, le résultat x.^: ... enfin, ;) dernières,
le résultat Xn. C'est un même nombre p et je le suppose
très grand.
Les deux intégrales porteront sur j) facteurs égaux à
<p [o^^^z)■, sur p facteurs égaux à o {x^, ^)---', sur p facteurs
égaux à <p {x„, z).
Je pose :
«I) = ï, {x^, z) =- ix.2,z)... cp(ifc'„, z).
11 s'agit de vérifier :
f -^ (z) <l>Pd3 "
Cette égalité devra avoir lieu quelque grand que soit p.
Si, au lieu de deux /) nous avions le rapport de deux il,
nous aurions à considérer le rapport :
oùlesX,.X2, ... X„ seraient fonctions des a;,, 07.2, ...a;„etles
a,, ao, ... a„. b^^ b.^, ... b„ fonctions de z.
Je suppose positives toutes les quantités X. Quelle est la
lo8 CALCUL DES PROBABILITES
limite de ce rapport quand p croît indéfiniment ? Soit Xj la
tti
Cl ■
plus grande des quantités X : la limite sera j-
En effet, ce rapport peut s'écrire :
'XA'^
s«
Toutes les fractions ^ sont plus petites que 1, sauf une
seule, celle qui correspond a k = i. Donc, quand p augmente
indéfiniment, le rapport considéré a bien pour limite -•
Etendons ce résultat aux intégrales :
/ cp^ {z)^''(iz et /'f2 {^) '^''dz.
cp, [z] joue le même rôle que «,-, et (&2 (^) ^I^^^ i,. Quelle est la
limite du rapport de ces intégrales? Soit z^ la quantité qui
rend <ï> maximum. Cette limite sera :
Î2 ^^o)
c'est-à-dire ici
Cette quantité z^ doit être la moyenne arithmétique.
3. Nous revenons à la même question que précédemment :
<lï doit être maximum quand z est la moyenne arithmétique.
Nous connaissons la condition pour qu'il en soit ainsi; c'est:
TREIZIÈME LEÇON 159
les dérivées, A' et B', des fonctions de a-, A et B, étant liées
par :
Kz -I- B' = o.
Quand on suppose que cp dépend seulement de la dilïV'-
rence z — a;,, sa dérivée logarithnii(|ue par rapport à z
A'x^ -\- B',
doit être du premier degré en ^^ — x^ ; alors
A' et 0 (a?,) sont constants.
Dans le cas général, c'est-à-dire quand on ne suppose pas
que o dépend seulement âe z — a;, , il reste pour a> {x^ , z) trois
fonctions arbitraires à déterminer : d'abord -]/ (z), que l'ana-
lyse actuelle ne permet plus de déclarer constant comme
dans le calcul de la valeur la plus probable ; puis 9 (a^J ; puis
A. Quant à B, il est lié à A par une relation.
4. 11 sagit de déterminer un peu plus complètement ces
fonctions arbitraires.
Je vais supposer p observations donnant pour résultat x^ :
la moyenne arithmétique sera x^ ; alors :
<I> = ^ {x^) e-
et l'on doit avoir
Çz^ {z) <]>Pdz = x^ Ç^ [z) '\fPdz ;
d'où :
'J(.~ - X,) ^ [z) e^^^^^ + ^^ dz = o.
()P
160 CALCUL DES PROBABILITES
Cette relation doit être satisfaite quels que soient p et x^
OP a pu sortir du signe / puisqu'il ne contient pas -s-, et
nous ne pourrons le déterminer par cette condition.
5. Cherchons 4^ (^•).
Aa;^ -|- B est une fonction de z qui atteint son maximum
pour z = x^ ; soit u^^ ce maximum. Je puis donc poser :
Ax^ -f- B = M§
u sera réel.
De même
f [z — x^]■^{z) dz
est une intégrale qui est toujours positive, et ne s'annule
que pour z ■= x^ \ je puis donc la poser égale à v'^, d'où :
A.x^ -|- B = M^ — M^,
(5- — x^) ■if {z) dz =: ^vdv.
Pour achever de définir m et u il faut s'en donner le signe,
car nous avons seulement défini i'^ et v^. Nous conviendrons
de donner à u et à u le signe -j- si ^ est plus grand que x^
et le signe — dans le cas contraire ; u et u sont donc tou-
jours de même signe.
D'ailleurs :
u'I = A [x^) a?, + B [x^).
L'intégrale examinée devient, en faisant sortir une cons-
tante :
/ ^Ivdv
e '"'-
TREIZIEME LEÇON 161
Je puis supposer v exprimé en fonction de u :
2vdv = f (u) du,
et alors :
fr(u)
e-P"- du
doit être nulle, quel que soit p, lorsque les limites sont
— oc ei -\- ce .
6. Cela ne peut arriver que si f{ii) est une fonction impaire.
En changeant u en — u, on aurait:
ff{— u) e-'"'- du = o,
d'où
Cette relation doit être vraie quelque grand que soit ;).
Si /■ {u) est impaire :
f (u) + /■(— u) = o.
Si f {u) n'est pas impaire, je développe suivant les puis-
sances croissantes de u. L'intégrale ne pourra être égalée à
zéro quel que soit p.
En effet :
f(u) -}- f {— u) = xu-" -f- .3^r" + ^..
Je vais poser :
CALCUL DES PKOBABIHTES.
162 CALCUL DES PROBABILITES
l'intégrale va devenir :
P" ^ P"^' ^ ) i
et elle doit être identiquement nulle.
Si nous multiplions par p"+ 2 tous les termes, le premier
ne contiendra plus ]), et les autres le contiendront encore ;
1
l'intégrale, au facteur près p'* + 2, se réduira sensiblement
pour p très grand à
'J -GO
qui n'est pas nulle.
Donc f (?y) doit être fonction impaire de u.
7. On a posé:
[z — ^)) ^ (-^) dz = f [u) du.
Difîérentions, en considérant x^ comme constant, l'autre
e'quation en i<,
kx^ -|- B = M^ — u^\
il vient :
dz [Mx^ -j- B') ^ — "iudu ;
or, en tenant compte de la relation
A'^ + B' = o,
A'^^ -f- B' = A'd7, -- h^ z — — M [z — x^).
Donc :
A {z — x.) dz =z Indu,
TREIZIÈME LEÇON 163
d'où :
— ^— ^ est une fonction paire, donc ^-tt- ne doit pas chan-
^l "^ A "^
ger quand on change m en — u.
Or ■ ,- n'est pas une fonction de h, mais une fonction
de z indépendante de x^ ; je dis qu'elle doit se réduire à une
constante.
En effet, je considère deux valeurs quelconques de 5, z^
et z^, pour lesquelles A et B prennent respectivement les
valeurs A, et B^, A3 et Bj ; je vais choisir x^ de façon que :
^^x^ -f- B) = ^.',x^ -\-^2-
u^ — u- reprendra alors la même valeur pour z^ et z.^.
Donc ' ' qui n'est fonction que de u- reprendra aussi la
même valeur et on aura :
•^ (^<) _ iJf^) .
A' [z,) - A' (.-,)
Donc '^^-)rr est constant.
A
8. Ainsi la manière la plus générale de satisfaire au pos-
tulat de Gauss (modifié conformément à l'objection de
M. Bertrand, à savoir que la moyenne est la valeur pro-
bable), se traduit par :
164 CALCUL DES PROBABILITES
9. Considérons :
J -00
Je dis que cette intégrale est nulle, c'est-à-dire que la
moyenne est la valeur probable.
Je vais poser :
X ( -|— X.2 -\- • . ■ — p X-ii
n '
et:
cp (a?,, z) <p (^2, z) ... cp (.%•„, z) = 0 [x^] 0 (0^2) ... 0 (a^„) gP.
L'exposant P peut s'écrire :
P = —j^ iz) [{z — a;,) -h (3- — ^2) + ... + (^ — a;,,)] 0^3-,
c'est-à-dire :
? — — n Ç'i^ [z){z — x) dz.
Il reste donc à démontrer que l'intégrale suivante est
nulle :
Si nous posons :
{ {z — X) ^(5-) dz = M-,
d'où :
(3- — x]^ (^) dz = ^M C?î?,
TREIZIÈME LEÇON 16o
l'intégrale envisagée se réduit à :
20 yoo^] 0 {oc.^)... 0 {cc„< Cue-""^ du.
Elle est nulle quand « varie de — ce ii -j- x.
10. La fonction o dépend ainsi de (]/, et -j/ dépend de la
connaissance que nous pouvons avoir a priori de la probabi-
lité relative à z.
œ dépend de Tliabileté de l'observateur et de la probabilité
a priori pour qu'il se trompe.
Il n'y a aucune raison pour que ces deux probabilités a
priori dépendent l'une de l'autre. La seule hypothèse raison-
nable est donc de supposer -]; = 1 pour retrouver la loi de
Gauss.
11. Reste 6(a?<).
Rien n'oblige à supposer cette fonction égale à I. On sait,
par exemple, que certaines observations, telles que les
observations méridiennes, sont sujettes à une cause d'erreur
particulière que Ton a appelée Verreur décimale.
Quand on mesure une quantité, quand on effectue vme
lecture, on évalue le résultat jusqu'à un certain ordre d'uni-
tés, et le nombre qu'on donne est celui qui se rapproche le
plus, dans cet ordre, de la grandeur qu'on veut connaître.
Or, on a remarqué que chaque observateur semble affec-
tionner certaines décimales ; on exprimera analytiquement
ce fait en disant que 6 [x^] est périodique, et qu'elle devient
maximum pour ces décimales.
12. Quelle opinion faut-il avoir de ce postulat de Gauss?
Dire qu'il est admis par tout le monde, ce n'est pas le justi-
166 CALCUL DES PROBABILITES
fier, car tout le monde n'a peut-être pas une connaissance
suffisante de ce qu'est une loi des erreurs.
Si nous avions appliqué les mêmes raisonnements à z^,
a;? +a?| -f ... -\- xf,
z- = î
71
la valeur adoptée pour z eût été :
=v/^
î ~r ^2 "t~ ••• ~r ^iî
On peut se trouver en présence d'une série de mesures
portant sur le carré d'une grandeur inconnue, et, d'après le
postulat, il faut prendre la moyenne des n quantités directe-
ment observées.
M. Bertrand donne comme exemple une aiguille qui indi-
querait le carré de l'angle mesuré. Devrait-on prendre la
moyenne des lectures de l'aiguille, c'est-à-dire la moyenne
du carré des angles, ou la moyenne des angles eux-mêmes?
Aucune de ces deux solutions ne serait raisonnable. La
mesure de cet angle comporte deux erreurs : 1° l'erreur de
visée, et l'erreur de visée probable serait l'erreur moyenne
de l'angle ; 2° l'erreur de lecture, et l'erreur de lecture pro-
bable serait l'erreur moyenne du carré de l'angle.
13. La règle de la moyenne semble donc dénuée de sens.
Pourquoi cependant ne nous trompe-t-elle guère? Pourquoi
est-il légitime de prendre la moyenne? C'est ^ au fond, jiarce
que les erreurs sont très petites.
Si, au lieu de z, je mesure / [z], et que j'applique à f{z) le
postulat de Gauss :
TREIZIÈME LEÇON 167
j'aurai, puisque x^ est très voisin de z,
f[x,)=f[z)-{-{x,-z)r[z).
et de même avec x.^ ... x„. J'en déduirai :
c'est-à-dire :
S [x^ —z) =0,
ou :
nz = x^ + ^2 + ••• + ^"'
On arrive donc au même résultat qu'on ait mesuré direc-
tement la grandeur z ou une fonction quelconque f [z] de
cette grandeur.
Voilà, en somme, pourquoi on a le droit de prendre la
moyenne.
14. D'un autre côté est-il si exact qu'on se borne à prendre
la moyenne? Ce principe est-il si incontesté?
Sur n observations, s'il arrive que n — 1 soient très voi-
sines l'une de l'autre et que la n^ en soit très éloignée, pren-
dra-t-on la moyenne ? Le résultat serait très différent du
centre de gravité des « — 1 premières observations, des
n — 1 bonnes observations. Certains expérimentateurs
écartent la n'' : il y a eu, disent-ils, accident, et cette obser-
vation est mauvaise.
Mais alors la valeur prise n'est plus la valeur moyenne :
on a eu une raison de rejeter le postulat.
Quand on adopte la loi de Gauss, l'erreur probable sur la
movenne est -7- ; de sorte qu'en multipliant les observations
168 CALCUL DES PROBABILITES
on devrait aboutir à une précision de plus en plus grande.
Et cependant, quand on mesurera un mètre un million de
fois, sans vernier, on ne le connaîtra jamais à un millième
de millimètre près, à un micron près.
Cela s'explique d'ailleurs : pour de très petites grandeurs
observées, on ne peut répondre de rien, il n'y a pas davan-
tage de raisons pour que l'erreur soit comprise entre 0 et 1
micron que pour qu'elle soit comprise entre 1 et 2 microns.
15. Dans la leçon suivante, j'établirai le théorème sui-
vant :
Quand on prend la moyenne, le carré de l'erreur commise
est:
_ cc^ 4- ^2 + ••• +^^>y.
Quelle que soit la loi des erreurs, Gauss démontre que la
valeur probable de cette expression tend vers zéro quand n
augmente indéfiniment.
Cela justifie le choix de la moyenne : elle devient de plus
en plus probable à mesure que n augmente, sans être la
plus probable.
Mais cette manière de justifier le choix de la moyenne
indépendamment de la loi des erreurs est, pour ainsi dire,
une réfutation du raisonnement de Gauss exposé plus haut,
puisque ce raisonnement prétend établir qu'une certaine loi
très particulière est la seule qui puisse justifier l'emploi de
la moyenne qui est la pratique universelle.
Il est assez étrange que cette réfutation soit due à Gauss
lui-même.
QUATOliZIÈME LEÇON
1. Soit z la quantité à mesurer.
La probabilité pour que le résultat de la mesure soit com-
pris entre x^etœ^-\- û?£c^ peut être représentée par cp {x^ , z) dx^ .
Gauss, nous lavons dit, suppose que o ne dépende que
^Q 2 — x^ ; la probabilité sera alors cp (^ — a?,) dx^ ; de plus,
il suppose qu'il n'y a pas d'erreur systématique, c'est-à-
dire que a est une fonction paire et ne cbange pas quand on
y substitue x^ — z k z — x^.
Soit y^ l'erreur :
y. = .r, - z.
La probabilité est cp {^/^) dy^.
Nous aurons à considérer la valeur probable de y,, et,
plus généralement celle de y,''; ce sera:
/
+ x
-00
Comme -^ est une fonction paire, si p estimpair, cette inté-
grale est nulle.
2. On peut faire deux observations, y^ et y^, et avoir à
considérer la valeur probable d'une fonction de \^/^ et y^, par
exemple y"h y'\ .
ç {y^) est la probabilité pour que la première erreur soit
170 CALCUL DES PROBABILITES
comprise entre y^ et ?/, + dy^ ; cp [ij.^ la probabilité pour que
la seconde erreur soit comprise entre y^ et y.^ + dy^.
La valeur probable de 2/'"i y^'S sera par définition
les intégrales étant prises de — ce à -(- oc par rapport à ?/,
et par rapport à y.^.
Comme la fonction sous le signe / / est le produit d'une
fonction de y^ par une fonction de y^, et que les limites sont
constantes, cette intégrale double sera le produit de deux
intégrales simples :
J y"l^ ?(!/.) ^hJify'l^ 'f [y-i) dy^.
Ceci montre que la valeur probable du produit est le pro-
duit des valeurs probables des facteurs.
Il faut que les deux facteurs soient différents : la valeur
probable de y\ par exemple ne serait pas le carré de la va-
leur probable de y'f ; mais la valeur probable de y'} yl sera
le produit des valeurs probables de yj et de yl.
3. Supposons 771.2 i^^l- ^^^ l'intégrale
/:
'f (y 2) dy-i'
nous devrions avoir la valeur probable de l'unité, c'est-à-
dire 1 ; or il est évident que :
/
? {y 2) dy-2 = * '
- 00
QUATORZIÈME LEÇON 171
car cette intégrale représente la |)roI)aI)i]iti'' jjour que y.^
soit compris entre — x et -|- x , c'est-à-dire la certitude.
4. Si l'on a effectué plusieurs observations y^, y.,..., yn, la
valeur probable d'une certaine fonction (]/ de ces observa-
tions sera :
y? (2/<) ? [y-i) ■■■ ■? (3/") ^(^r ^2' ••• y») dyi, cly., ... dy„.
Si la fonction ^ est impaire, les éléments de l'intégrale
seront deux à deux égaux et de signes contraires, l'intégrale
sera nulle.
5. Je reviens à l'iiypotlièse de Gauss.
? (y) = \/[
^-v.
La valeur probable dey^f+', avec cette hypothèse, est zéro;
cherchons la valeur probable de y-^ : c'est, par définition,
Observons d'abord que :
^-j+X ,-
/ \J\(i-'"j'y^Pdy.
\/!-'^'
dy
ou:
Ce- '•!/'- dy = Vît h'-^-
Je différentie celte égalité p fois par rapport à h :
172 CALCUL DES PROBABILITES
Le signe — est répété p fois dans chaque membre, il dis-
paraît.
r , o , , /- ,-p-\ 1.3.S ... f2M— 1)
D'autre part :
2.4.6 ... 2p = 2/'.p !
^
La valeur probable y-i' est le produit de l'intégrale par
h
'i on a donc
1 -p!
hP p ! 22/^*
6. Ce résultat a été obtenu dans l'hypothèse:
une question se pose : la loi de Gauss est-elle la seule pour
laquelle ce résultat se produit? C'est la seule.
Cherchons la valeur probable de :
Par définition c'est :
/V!
«^ —on
e-/'i/- e-"'î/u-2/)Vy.
On peut calculer directement cette intégrale ; on peut
aussi développer e-"^y^~y^' en série convergente pour toutes
QUATORZIÈME LEÇON 173
les valeurs de y:
e-"(!/o-i/f- ~ V A/,y.
D'où:
/ \/ - e- y-e-'"y -y>-cly = s Kp^.
J -ce
De même, avec une autre fonction ç. que celle de Gauss,
Ç 3> y) e-"^y^-y'>''-dy = S A^p^\
Par hypothèse^ les valeurs moyennes de y'^^ seraient les
mêmes dans les deux cas. Le rapport des deux intégrales
serait donc 1.
Comme ce rapport reste le même quel que soit w, servons-
nous d'un théorème précédemment démontré.
La limite du rapport
Jr, 'y 9" iy) dy
j h !> ' ?" ^y) dy
quand n croîtra indéfiniment, sera:
si, dans les limites de l'intégration, 'a [y) atteint son maxi-
mum pour y =z y^.
Ici e-'y-yo)- atteint son maximum pour y := y^] la limite
du rapport des deux intégrales est :
v/!
174 CALCUL DES PROBABILITES
Comme ce rapport reste toujours égal à 1 :
^^0^ = V ; '"
hyo
Pq étant tout à fait quelconque, c'est dire que la loi de
Gauss est la seule qui donne à y-P la valeur probable que
nous avons vue.
7. Supposons que la loi des erreurs soit quelconque.
On a fait n observations, ayant donné n erreurs indivi-
duelles y,, t/j..., -i/n- Prenons la moyenne des observations:
nous commettrons une erreur, qui sera la moyenne des er-
reurs individuelles,
.v< + y -2 4- • • • + y» .
n
Gauss s'est proposé de calculer la valeur probable du
carré de cette erreur ; c'est par définition :
Je développe ce carré :
/.y. +^2 + ••• + . VA - ^ M , ^-y..v-2
La valeur probable cherchée sera :
La valeur probable du produit l/^i/.2 est y^ y^V^'i comme
les fonctions y^ et y.^ sont impaires, y^ et y^ seront nulles.
QUATORZIEME LEÇON 175
Il reste donc :
yf 4- .vl + • • • + .vF
n-
L'intégrale se ramène à une somme de n intégrales ; mais
chacune d'elles porte sur la même fonction :
multipliée par ]/'jdi/f, ou yldy.,, ... ou yldy^. C'est donc la
même intégrale aux notations près.
Donc la valeur probable du carré de l'erreur est :
Ainsi la valeur probable du carré de l'erreur commise est
le carré de la valeur probable d'une erreur individuelle di-
visé par n.
Cette propriété suffit pour justifier l'emploi des moyennes;
elle a lieu quelle que soit la loi des erreurs.
La loi de Gauss est la seule pour laquelle la moyenne soit
la valeur la plus probable.
Avec toute autre loi, la moyenne deviendra de plus en
plus probable quand les observations deviendront de plus
en plus nombreuses, mais elle ne sera pas la valeur la plus
probable.
8. Voici d'autres considérations qui, dans certains cas,
peuvent justifier la loi de Gauss.
Cherchons la valeur probable de :
y, +.V, + •••-f-.vA -^- V
n
176 CALCUL DES PROBABILITES
c'est une fonction impaire que nous élevons à une puissance
impaire : la valeur probable doit être nulle.
Cherchons la valeur probable de :
y, + y., + ... ^y,;\"'
Par une formule, généralisation de celle du binôme,
9^1 I
(y, + ^2 + •■• + Vn?" = y- , f • ,. , ^î'?/^ ... yy
aj,!^^ ^' ^ ^\>-'
ou :
0^1 + ^o -|- . . . + '^!J. = 2p.
11 faut prendre la valeur moyenne de chaque terme et la
diviser par n'^f.
La valeur moyenne de certains termes sera zéro, si l'un
des exposants a est impair. Tous les exposants doivent être
pairs pour que cette valeur soit différente de zéro.
9. Traitons comme exemple :
iî/i +//2 + ••• + i/>,Y'-
Les a ne peuvent être pairs que si : 1° z, ^= 4, et les
autres nuls; ou 2° oc, = oco ^ 2; ce qui conduit à :
Sy] + 0-:y^yl + R.
R est l'ensemble des termes dont la valeur moyenne est
4 '
nulle; le coefl'icient de Si/ft/| est ^yT~\ -~ '^•
Traitons encore :
(y. +.V2 + . ■-\-ynf-
QUATORZIÈME LEÇON 177
Les a ne peuvent être pairs que si : 1" a^ = 6; ou "1" a^ = 4,
a^ = 2; ou 3» a, = a2 = ag = 2.
R étant l'ensemble des termes dont la valeur moyenne est
nulle, on a :
(2/, 4- ••• +^2 -f y»r = ^z/i^4- 1^ ^i/\!/l +90 ^i/lyy^ + H-
() !
Le coefTicient de ^y\yl est , . = 13; le cocificient de
s.y?.yiyiest5y|y^=90.
Je m'en vais convenir de désigner la valeur moyenne de t/ï
par Mp. D'abord la valeur moyenne de y, -|- ... -\- y., ~\~ VnY
sera :
, n (n — V
(y. +2/2 + ... + VnY = nM, + 6 — ^ ' M|.
En effet, dans S?/| tous les termes ont la mémo valeur
moyenne, et il y en a ;; ; dans Syf ?/|, tous les termes ont la
1 -1 ^ (^ — 1)
même valeur moyenne et il y en a
La valeur moyenne de (y, -\- !/■> ~ï~ ••• + 2/«'^ sera :
nfn — i \(rt — ^\
(y<-^.V2+---+.V-v)'=^Mc+15n(n-l)M,,M,+90 ' ^ 'M^-
Dans ^y\y\, il y a autant de termes que d'arrangements
den lettres 2 à 2; le coefiicient de MjM.^ est donc \on [n — l).
10. On pourrait poursuivre avec d'autres valeurs de 2^j ;
les expressions deviendraient de plus en plus compliquées.
Tenons compte de ce que w est très grand ; il y a dans le
second membre des termes en n, en.n^, en w^, etc.
A titre d'approximation, ne considérons que les termes du
CALCUL DES PROBABILITÉS. 12
178 CALCUL DES PROBABILITES
degré le plus élevé en n. Pour 2jo = 4, ce terme est Sn^Mf ;
pour 2p = 6, ce terme est ISn^M^.
Ainsi l'erreur moyenne :
^. y< -^ ^2 + ••• + y.
"^ n
a comme valeur probable de sa quatrième puissance :
et de sa sixième puissance :
,e ^ 1, (^-.J .
Calculons cette valeur probable en général :
{y.^y. + ... + vn?'' - y, [^jz!fz^\ E ^•'•^^^■^ - y''/']-
' Dans le second S on ne permute que les indices des y.
Ne conservons que les termes où tous les a sont pairs ; les
autres ont une valeur probable nulle. Il vient :
2)0 '
[y^ -f y. + - + y,:?" = ^ , ■ T" ; ,- NM«,M«, ... M«
^"^ x^ . o.^ .... api . t*
Tous les termes sous le second S,
^y^^yf' ••• y^^-^
ont, en effet, la même valeur probable. Soit N leur nombre ;
évaluons N.
11. Je suppose d'abord (x^ = ao. Si nous permutons y^ et
y.,, nous retrouvons le même terme. Si nous tenions compte
QUATORZIÈME LEÇON 179
de l'ordre, nous aurions autant de termes que d'arrange-
ments 2 à 2 de (j. lettres choisies dans les w lettres .y^^aï ••■ yn\
nous pourrions ainsi avoir des termes répétés.
Si les UL exposants étaient dilTérents, N serait égal au
nombre des arrangements de n letli'es \i. à [7., c'est-à-dire
n !
égal à :•
" n — [j.\
Je suppose \J.^ exposants égaux à a,, ij^ à ag, ... ;j^k à ax ;
de plus, je suppose a,, ao, ..., (Xk différents, et :
!^-) + y-j + ••• + i-'-K = y-
Je considère l'un des arrang-ements formés avec ces expo-
sants ; j'y permute d'une manière quelconque les (^.^ lettres
dont l'exposant est a^, les [jlj lettres dont l'exposant est ag, ...,
les ulk lettres dont l'exposant est aR. Je ne change pas le
terme correspondant; par conséquent, ce même terme serait
reproduit par :
a, ! u-o ! ... uk!
arrangements.
N =
'il ' ,1 '
n — \j. ! y.. ! ao ! ... 'Xk '
^ _ n{n — \\ ... (n — g -f- 1)
— Il I *
Ainsi N est un polynôme du degré ij. en n.
La plus grande valeur que puisse prendre tji. est p.
En effet :
*< + *2 + ••• +^!Jl= "^P-
Les a étant tous pairs, la plus grande valeur de [j. corres-
pondra à :
a.^ = 7..2 = ... = ajj. = 2.
180 CALCUL DES PROBABILITÉS
Il n'y aura donc qu'un seul terme de degré p, par rapport
à n., dans N; avec notre ordre d'approximation, c'est le seul
que nous devons conserver. Réduit à ce terme, N a la valeur
suivante :
^ n {n — •!) ... in — p 4-1)
~~ p !
En effet, tous les a étant égaux, il en résulte que les lettres
[x^, [J..2 ..., [j-K se réduisent à :
[X, = a ■= 2i
[J-2 = ••• = P-K = o.
Dans N, le terme en 71'' est :
p\'
12. D'autre part, a^, ao, ... ajj. étant égaux à 2 :
Mal = Ma, = ... =M^I^= Mo,
où M2 estla valeur pi'obablc du carré d'une erreur individuelle,
La valeur probable de (y^ + .V2 + ••• "h 2/«)^^ 6st donc :
9n ' r)!'
zn ' n''
La valeur probable de i/-'' s'en déduit en divisant par n^''
y — ^ 1 9/,
Comparons avec le résultat donné par la loi de Gauss ; on
doit avoir :
QUATORZIÈME LEÇON 181
OU :
La loi de Gauss est la seule qui conduise à celte expres-
sion pour la valeur probable de l'erreur.
Pourvu ([u'il n'y ait pas d'erreurs systématiques, et qu'on
fasse un grand nombre d'observations, en prenant leur
moyenne, on commet donc, avec cotte moyenne, une erreur
dont la probabilité est conforme à la loi de Gauss.
L'erreur commise avec un instrument est la résultante
d'un très grand nombre de petites erreurs indépendantes les
unes des autres, et telles que chacune d'elles n'entre que
pour une faible part dans le résultat; l'erreur résultante
suivra la loi de Gauss.
QUINZIÈME LEÇON
1. Posons le problème d'une autre manière.
On a commis dans les observations un certain nombre
d'erreurs individuelles, y^, y.^,... y,., indépendantes les unes
des autres ; l'erreur totale est :
y = y\ -h .^2 +--- + y«-
Supposons d'abord que toutes ces erreurs suivent la même
loi, et qu'il n'y ait pas d'erreurs systématiques. Le problème
est le même.
- La valeur probable de y'^P-^ ' sera nulle.
Nous avons évalué dans la dernière leçon la valeur pro-
bable de
Ici nous avons à chercher la valeur probable de
(y. +2/2 + ••• -t-^«j
La probabilité pour que yi soit comprise entre a et p, deux
limites données,
\ ? iyi) dyt
est la même par hypothèse pour 3/^, y.^^ ..., ?/„.
QUINZIÈME LEÇON 183
Il nous suffit de multiplier le résultat obtenu pour la valeur
probable de (-V. +•.'/. + -+ .V^y^ c'est-à-dire ^ (^^)",
par w^/', pour obtenir la valeur probable de y-'' :
_ ^ ^2p! /nM,y^
et, en posant nM, = M,
Ainsi la forme de cette expression reste la même, et, en
raisonnant comme dans la dernière leçon, on conclurait que
la probabilité pour que Terreur totale y soit comprise entre
deux limites données reste conforme à la loi de Gauss.
2. Ce raisonnement n'est pas encore satisfaisant, parce
qu'il est peu vraisemblable que toutes les erreurs indivi-
duelles suivent la même loi. Supposons que la loi ne soit pas
la même, mais que toutes les erreurs individuelles soien t
sensiblement du même ordre de grandeur et que chacune
d'elles contribue pour une faible part à l'erreur totale ;
soient :
L
la probabilité pour que l/^ soit compris entre a et ^ ;
«^ a
184 CALCUL DES PROBABILITES
la probabilité pour que y^ soit compris entre a et fl ;
tJ a.
la probabilité pour que y^ soit compris entre a et p.
Je suppose toujours cp,, cp.,,... cp„ fonctions paires, autre-
ment dit qu'il n'y a pas d'erreurs systématiques.
Je prends la somme M des valeurs moyennes des carrés
des erreurs,
Si toutes les erreurs particulières suivaient la même loi,
on aurait la même valeur M2 pour î/f, »/|, ..., y\^ et la
somme M serait nM.^.
Je me bornerai au calcul correspondant aux premiers
exposants.
En supposant que toutes les erreurs suivent la même loi,
nous avons trouvé que la valeur moyenne de y''- est M ; celle
de y\ 3M2; celle de ?/«, 15 M^ ...
Refaisons le même calcul en supposant la loi différente
pour les différentes erreurs individuelles. J'observe que le
produit y'ly'2 a pour valeur moyenne la valeur probable de
î/',", multipliée par la valeur probable de y\. En effet, la
valeur probable du produit y"\y\ sera représentée par
//î. bi) ?2 (^2) y'"y'-ïdy^dy^ ;
le produit des valeurs probables de y'" et de y'^ sera repré-
senté par
/?< (.V<) y"y dytj^^ (1/2) y 2 dy^.
QUINZIÈME LEÇON 185
Le théorème reste donc vrai dans ce cas-ci comme dans
le précédent; et si m est impair, la valeur probable sera
nulle.
La différence, c'est que les valeurs probables de y'^, y'^,
..., y'", ne sont plus égales entre elles.
Remarquons aussi que les quantités ç-,, 0^21 ••• ?« sont
censées du même ordre de grandeur.
3. Valeur moyenne de y^ :
Donc :
le dernier terme disparaît; il reste :
y^ = 2^ = M.
Valeur moyenne de y^ :
en laissant de coté les termes où figurent des exposants
impairs.
Le second terme sera beaucoup plus grand que le premier:
le premier S est un ensemble de n termes, le second yi
un ensemble de ' termes ; ces nombres de termes
2
sont respectivement de l'ordre de n et [de l'ordre de w-, le
premier est négligeable devant le second. Les différents
termes des deux XI sont d'ailleurs par hypothèse très petits
et sensiblement du même ordre de grandeur. On a d'autre
186 CALCUL DES PROBABILITES
part .
ou :
Le premier terme est encore négligeable devant le second,
et celui-ci est identique dans les deux expressions.
Donc, avec l'approximation adoptée :
y = 3M2.
Valeur moyenne de y^ :
7= S^ + lo Si^j ^ + 90 SîTî yi ^-
Calculons d'autre part ISM^ :
15M3 = 15S î^f + ^-32 (W ^ i- 90S^ 2^ ^.
Comparons les deux seconds membres. Le premier S porte
sur n termes, le second S sur n [n — Ij, le troisième S sur
n (n — 1) (w — 2) , , , 1, 1
— ^ ■ -; ' -', ces nombres de termes sont de tordre
1.2.3
de grandeur de n, de w^, de n^, et les deux premiers S sont
négligeables vis-à-vis du troisième. Comme le terme qui
n'est pas négligeable est le même :
y^ = 15M3.
4. Supposons que l'erreur finale soit la résultante d'un
très grand nombre d'erreurs partielles, indépendantes les
unes des autres, et qu'il n'y ait pas d'erreurs systématiques ;
supposons aussi que ces erreurs, qui seront sensiblement du
QUINZIÈME LEÇON 1H7
même ordre de grandeur, entrent chacune pour une faible
part dans l'erreur totale.
Dans ce cas, l'erreur résultante suivra sensiblement la loi
de Gauss.
Telle est, il me semble, la meilleure raison à donner de la
loi de Gauss.
5. On en donne aussi une vérification a posteriori, fon-
dée en somme sur le théorème de Bernouilli.
Si une certaine épreuve peut donner naissance à plusieurs
événements tels qu'un seul d'entre eux se produise à la fois,
et si on répète l'épreuve un très grand nombre de fois, les
nombres des événements qui se produiront seront très sen-
siblement proportionnels à leurs probabilités.
On mesure un grand nombre de fois une quantité z ; les
résultats sont a?,, x.^,... x^, et les erreurs y^, y^-.--- Va-
Si nous connaissions bien 3-, nous connaîtrions bien y,,
y^,..yn\ si nous comptons le nombre d'erreurs comprises
entre deux limites données, a et h, ce nombre sera propor-
tionnel à
'J a
On peut construire la courbe qui représente o 'y,).j
On divise l'axe des abscisses en un certain nombre de par-
ties égales à x: chacun de ces petits intervalles est assez
grand pour que le nombre des erreurs dans cet intervalle
soit grand ; au milieu de cet intervalle, élevons une ordonnée
proportionnelle à ce nombre d'erreurs.
La courbe obtenue, si la loi de Gauss est vraie, aura pour
188
équation
CALCUL DES PROBABILITES
= ^l-
hx'
C'est une courbe asymptotique à l'axe des abscisses et
symétrique par rapport à l'axe des ordonnées.
FiG. 16.
no(. fn.*-t)ei
Ce résultat se vérifie, paraît-il. Ainsi Bessel a pu repré-
mter les résultats d'un grand nombi
Bradley, sur la déclinaison d'une étoile.
senter les résultats d'un grand nombre d'observations de
6. On peut aussi se dispenser de tracer une courbe, et
vérifier par le calcul.
Remarquons, en premier lieu, que, si on ne connaît pas la
véritable grandeur à mesurer, on adoptera la valeur moyenne
des observations comme la représentant.
Vérifions par le calcul: la valeur moyenne de i/^p serait,
d'après la loi de Gauss,
i-'p —
2yQ! 1 .
p! '±-1' hi'''
celle de y'^'i,
^ q ! 2-'/ h'i
QUINZIÈME LEÇON 189
Éliminons h
Cette relation doit être satisfaite.
Pour les observations faites, nous connaissons les erreurs
yt, y...... yn. L'expression
^y'{^' + yV' + --\-yV
doit être éo^ale à
VyV -\-yV -^ •■■-^y'''
V /2p !
V
p'.
<^
celte vérification se fait également, paraît-il.
On peut encore considérer ?/-p+*. La valeur probable serait
nulle si Ion prenait y avec son signe. En ne considérant que
la valeur absolue, on aurait comme valeur probable, d'après
la loi de Gauss,
- I \J iy''^' e-^y' dy-
>-' 0
cette intégrale eulérienne n'e«t pas nulle.
Si on avait pris y avec sa valeur relative, on eût eu
sa-'
qui est nulle.
190 CALCUL DES PROBABILITES
7. Admettons la loi de Gauss.
Un certain nombre d'observations nous ont donné comme
résultats de mesure x^,x.2,... sc„. Il s'agit de savoir la valeur
de h et celle de z: tout ce que nous connaissons, c'est a;,,
CC.2,... cc„, et de plus nous admettons que la loi des erreurs
est celle de Gauss.
Posons :
OC; — z = ?/,-.
Demandons-nous la probabilité pour que z soit compris
entre ^^ et ^ -|- dz^ et pour que h soit en même temps compris
entre h et h -\- dh.
C'est un problème de probabilité de cause: la cause incon-
nue, c'est le double fait ci-dessus; l'effet connu, c'est que n
observations ont donné x^^ x^,...^ x^.
En représentant, comme précédemment, par ct,- la proba-
bilité à priori de la cause envisagée, et par p,- la probabilité
d'un événement qui s'est produit si l'on admet que la cause
a été mise en jeu, la probabilité a posteriori de la cause sera :
Ici :
cj/ =r ij; {z,h) dz dhi
sous la forme la plus générale et sans faire <^ =: i : l'idée
que nous nous faisons a priori de l'babileté de l'observateur
doit influer sur la probabilité que nous attribuons kh.
Pi est la probabilité que les observations ont donné des'
résultats compris entre :
x^ et AV, -}- dx^, x^ et x.2 -\~ dx^ ..., x^ et x„ -\- dx,^.
QUINZIEME LEÇON 19i
Posons :
ou :
alors
et
n = ^ {x^ — z) (f {x^ — z) ... cf {x„ — î);
cp (Xi — z] = k/^ e-f^^^i---^
Pi = II fte, <ya7o ... dXn^
zjiPi _ Il^}<<^/^^r/;^ dXfdx.2 ... dx„
" ' ' / U^izdJi dx^dx^... dx,^
On n'intègre pas par rapport aux x^ dont les différentielles
disparaissent haut et bas. Par rapport à z, on intégrera de
— X à -|-x , et par rapport à /ï de 0 à -j- ^ •
8. n peut s'écrire :
7A-^
si :
p == K - zY 4- (x., - zf + ... + K - ^?-
P est un polynôme du second degré en z qui atteint son
minimum quand z est la moyenne arithmétique des quanti-
tés X ; représentons ce minimum, qui est positif, par wa^ :
c'est la valeur probable de y^.
Je pose :
Xf -\- X.2 -f- ■ ■. -\- ^ -i
y — X. — j
■^ n
d'où :
dz = dy
192 CALCUL DES PROBABILITÉS
et :
Alors
devient
Pour y, comme pour z, on intégrera de — oo à -|- oo .
9. Cherchons la probabilité, pour A seulement, d'être com-
pris entre h oX h -\- dh^ y ayant toutes les valeurs possibles.
dhl A2g-,ift(j/2+a2)^ ^^
'J —on
'I dépendait de z et A ; il dépend maintenant de y el A.
Restreignons d'abord le problème en supposant toutes les
valeurs de y également probables, c'est-à-dire -j^ indépendant
dey.
On a
Ç' e-'^ity^-iaîi^^y _ g-"/-a2 Ç "^ e-"^'y- dy = g-'''*' \/—-
La probabilité relative à h seul devient alors :
11-1
dh.h - e^ ''-^^
«^ 0
QUINZIEME LEÇON 193
10. Quelle est d'alxti'd lu valeur la plus probable de A?
Clierelions le maximuin du numérateur, puisque la probabi-
lité lui est proportionnelle.
Ce numérateur peut s'écrire :
Or le maximum de ^/A'I>" ;< /"a lieu en général quand :
f
(•t si n est très grand, on peut négliger - ; le maximum est
tlonc atfeint en même temps (|ue celui de •!>.
Ici <& est \//'6^ ''*'-; écrivons que la dérivée logarithmique
est nulle :
¥h - ^- -= ^-
On a ainsi la valeur la plus probable de Ji.
On remarquera que, en supposant un nombre très grand
d'observations, la fonction arbitraire •]/ n'intervient pas. Ce
n'est pas étonnant : l'hypothèse que nous avions fondée a
priori sur le plus ou moins d'habileté de l'observateur dispa-
raît devant le grand nombre de résultats que nous contrô-
lons.
11. Quelle est la valeur pi-jbable de /^''V Cette valeur pro-
bable est:
X
0
C.\I.CI:L l»ES PROBABn.IÏKS. 13
194 CALCUL DES PROBABILITES
OU :
«^ 0
dh
Si n est très grand, nous savons vers quelle limite tend le
rapport de ces deux intégrales ; c'est :
= K"^
/iq étant la valeur la plus probable. Ainsi la valeur probable
de h>' est /?o^
Cette conclusion n'est vraie qu'à la condition que n soit
très grand et que p soit fini.
Faisons >]/ := 1 : nous arrivons à des intégrales eulériennes
'hi' — ^^ =-. -^ — ^ X
Le rapport des valeurs asymptotiques donne :
i) M-'' = (25
C3 qui est bien notre conclusion.
Mais si l'on ne suppose pas p fini, elle ne serait pas appli-
cable. Supposons p très grand, égal à ^ par exemple :
r (p) ^ pp e-f v'2tp
QUINZIÈME LEÇON 195
Le second membre se réduit à 2p e—P \J^ (x^)—P.
On trouve donc pour la valeur moyenne de h'' une expres-
sion très différente
2p e-p \/^2 ( 2
—Tzry- ou
(l^/v^
SEIZIÈME LEÇON
1. Jai plaidé de mon mieux jusqu'ici en faveur de la loi
de Gauss dont nous allons maintenant tirer les conséquences.
Peut-être pourtant la cause n'était-elle pas parfaitement
bonne.
Il ne faudrait pas avoir une sorte de superstition pour la
mélliode des moindres carrés, à laquelle va nous conduire la
loi de Gauss. Nous avons vu que l'on avait parfois des rai-
sons de ne pas adopter cette loi.
Elle suppose, en elTet, qu'il n'y a pas d erreur systéma-
tique, et il y en a toujours.
D'un autre côté, nous avons vu qu'on est souvent conduit
à ne pas appliquer le procédé de la moyenne, et, par exemple,
à rejeter une observation qui présente avec toutes les autres
une divergence exagérée. Il n'en serait pas ainsi si la loi de
Gauss était toujours vraie.
Quel genre de modification y aurait-il dans ce cas à faire
subir à la loi de Gauss ? La courbe :
y= \J^-^e-i^-^\
que nous avons précédemment tracée, devrait être relevée
dans les parties éloignées de l'axe des orilonnées.
La loi de Gauss suppose encore o fonction de y seulement,
SEIZIEME LEÇON 107
y étant égal k x — z^ tandis que ^ peut dépendre de x et
de z.
Par exemple, pour tenir compte de Xerreur décimale nous
aurions pu prendre :
ç(y) = y/^e-''y^8{a;),
9 [x] étant une fonction périodi([ue de a;, de période 1, ([ui
serait maximum pour les décimales qu'affectionnent certains
observateurs et sur lesquelles ils retombent toujours.
D'autre part, il y a moins de chance d'erreur si l'on tombe
précisément sur une division donnée directement par l'ins-
trument, que si on est obligé de subdiviser une de ces divi-
sions au jugé. Alors h ne serait plus une constante mais, une
fonction de x qui aurait une période égale à 1 ; la précision
serait plus grande quand x serait un nombre entier que
lorsqu'elle ne le serait pas ; si même l'observateur évalue
fort bien le dixième, mais ne sait pas donner d'autres déci-
males, 6 [x) sera rigoureusement nul pour toute valeur de x
qui ne sera pas multiple de un dixième.
2. Problème des erreurs commises sur la situation
d'un point. — .\u lieu d'une seule grandeur mesurée, il arrive
souvent qu'on en combine plusieurs, comme les deux coor-
données d'un astre, etc.
Je suppose, par exemple, que, pour évaluer la situation
dun point dans un plan, on ait fait n observations, et que
l'on ait trouvé pour ses deux coordonnées rectangulaires, x
et y, les valeurs :
a;, y,, ^2^2 ••■1 ^nl/n'
198 CALCUL DES PROBABILITÉS
Les erreurs commises sont :
oUf — X et y, — y, 072 — ^ et y^ — y, ... cc„ — x et y„ — y.
Je vais poser :
x^ =x-\-l^, y^ =3/4-7],,
x„ = «; + ^,,, 2/„ = 2/ + 7i„.
Les erreurs commises sont ainsi représentées par :
\^ et 7],, ^2 6t ï)2, ..., \n et Tl^.
3. On peut se demander quelle est la probabilité pour que
les erreurs commises sur la première observation soient
comprises entre \^ et ^, -f- d\\i 'h\ et t^^ + dt^^-
Soit :
cette probabilité ; il pourrait se faire que cp dépende de x et
de y, mais je suppose qu'il n'en est rien, et que cp dépend
seulement des erreurs.
Ces erreurs peuvent être indépendantes ; alors cp serait
le produit de deux autres fonctions et la probabilité serait
représentée par :
mais je suppose encore que l'erreur commise sur l'abscisse
ne soit pas indépendante de l'erreur commise sur l'ordonnée.
Le raisonnement est analogue à celui de Gauss dans le
cas d'une variable. On s'appuie sur le postulat suivant :
Si on a fait un certain nombre d'observations, on reporte
SEIZIÈMLJ LEÇON 199
les points observés sur un plan ; la position la plus probable
est le centre de gravité de ces points supposés de masse
égale.
4. A l'exemple de Gauss, nous admettrons que cette
manière de voir est légitime. Quelle est la loi d'erreurs qui
justifie cette hypothèse ?
Cherchons la probabilité pour que les coordonnées du
point soient comprises entre x et x -\- dx, y et y -\- dy.
C'est un problème de probabilité des causes et il nous
faut chercher encore
CT, est la probabilité a priori pour que les coordonnées
soient comprises entre x oX x -\- dx, y et y -\- dy; représen-
tons-la par :
Ui = -^ (x, y) dxdy.
Pi est la probabilité pour que, si la cause agit, le phéno-
mène observé se soit produit : ici, le phénomène observé,
c'est que les coordonnées sont l'une entre :
x^ et x^ -j- dx^ , x.2 et x^ -\- dx.2, ...., x„ et x^ -{- dx^ ;
l'autre entre :
y\ et y^ + dy^, y.-, et y^ + dy^, ..., y„ et y„ -f- dy„.
Pi est le produit des probabilités relatives à chacune des
observations.
Pi = o (?<, -1<) <f (Ç2' '^2) ••■ ? (^/n 'r\n) d%^d■q^c^^2^Irl2 ■•. dl^d-q,,.
Soit :
n = 9{^\^'n{) 9(^2' '^2) ■•• «p i^n, '<]„)■
200 CALCUL DES PROBABILITES
Alors :
sera :
Il■^dxd^/dl^d■fl^dz.2''/■|■^., ... dl„d-f\„
^■^dxd^/dl^d■ï\^dl^d■rl.2 ... d^^dr^,,^
l'intégrale étant prise par rapport à a; et y, il reste :
Yl'ifdxdy
1 U-^dxdy
Le dénominateur est constant et indépendant de x et de
y ; la probabilité est donc proportionnelle au numérateur.
5. Quelle sera la valeur la plus favorable ? celle qui rend
maximum le numérateur, 11'^. Or:
U. = (f[x^—x, y^ — y) cp ix.^ —x, y., —y) ... © [x,, — x, y„ - y)
Quelles sont les valeurs de x et de y qui rendent ce pro-
duit maximum ? D'après le postulat, c'est la moyenne arith-
métique de x^, x.2^... x„ pour x, et la moyenne arithmétique
de ?/,, ?/o, .-,!/" pour j/.
Égalons les dérivées logarithmiques auN l'unclioiis sui-
vantes :
d'^
>'1i)<
■^11
d^
•1 ■- '-
La dérivée logarithmique de ll-j; par rapport à x, qui duit
SEIZIKMK LEÇON 201
s'annuler pour le inaxiniuin, est :
— F(-n ■'■h) — F (^2. '^i')'-- — ^' (^/M 'V) + 0 = u
d'où :
F (;,. •'l,) + F {l,, r,,) + ... + F i,;,,, 7i„) = 0.
La dérivée logarithmiciue par rapport à y conduirait à :
Ces deux relations devront être vériliées foutes les l'ois que
l'on aura :
^1 + x-.-h ■■■ + •'»'/. = "'^^
Vi + l/-2-{- • ■ +y.< = ''^^
c'est-à-dire :
;< + Ç^ + ■ ■ + ^. = O'
6. Il s'agit de déterminer les fonctions o et i de telle façon
que les deux systèmes d'équations soient compatibles.
DifTérentions ces deux systèmes, en regardant oc et y
comme constants, et en faisant varier ;^, th, l^^ "^î--- '"' "l"-
La dérivée de 0 et de O^,, dans le second membre, sera
nulle, puisque 6 et 0^, ne dépendent pas de ces quantités.
J'appelle F, et F? les fonctions suivantes :
F/ = Ff;,-,Y,/),
1 ( — i 0 \""i M'y*
1^0 premier système devient :
dF^ + c/F. + . . + clF,, = o,
f/FV +r/F !!+... 4- c/F'' = o,
202 CALCUL DES PROBABILITES
et le second système est :
dl.^ -^ dl.^ -\~ ... -\- d\.^ = o,
Tels sont les deux systèmes qui doivent être équivalents.
Les deux premières équations doivent être une combinai-
son des deux dernières; nous devons avoir identiquement:
dF, + ^F2 + --i-dF,
= Adl, 4- Bc^rl, + Ac/Ho + Bd^^.2-]- ... -f Ml„ + Bdy^^.
Identifions les deux membres :
rfF, dF^
dF„
^- dl,- dl, - ••
d\n
^ rfF, dF^
dF„
d-t\n
A ne devrait dépendre que de \, et de -t^, puisqu'il est
dF
égal à -jr'\ il devrait aussi ne dépendre que de \^ et de 'r\^
ttK{
.1 . ' 1 « dF^ ^
puisqu il est égal a -z^ , etc.
Donc A et B sont des constantes : F\ est une fonction
linéaire de ^| et de t,,.
De même Fy est une fonction linéaire de ^, et de t)^.
J'ajoute que, en représentant F, par:
F^ =- M, + Bvi, -h C,
la constante d'intégration C est nulle.
En effet, si je remplace F^, F^... F„ par leurs valeurs,,
j'arrive à :
A (^. + l, + ••• + In) + B l-^, -f V,2 + ... +-^„) +^C= 9.
SEIZIÈME LEÇON 203
Celte équation doit être satisfaite toutes les fois que :
^( + ^2 + ■•• +1. = O,
'Il + '12 + ••• + 'f\n = 0.
Donc:
nC = 6,
et comme 6 est indépendant de n,
0 = 0, C = 0.
Il en résulte que (|/ est une constante.
Pour que la théorie de Gauss soit applicable, il faut que
l'on n'ait aucune idée a priori sur la valeur de la quantité
cherchée.
On aurait de même :
D'ailleurs B = D, car :
et Ton a :
di\f dl^
en vertu de la définition de F et de F^.
On arrive enfin à :
G étant une constante que nous écrirons LH.
Le polynôme A;f + 2B;,7i, + Er.f doit être négatif, car
204 CALCUL DES PROBABILITES
une erreur infiniment grande doit avoir une probabilité
nulle : représentons-le par — P.
Lcp = -P+ LH;
d'où:
L'intégrale
?
Ee
jj '^dq^d■fl^
doit être égale à l'unité pour toutes les valeurs possibles de
X et de y.
7. Ce raisonnement donnerait prise aux mêmes objections
que le raisonnement de Gauss. Admettons cette loi.
On peut construire les courbes :
P = constante,
en plaçant l'origine au point visé, c'est-à-dire à très peu près
le point moyen. Le problème est analogue à celui du tir à
la cible.
Les points se répartissent conformément à la loi de Gauss
généralisée.
Les courbes P = const. se-
ront des ellipses concentriques
ayant les mêmes directions
d'axes.
Considérons Tune de ces el-
lipses : je mène par O plusieurs
droites qui partagent le plan
en secteurs, 1, 2, 3, 4.
Soit s^ la partie inférieure à l'ellipse du premier secteur,
S, la partie extérieure.
S'il y a un très grand nombre de points de chute, ils se
FiG. n.
SEIZIEME LEÇON 205
répartiront à peu près proportionnellement à leurs probabi-
lités. Dans*, il y aura «, points, dans S^ il y en aura N,. Le
théorème qui résulte inimédialement de la formule est le
suivant :
n, _ ii., ng n^
N, ^ n: - N. - \
Dans chaque secteur, il y a le même rapport entre le
nombre des points intérieurs et le nombre des points exté-
rieurs à l'ellipse.
8. Si les observations sont indépendantes, cp est le produit
de deux fonctions. P sera alors la somme de deux fonctions
dépendant chacune d'une seule variable, donc le terme en
If ■q^ disparaît.
Cela veut dire que les ellipses ont leurs axes parallèles
aux axes de coordonnées.
Pour que l'écart entre le point visé et le point observé soit
indépendant de la direction, l'ellipse devra se réduire à un
cercle.
On pourrait encore regarder comme indépendantes l'er-
reur en abscisse et l'erreur en rayon vecteur.
C'est là-dessus qu'était basée une démonstration de la loi
de Gauss, déjà citée, et dépourvue de valeur.
9. La méthode des moindres carrés sert à déterminer
des quantités ?<,, u^..., iip qu'on ne peut mesurer directe-
ment, mais dont on mesure certaines fonctions ^,, z^..., z„.
2-, ^= F, (m,, ^2 "M «/Oi
^•2 = l'a ("(• "2 •••> "p.'i
206 CALCUL DES PROBABILITES
Pour les mesures de ^, , z.^..., -s-„, n observations ont donné
Xf, X.2 ..., x„ ; on a commis des erreurs. Sur Zi Terreur t/,-
est :
IJi = Xi — Zf.
Le problème ne se pose que pour n > |;, car, pour n =p,
le système d'équations donne une solution; pour n < p, il
n'y a pas assez d'équations, et le problème est indéterminé.
Pour n > p, il y a trop d'équations : quelles sont alors les
quantités les plus convenables à prendre pour les u ?
Eliminons les j^ quantités ic ; on est conduit an — p
équations :
6,-(^,, 2-0 ..., z,,) = o, i = 1, 2, ..., n — 2J.
Ce sont les équations de condition.
On a parfois avantage à prendre les équations de condi-
tion sous cette forme.
Parfois il est préférable d'exprimer les z en fonction
des M,
Nous traiterons un exemple avec l'une et l'autre méthode :
le premier relatif aux planètes, le second à un problème de
triangulation.
DIX-SEPTIÈME LEÇON
1. La première partie delà méthode des moindres carrés,
que nous abordons immédiatement, est de déterminer les
valeurs les plus convenables des k. Dans une deuxième
partie, nous nous occuperons de l'erreur commise.
La cause inconnue est que les quantités u soient comprises
entre certaines limites ; les quantités observées cOi sont elles-
mêmes comprises entre certaines limites. Appliquons une
fois de plus la formule :
rsi est la probabilité a priori pour que la cause ait été mise
en jeu, c'est-à-dire ici pour que les quantités u soient com-
prises entre u^ et ll^ -\-dl'.^, ii., et Uo + du^, ..., Upetitp -j- dup.
Cette probabilité peut se représenter par :
^ (m^, t<2, ..., Up) dUfdi(.2 ... diip.
•l aura des formes variées suivant l'idée qu'on se fera a priori
des quantités u : il y a là un très grand degré d'arbitraire.
Pi est la probabilité pour que xi soit comprise entre Xi et
Xi -\- dxj, en supposant que les h aient eu les valeurs que nous
leur avons attribuées, z^^ So'---' ^" ^t^nt données en fonction
des u, la probabilité de Terreur commise sur chacune d'elles
208 CALCUL DES PROBABILITES
sera respectivement :
?i (i/i) d^J^ — cf (u.-, — z^) dx^,
La probabilité jj, que nous cherchons est celle pour
laquelle toutes ces circonstances se produisent à la fois; c'est
une probabilité composée:
Vi = ?i [Vs) Î2 {y-2) • ■ ?« {yn) dy^dy^_ ... dij,,.
J'abrège un peu l'écriture en posant :
da^du^ ... dUf, = (/w,
et d'autre part :
?i (2/1) ?2(y2) ••• î« iyn) ~ n
dy^dy.^ ••• '^y-t =- dx^dx.2 ... c^^„ = dw .
Alors PjTj, est égal à :
et :
'''^' Jn,l;rfa,c/o/
Comme on n'intègre que par rapport à (/co, d^ disparaît.
Telle est la probabilité qu'il s'agit de connaître, à savoir
la probabilité a posteriori pour que ?</ soit compris entre m,
et lit -\- dui. Cette probabilité, puisque le dénominateur est
constant, est proportionnelle à II, fonction des /(, et à >]/ dm
DIX-SEPTIÈME LEÇON 209
qui représente la probabilité a priori et qui est aussi fonc-
tion des u.
2. Pour obtenir la valeur la plus probable des quantités m,
il faut chercher le maximum Je n J/ diù.
L'hypothèse la plus simple sur •{/ est -]/ = !: reste à déter-
miner le maximum de IL
L'hypothèse la plus simple sur les cp est que les erreurs
suivent la loi de Gauss.
Alors :
n sera maximum quand la parenthèse sera minimum,
c'est-à-dire :
^yf +^->i/i + ... -\-Kyl.
C'est une fonction connue des u: les quantités h^^ h.y,...^
h„ représentent les poids des observations, et ce qu'il faut
rendre minimum, c'est la somme des carrés des erreurs com-
mises, chaque carré étant multiplié par le poids de l'obser-
vation correspondante.
3. On arriverait au même résultat sans admettre la loi de
Gauss, pourvu que l'on suppose les erreurs accidentelles
petites et les erreurs systématiques nulles.
En effet, supposons les quantités y très petites : quelle que
soit la forme attribuée aux fonctions tp, nous serons amenés
à quelque chose d'analogue. Il s'agit de rendre maximum le
produit des »,.
CALCUL DES PROBABILITÉS. 14
210 GVLCUL DES PROBABILITÉS
Je suppose cp,- paire, et je développe par la formule de
Taylor Lip^ changé de signe.
— Lcp. (2/1) = «I + b^y'\ + c^y\ -f ...
— Lcpo {^J.^ = «2 + ^2^2 + c-il/l -\- •■■
La somme des logarithmes changés de signe doit être
minimum, c'est-à-dire:
Sa,- + S%? + Se,?// -I- ...
Je différentie par rapport à «/, :
-'*lï + -^-'âr + -
Comme les y,- sont supposés très petits, on peut en négli-
' ger les puissances supérieures, et tout se passe comme si nous
avions à rendre minimum S h^yj. En admettant donc que
la loi de Gauss ne soit pas vraie, la véritable loi n'en sera pas
très différente dans l'intervalle utile.
De deux choses l'une, ou bien les observations sont sensi-
blement concordantes, et, comme nons venons de le voir, la
méthode des moindres carrés sera applicable; ou bien, elles
ne sont pas sensiblement concordantes, et dans ce cas les
observations ne vaudront rien et il n'y aura rien à en tirer.
4. Nous ne saurions cependant nous contenter du raisonne-
ment qui précède, car ce que nous voulons obtenir, c'est la
valeur probable des ii (et non la plus probable).
La probabilité pour que x soit compris entre x ei x -\- dx
DIX-SEPTIÈME LEÇON 211
étant 3. [or, dx, la valeur la plus probable de x est celle qui
rend maximum 3» {x) dx.
La valeur probable de x est / a;s [x] dx.
La valeur probable de ii étant u^, la valeur probable
de la fonction z.
Z = M-,
ne sera pas v.\.
Mais si les z sont fondions linéaires des u, les valeurs
probables des z correspondent aux valeurs probables des w.
Zi = Ai^^(^ -f \,.,u., -f- ... -f- A,f,i(p -\- B,-.
Cnrfto représente la probabilité pour que la i" quantité w,
soit comprise entre u, et Ui -j- di',.
Soit t4 la valeur probable de u/,- :
ul = feu n/rho.
La valeur probable de Zi, soit z'I, sera :
-■; =j"cn A,,'.', -f ^,2>'2 -f- ••• 4- A,y/^ + b,) do,,
ou
^« = A,, feu M,c/o) + \i.,fcn v.,dL.i -f ...
-f X,,fCllu,,di.o + B,yClIr/(o,
et comme fCïlilo est la valeur probable de Tunité, c'est-à-
dire 1,
z^ = A,,i^? -f- A,,k5 + ••• + '^'P K + B.
212 CALCUL DES PROBABILITES
5. Je vais supposer d'une part <]/ constant ; d'autre part
que la loi des erreurs est celle de Gauss ; enfin que les z sont
liées aux u par des relations linéaires.
Je vais établir que la valeur probable des u est celle qui
est donnée par la méthode des moindres carrés.
Le produit pi rsi atteint son maximum quand la fonction P :
est minimum.
Soient m?, u^, ... u^ les valeurs des ii qui rendent cette
expression minimum. Ces valeurs seront aussi, comme nous
allons le voir, les valeurs probables des u.
On a:
n = Ce-p.
La valeur probable de u^. est :
Hdu)
/ UU/cdd)
ndoi fndoi
Il faut démontrer que :
,,0 ^
fndu>
c'est-à-dire:
/ n {U;r Ul) diO = O.
On a:
Xi est connu, 3-,- est du premier deg^ré par rapport aux u : P
DIX-SEPTIÈME LEÇON . 213
est donc un polynôme du second degré par rapport aux u.
P atteint son minimum quand:
t(^ = mJ, t<2 = t<2' •> Myt = M°, ...
Cela veut dire que :
P = P, + P2.
P2 étant un polynôme homogène et du second degré par
rapport à (î<, — w?), {u.^—ui), ..., (w/t — m^j, ... ; et P^
étant la valeur de ce minimum.
Nous avons à démontrer que :
/
Ce— Po e— P-' (u/. — ut) doi = o.
Ce— ^0 e— P:i est une fonction paire des quantités u,- — w?,
w^. — ?<° est une fonction impaire. Comme l'intégrale est
prise de — 00 à -{- 00 , elle est bien nulle.
Ainsi ces valeurs des u sont non seulement les valeurs les
plus probables, mais les valeurs probables.
6. En général, en est-il ainsi ?
Si les opérations sont sensiblement concordantes, les
erreurs sont petites, et tout se passera comme avec la loi de
Gauss.
Quelle que soit la forme des fonctions F, si le champ de
la variation des u est très restreint, nous pourrons regarder
les z comme linéaires.
Pour cette même raison, c'est-à-dire si le champ où peuvent
varier les u est très restreint, la fonction •]/, qui était d'abord
si arbitraire, peut être regardée comme constante.
C'est grâce à cet ensemble de circonstances que la mé-
214 CALCUL DES PROBABILITES
thode des moindres carrés peut être considérée comme appli-
cable, toutes les fois que les observations sont sensiblement
concordantes et dénuées d'erreurs systématiques.
7. Ceci posé, voyons comment les calculs doivent être
dirigés.
Nous connaissons les fonctions z des u : ceux-ci sont au
nombre de p, et un nombre d'observations w, plus grand que
p, nous adonné pour z^, ^21- •' -^" ^^° valeurs x^, x.-,,..., x„.
Il y a plus d'équations que d'inconnues ; cherchons la meil-
leure manière d'y satisfaire d'une façon approchée.
Une première approximation donnera M,, u^^,..., Up. Sup-
posons qu'elle soit assez bonne pour qu'on puisse négliger
le carré de l'erreur commise : soit bi cette première approxi-
mation pour Ui :
M,. = bi -f- Vi.
Si nous développons les Zi suivant les puissances crois-
santes des Vi, d'après la formule de Taylor, et en négligeant
les carrés des vi,
z, = A^v, + A,2V2 +...-]- KpVp H- B,-;
on aura de la sorte n équations qui sont devenues linéaires.
Il faut rendre minimum :
Écrivons que les p dérivées par rapport aux p quantités
v^, «2, ... Vp sont nulles.
Or:
dz
dvk
DIX-SEI'TIÈME LEÇON 215
il reste :
:£,/i,A,;,{z,- — Xi) = O.
8. Nous sommes donc conduits à la règle suivante :
J'écris les équations ci-dessous qui ne sont qu'approchées :
a', — B, = A,, y, -f A,.,»;, + ... -|- A„/tv,
^2 — 1^2 — ^^2l"( + Ao^jt^ + ... -f A.,pVp,
/^,A,,
/.,A.„
x„ — B,, = ^„^v^ -f A,.,v., -\- ... 4- A„,,t>. h„A„^
Non seulement ces équations sont approchées, mais elles
sont inconq)atibles puisque >i > p.
Je multiplie les deux membres de la première par A, A,, ;
ceux de la seconde par A.^Ao, ; ... ceux de la w* par /*„A„, ;
et j'ajoute les résultats membre à membre.
J'obtiens ainsi une première équation linéaire en a; et u ;
je me suis servi des coefficients
où j'ai fait /e = 1. Si je fais k égal successivement à 2, ..., j3,
j'obtiendrai les nouvelles suites de coefficients :
^,A,o, /ioA.^,, ... A„A,,2
7?,A,p, h.,A.,,,, ... h,,A„,,
et par conséquent p équations linéaires pour les v.
La résolution de ce système répond au problème.
9. Je dirige le calcul autrement.
J'ai n fonctions Zi de «, , u^ , Hp.
' Zi — F,u<,, n.^, ... Up).
216 CALCUL DES PROBABILITES
Je puis éliminer les u ; d'où n — p équations, qui sont les
équations de condition.
cp, (3-,, 2-0, ... Z„) =0,
?9(-2'lî -2'2' ••• ^n) = O,
en posant q = n — p.
Je puis développer les équations de condition, en négli-
geant les termes du second degré par rapport aux y si les
observations sont suffisamment concordantes.
Ah2/i 4- A, 2^2 4- ••• -f A,„y„ = Bp
^2)2/1 H- Aa23/2 + ••• + A2«2/« = ^2»
A^i2/i + A922/2+ ••• + Aç,,^//» = Bç.
Quelle est la meilleure manière de satisfaire à ces équa-
tions de condition ? C'est en rendant minimum
Donc :
^hiVidyi = o.
10. Il faut observer querf^/, , dy^-, ..., dy,, ne sont pas indé-
pendantes : elles sont liées par les relations qu'on obtient
en différentiant les équations de condition.
Ces équations de condition ont pour forme générale:
d'où :
Hkuidyi ■= 0.
DIX-SEPTIÈME LEÇON 217
Les relations qui lient c/j/,, dy^. ... dy„ sont donc :
SA,,r/y, = O,
SA„rf?/, = o,
^^.|idyi = o ;
et :
^hiyidyi = o
doit être une conséquence de ces q équations.
On devra donc avoir (les e étant des coefficients indéter-
minés) :
hiyi = e,A,,- -f e.Aa, + •••-!- e^A,,-.
On déterminera les e en transportant dans les équations
de condition la valeur des ?/,• en fonction des £ , la première
deviendra :
+ ^' [^.A,2 + V^2-2 + ••• + ^AJ + - = B,
et l'on aura de cette manière q équations pour déterminer
les e.
Telle est la seconde solution du problème.
11. Prenons deux variables et quatre observations.
Les deux équations de condition seront :
Ay, + By, + Cl/3 + Dy, =.. H
A>, -fB>2 + CV3 + D-.v, = H'.
218 CALCUL DES PROBABILITES
Je suppose mêmes poids /?^, h.^^ //g, A,.
y, = Ae, -f- A'£2,
y, = Bp., + B s„
J/:? = Ci, -f- Csa,
y,. = Ds, + De,.
Les équations en s, après la substitution des y dans les
équations de condition, seront :
(SA*-') £, + (SAA'j £2 = H
(SAAj E, + (SA'^') £2 = H'.
Des deux méthodes indiquées, Tune est plus avantageuse
que l'autre suivant les circonstances.
La difficulté est la résolution de nombreuses équations
linéaires; le but à atteindre est d'en avoir le moins possible.
Dans la première méthode, il y a /) équations; dans la
seconde, il y en a q. On emploiera donc la première si n est
plus grand que 2/), la seconde si n est plus petit que 2p.
DlX-llL ITIÈME LEÇON
1. Nous avons cherché à rendre minimum
où hi est le poids de lobservaiion i.
On peut ramener le problème au cas où tous les poids
sont égaux. Posons
Zl = Zi \hi = \'A,F, (m,. Mo, ... Up)
et :
Xi = Xi V '^/ 1
alors :
h, Ui - x,)^ = ishiZi — sjhixif = (z/ - xr\
et on a à rendre minimum une expression telle que :
2. Nous avons vu que l'on pouvait diriger les calculs de
deux manières. Voici un exemple de chacune.
Premier exemple. — On observe un point M d'un certain
nombre de stations S,, S.,, Sg, .... dont la position est par-
faitement connue ; on mesure l'angle de ?>IS4, par exemple,
avec une direction fixe MSq. en dautres termes l'azimut
de M, soit ^, ; et ainsi de suite.
220 CALCUL DES PROBABILITES
Quelle est la position la plus probable du point M d'après
ces visées?
Soient r», y les coordonnées de M; «,-, bi celles de S,-; <{»/
l'angle de MS,- avec MS^ pris comme axe des abscisses.
s.
cp, = arc tg ;
y — bj
a,
FiG. 18.
Les équations en <p/
sont, en général, in-
compatibles, les lignes
de visées ne passant
pas exactement par M
et formant autour de
ce point un petit poly-
gone.
Un point quelconque pris à l'intérieur de ce polygone
sera une première approximation, M,, (.r^, y^). Je pose
X -- x^ -\r \,
y = 2/0 + ^ ;
^ et 7) seront de très petites
quantités.
Posons :
<?'•
<P? -f ^i-
(Dans le cas de la figure 19,
0), serait négatif) .
D'ailleurs :
Fio. 19.
Va b:
cpf =arctg^^^ •'•
DIX-HUITIÈME LEÇON 221
Développons cp, suivant les puissances croissantes de ; et tj,
en nous arrêtant aux termes du premier degré.
^'' " ^' ^ ^,^^0 - «<)^ 4- (3/0 - b,f
Soit :
A _ -Vo - ^i
(^0 — ^ij^ + (i/û — *<)'
Alors
w,- = ï/,- — 9? = A,; -}- B,-/].
La valeur observée de a., est -]/,• :
^l'.- = ?? + en
e, sera la valeur observée de w,-. Les équations que donnent
les observations seraient les suivantes :
£,- = A,Ç + B/T).
Ces équations sont, en général, incompatibles, parce que
les observations ne sont pas exactes ; il faut choisir ç et tj de
façon que
S (A,i + B,y, - s,)*
soit minimum.
Je difïérentie par rapport à ; et à t) :
SA,- (A,-; + Brn — £,) = o,
SB,(A,? + B,-ri-£,) = o;
d'où deux équations linéaires pour déterminer ç et t) :
^2A^ + riSAB = SAe,
^,SAB -f TiSB» = SBs.
222 CALCUL DES PROBABILITES
3. Deuxième exemple. — Supposons qu'on ait mesuré
neuf angles : soient zi les valeurs de ces angles, Xi les valeurs
observées, y,- les erreurs. Imaginons- qu'on ait entre ces
neuf angles les quatre relations de condition :
^1 + 2-2 + -S'a = TT,
^4 + 's + -n = ^^
-^7 + ^8 H- ^9 = ^1
^3 + ^4 + ^' = 2^-
h^ étant une quantité très petite donnée par l'observation,
l'excès sur deux droits de la somme des angles observés,
d'où :
y^ -\-y-2 + y-i^ ^h-
De même :
2/4 + 2/3 H- 3/6 = ^'•.•
y^ + .Vs + 2/9 = -^^3-
La quatrième équation de condition exprime:
2/3 + .Vi +2/7 ~ '^i-
Il s'agit de déterminer les y de façon que la somme
^y?
soit minimum.
levais introduire quatre quantités auxiliaires, e,, £3, Sg, e^,
correspondant aux quatre quantités 7?,, 7? 2, 7?3, h^ Ainsi,
pour 2/3, je me servirai du coefficient de 7/^ dans la première
équation, où il est 1, puis dans la deuxième, puis dans la
troisième, où il est 0, puis dans la quatrième, où il est 1.
y-i = ^i -\- u-
DIX-HUITIEME LEÇON 223
On trouve de même :
y^ = y6 = ^2'
y» = y-j = ^3'
2/7 = S;, -h £.;•
Pour déterminer les s, je remplace les y par leur valeur :
3e, + £^ = ^,,
3^2 -f- ^4 = ^2'
3e3 + e^ = /?3,
^1 + '2 + ^3 + '^U = ^4"'
d'où
et :
3 (^4 + ^2 + ^3^ H- 3e., = /', + '^2 + ^'3>
6e, = 3/i^ — /?, — Ao — ^3'
et ainsi de suite.
Ce procédé est ici plus commode que l'autre. Il y a neuf
angles et quatre équations de condition, d'où cinq arbi-
traires ; nous avons eu à résoudre quatre équations à (juatre
inconnues, et par l'autre méthode nous aurions eu cinq équa-
tions à cinq inconnues.
4. Autre exemple. — On a visé un certain nombre de
points M,, Mj,..., M„ (}ui ne sont pas en ligne droite et qui
devraient l'être : quelle est la droite la plus probable?
Il s'agit de déterminer n nouveaux points en ligne droite,
de telle façon que la somme des carrés des erreurs soit mi-
nimum.
224 CALCUL DES PROBABILITES
L'erreur est double : elle porte sur l'abscisse et elle porte
sur l'ordonnée. Si je suppose que la probabilité d'une erreur
sur l'abscisse soit la même que la probabilité d'une erreur
sur l'ordonnée, la somme des carrés des erreurs sur l'abscisse
et sur l'ordonnée sera la somme de quantités telles que
Nous avons besoin, en réalité, non des points P,-, mais de
la droite D qui passe par les points P/ : je dis que MjP,- doit
être perpendiculaire à D.
Si elle ne l'était pas, soit M,- P, cette perpendiculaire; en
remplaçant M; P, par M; P'-, je diminuerai la somme qu'il
s'agit de rendre minimum, et par conséquent elle n'était pas
minimum.
Je ne m'occupe plus des P : je vais chercher une droite
telle que la somme des carrés des distances des points M,- à
cette droite soit minimum.
C'est le moment d'inertie des points par rapport à cette
droite qu'il faut rendre minimum, en supposant que chacun
des points ait été affecté d'une masse égale à 1.
Comme première propriété, la droite passe par le centre
de gravité. Si on fait tourner la droite, on sait que le mo-
ment d'inertie varie suivant une loi très simple, qui amène
à la définition de l'ellipsoïde d'inertie. Ici, cet ellipsoïde
serait infiniment aplati, puisque les points sont dans un plan ;
la droite est donc le grand axe de l'ellipse à laquelle il se
réduit. Cette ellipse d'inertie serait d'ailleurs une ellipse très
allongée, puisque les points sont sensiblement en ligne
droite.
5. Dans le cas où l'on vise un point dans un plan, la pro-
DIX-HUITIÈME LEÇON 225
habilité d'une erreur eu abscisse peut u'ètre pas la même que
celle d'une erreur en ordonnée. Les deux erreurs peuvent
aussi ne pas être indépendantes. Nous avons étudié ce point
en détail dans la seizième leçon.
Nous avons été conduits à considérer, dans le cas du point
visé, une série de petites ellipses ; la probabilité que les
coordonnées du point soient comprises entre x et x -\- dx,
y et î/ -{- dy^ s'est exprimée par une fonction.
e^ dxdy^
et le polynôme du second degré P, égalé à une constante,
nous a donné l'équation d'une de ces ellipses.
Revenons aux points en ligne droite.
Du point M, comme centre, je décris une ellipse homothé-
tique à l'ellipse normale, et tangente à D. Je fais la somme
des carrés des grands axes des ellipses ainsi décrites autour
des divers points M, et j'écris qu'elle est minimum.
Ce cas se ramène aisément au précédent. Par une trans-
formation homographique, ces ellipses peuvent devenir des
cercles. Si, par exemple, le petit axe est la moitié du grand
axe, on multiplie toutes les abscisses par 2, et on n'a plus
qu'à chercher le moment d'inertie comme tout à l'iieurc.
6. Probabilité de l'erreur commise. — Le problème
se divise en trois :
1° On peut se proposer de calculer la probabilité a priori.
On n'a pas encore fait les observations ; on sait seulement
qu'on va en faire n et qu'on appliquera la méthode des
moindres carrés. Nous connaissons aussi Ihabileté de l'ob-
servateur.
CALCUL DES PROBABILITÉS. 15
226 CALCUL DES PROBABILITES
2° Le problème est entièrement différent, si nous ne savons
pas à l'avance la valeur à attribuer à la constante qui entre
dans la formule de Gauss. Nous ne connaissons pas l'habi-
leté de l'observateur, mais nous connaissons les résultats
des observations.
3° Nous connaissons l'habileté de l'observateur et les
résultats des observations.
7. Premier problème. — On ne connaît pas les résultats,
mais on connaît l'habileté de l'observateur. On suppose
alors que le poids est le même.
Soient î/^, po-f-i V" ^^s erreurs qu'on va commettre.
x^., a;^..., x,, seront les valeurs approchées des quantités
vraies z^^ z.,^..., z„.
Celles-ci seront liées par q = n — p équations de con-
dition :
*,■ (^-,1, 3-2, ... Z„) = O.
Si nous substituons à ^^j , s'a, ... z^ les quantités
a;^ , a;^, ... x^, ces équations ne seront pas satisfaites et on
aura :
*P,- [X^, X.2, ... x„) = [A,-,
où [X, est très petit.
Je remplace Xfe par y^. -{- z^^ et je développe suivant les
puissances croissantes de t//,., en m'arrêtant aux termes du
premier degré :
^\y\ + ••• + A„2/„ = [X,-.
Pour tixer les idées, faisons n = 3, et supposons qu'il y
DIX-HUITIÈME LEÇON 2i7
ait deux équations de condition :
A,?/, -f A,,2/2 -|- A3Î/3 = i^,
B,?/, H- B2?/2 + B3.V3 = a'.
a, [jl' sont très petits, mais je ne connais pas leur valeur,
puisque les observations ne sont pas faites.
Il s'agit de calculer les corrections yi à effectuer sur les
valeurs observées Xi ; les corrections dépendent évidemment
de [7. et de ix', et nous aurons, par exemple :
t/, = 0 f[x, xj!).
Je ne connais pas la forme de 6, mais je puis développer
suivant les puissances croissantes de [x et de y/, et, comme
les \i. sont très petits, négliger les carrés des \j. ; je serai con-
duit à poser :
y'\ = ^if^ + >^iV.
y 3 = ^3!^ + ^3!-^''
en général
yî = ' iv- -f Vy-',
les X étant des constantes à déterminer, Gauss les déter-
mine de façon que la valeur probable de (y,- — y [Y, c'est-
à-dire de :
(2/t — >^/[^ — Vp-')-,
soit minimum.
Il s agit de la valeur 'probable en supposant que Von con-
naisse d'avance l'habileté de V observateur, mais non les résul-
tats. Si on connaissait les deux, la solution serait en général
différente.
228 CALCUL DES PROBABILITES
8. Pour bien faire comprendre cette différence, je vais
examiner le cas le plus simple : on a observé plusieurs fois
la même quantité z.
On prend la moyenne des observations, ce qui est con-
forme à la méthode des moindres carrés.
L'erreur commise sur la moyenne sera :
Vi +^2 + ••• ■\-y'K
n
La probabilité a priori de l'erreur commise, pour la pre-
mière observation, par exemple, sera (p (t/ J dy^.
La probabilité a priori pour que z soit compris entre z et
z A- dz sera '| [z] dz.
Cherchons la A'aleur probable de(^^ ' ^^ + ••• "F VrA ^
quand on ne connaît pas les résultats des observations, et
qu'on connaît <]/.
A= / •• • fï(iLLhii±ii^±y.'^
n
ï(2/iJ?(^2)---?(y/J^i/i«^?/2---^2/A
C'est la première valeur probable.
Si on connaît à la fois l'habileté de l'observateur et les
résultats, on a une deuxième valeur probable très différente.
B:
J\{yÙ9{y2) ■■■ <!([yn)'\>{z)dz
Dans le premier cas, on avait affaire à n variables indé-
pendantes 3/,, î/2,... î/„, d'où une intégrale multiple d'ordre n;
dans le second, on n'a plus qu'une seule variable z.
DIX-HUITIÈME LEÇON 229
Supposons qu'au lieu (l'appli<iuer la rèt^'le de la moyenne
et d'adopter, par conséquent, poui- z la valeur :
a;, + a;^ -f- ■■■ -J- .r,,^
n
on ait adopté une autre valeur :
^^ ~r ^'2 I ••• ~T~ '^n
Terreur commise eût été égale à :
y t +.y-2 + ••• 4- lin
-f^,
4-^-
Nous aurions trouvé alors pour la valeur probable du carré
de cette erreur sans connaître les résultats :
et pour la valeur probable de ce même carré connaissant les
résultats :
lU + y2 + •••+y/^
+ M ? (y < ) ? (2/2 ) • • • ? {Vn ) •\ (^) dz
B:
/?(2/<) TO/2) ••• ?(;'A) '\{z)dz
Alors A atteint son minimum pour e =: 0, pourvu, que la
fonction tp soit paire.
Au contraire, pour que B atteigne son minimum pour £==0,
il faut que la loi de Gauss soit vraie-.
Gauss s'était placé au premier point de vue dans l'analyse
230 CALCUL DES PROBABILITES
que nous avons reproduite dans la quatorzième leçon, et il
avait ainsi démontré que la règle de la moyenne est toujours
légitime.
Il s'était placé au second point de vue dans l'analyse que
nous avons repi-oduite dans la douzième leçon, et il avait dé-
montré que cette règle n'est légitime que si la loi de Gauss
est vraie.
DIX-NEUVIÈME LEÇON
1. Revenons au problème qui nous occupe et clicrchons à
déterminer les X. Il s'aarit de rendre minimum
[Vi — ^^)y- — ^l:^
a et ijl' sont des fonctions linéaires des y ; donc c'est vm
polynôme homogène et du second degré, par rapport
ky^, 2/2' •••1 V"^ *1^^'^1 ^^^^ rendre minimum.
Par hypothèse, les poids sont les mêmes.
Soit 'm? la valeur probable de y] ; w^ sera aussi la valeur
probable de t/|, et celle de t/|.
Si nous avions à faire trois observations, nous n'aurions
pas le droit de supposer à Vavance ^, plus grand que ?/, o^
que y^.
La valeur probable du produit y^y.-, sera nulle : elle sera le
produit de la valeur probable de y^ par la valeur probable de
^2, et la valeur probable de y^ est nulle puisqu'il n'y a pas
d'erreurs systématiques. Cela est vrai, parce qu'on ne connaît
pas les résultats observés, et ne le serait plus si on les con-
naissait.
Comment trouver la valeur probable du polynôme? On
remplace tous les termes carrés par m-, tous les doubles pro-
duits par 0.
232 CALCUL DBS PROBABILITES
Ce polynôme, si on substitue à [j. et u.' leur expression en
fonction des y, devient :
le coefficient de t/f est (X^A^ -|- X{B^ — l)^; celui de y| est
/^Aa -h y^lB^Y; celui de t/f est (XjAg + à;BJ^
Donc :
(2/i — ^ii^ — '^îi^T
=m2[(A^X,+B,X;-if-f-(A2X,+B,X;)2+(A,A,+B3X;)2].
Voilà ce qu'il faut rendre minimum.
2. Appelons m'^P le second membre : il représente la
valeur probable du carré de l'erreur, {y^ — 3/|)^, qui subsiste
après la correction.
Égalons à zéro les deux dérivées.
dl , dll '
dP dP
c'est-à-dire :
A^(A^X,+B,X;-l)4-A,(A,X,+B2X;)+A3(A3X,+B3X;)=o,
et par symétrie :
B,(A,X,+B,X;-l)+B2(A,X,+B2X;)+B3(A3X,+B3X,')r.o.
Ce système peut s'écrire :
X,SA2 -(-X;SAB = A^,
X.SAB + /;SB2 = B,.
Il est linéaire par rapport à X^ et X^'.
DIX-NEUVIÈME LEÇON 233
J'y ajoute l'équation qui donne 3/,' :
À^(/. -}- X;a' = y[.
En éliminant X, et X^' :
SAa SAB A^
SAB 2B2 B, = o.
3. Telle est la correction à faire pour rendre minimum la
valeur probable du carré de l'erreur après la correction.
Elle est conforme à la méthode des moindres carrés.
En effet y', , y!^^ y^ vérifient :
A,?/,' + A22/2 + Agt/:; =^a,
Pour calculer les y-, il faut rendre minimum la somme
des y p.
Donc :
D'autre part
^yîcly^ =0.
^Aidy'i =0,
SB,-rfy; = o.
La première de ces deux équations doit être une consé-
quence des deux autres; donc :
d'où
et par symétrie
y; = sA, + s'B„
£:::A* -1- e'SAB = u
sSAB + s'SB* — u
234 CALCUL DKS PROBABILITES
En éliminant e et t entre ces 3 équations :
SA^ SAB
SAB SB^
Le déterminant est le même que le précédent.
Ainsi le résultat est le même, qu'on applique la méthode
des moindres carrés, ou bien qu'on fasse la correction de
façon à rendre minimum la valeur probable du carré de l'er-
reur après correction.
4. On peut se demander maintenant quelle est cette valeur
minimum: c'est celle de m^P. La valeur de P peut être mise
sous une forme plus simple. Rendons-le homogène :
P=(A,X, +B^X;-Aîj2 + (A,X,,-f-B,X;)2-h(AA+B3X;)^
et appliquons le théorème des fonctions homogènes :
--^ - d\^''^ dV,' '^ d\",'-
dP dP
Or -r- et -77-7 sont nuls ; X,' = 1 ; il reste :
uA, dk^
2P = ^
dX'i
P = -^^=l
2 dl'^
A/A, -B.X,',
Le produit par m^ est la valeur probable du carré de l'er-
reur qui subsiste après la correction.
Quand les observations deviennent de plus en plus nom-
breuses, la valeur probable du carré de l'erreur va en dimi-
nuant.
DIX-NEUVIÈME LEÇON 23o
5. Intruduisons une quatrième quantité et une troisième
équation de condition:
Tout à l'heure nous avions à rendre minimum :
(1) {y\ -^■ii-'- - ^)':^-'y';
maintenant c'est :
(2) (y, _x,^-À;./-x';a'7.
Il y a une indéterminée de plus, À,'; le minimum de l'ex-
pression (2) est évidemment plus petit que celui de l'expres-
sion (11 ; car il suffit de faire \'\ = 0 dans l'expression (2)
pour retomber sur l'expression (1).
6. Allons plus loin. Soit y l'erreur réellement commise.
y étant la correction, y — y est l'erreur qui subsiste après
la correction.
Sy- est la somme des carrés des erreurs commises ; la
valeur probable de cette somme est nr/î^.
Cherchons la valeur probable de la somme des carrés des
corrections, Sl7'" ; et la valeur probable de la somme des
carrés des erreurs après corrections, SCy — y')-.
7. J'observe que nous avons :
y'i = X,a-fXia';
y est une fonction linéaire des a, qui sont des fonctions
linéaii'es des y. Donc y est une fonction linéaire des y.
Ces fonctions y ne sont pas linéairement indépendantes,
car elles peuvent s'exprimer linéairement en fonction de deux
236 CALCUL DES PROBABILITES
d'entre elles, dans le cas présent, et en général en fonction
d'autant d'entre elles qu'il y a de quantités [^, c'est-à-dire de
fi — p d'entre elles, puisqu'il y a autant de [x que d'équations
de condition.
Considérons les y, — y i : ce sont aussi des fonctions
linéaires des y, mais pas linéairement indépendantes ; elles
sont liées par les conditions :
Al CVi —yl) + A, (^2 — y^) + A3 (2/3 — tj!^) = o,
64 (?/, — ?/,') + B., [y., - y!,) -f B3 {y., — y^) = o.
Il y a ici deux relations linéaires; en général, il y en a p.
Ainsi les y s'expriment en fonction linéaire de w — p d'entre
elles; et les y — y' en fonction linéaire de p d'entre elles.
8. Je dis que l'on a identiquement
, En effet :
y! = sA,- -}- e'B,
^y^î/l = eSA^t/, -f e'SB,!/,- = vj. -{- £>'
Sy/2 = eSA,-3/; + eSB.y/ = eiJ. + £>'.
Autre identité :
En effet, en développant S (y — yy :
ce qui est bien une identité, puisque en vertu de la précé-
dente identité :
S?/'^ - %^yy' + St/'2 = o.
DIX-NEUVIÈME LEÇON 237
9. Clierchons la valeur probable il^"-. C'est une forme
quadratique par rapport aux y.
On multiplie rn- par la somme des coefficients des termes
carrés, ou, autrement, on considère Yéquation en S.
Soient F et F' deux formes quadratiques par rapport à /t
variables ; si S est une constante,
F — SF'
sera encore une forme quadratique par rapport aux n va-
riables.
En écrivant que le discriminant est nul, on obtient une
équation d'ordre n en S, dite équation en S.
La propriété de cette équation est de ne pas changer quand
on fait un changement linéaire de variable : c'est une équa-
tion invariante.
Supposons maintenant que nous nous proposions de cal-
culer la valeur probable d'une forme quadratique F ; je prends
F= S y''. Ecrivons que le discriminant de
F — SSr/2
est nul.
La somme des racines de cette é([uatiun est la somme des
coefficients des carrés.
Soit
F = Ay? + AVI -h ^:'yl + 'lï^y,y, + ^'y,y, -f ^2\Yy,y,.
Le discriminant donne :
A — S
B"
B'
B"
B'
A-
- S
B '
B
A"-
S
238 GALGirL DES PROBABILITES
OU :
— S3 -f (A -f A' -f A") S2 + ... = o.
La somme des racines est bien A -f- A' -j- A" ; d'autre part,
la valeur probable de yf étant m^ et celle de y^y^ étant 0,
celle de F sera :
w? (A -I- A' H- A").
Comme règle, on forme donc F — S S y^, on prend la
somme des racines de l'équation en S et on multiplie par m^.
10. Appliquons ceci à la forme quadratique S y-.
Soit la forme
d» = S?/'2 — SSy2^
ou :
cï, ^ (1 _ S) Sy'2 - SS (y - yy.
Formons l'équation en S et cherchons la somme des
racines.
Les quantités y' s'expriment linéairement en fonction de
n — p d'entre elles ; Si/'^ se décompose donc en une somme
de w — p carrés, et l'on a, les \ étant des fonctions linéaires
dest/,
s/2^^f + ?! + ... + ç\_,.
Les y — y s'expriment en fonction de p d'entre elles, et
l'on a, les tj étant des fonctions linéaires des y^
S(t/-.yT = r,f + 7ii + ... + -nV
Les n fonctions linéaires ainsi obtenues sont linéairement
indépendantes. Si elles ne l'étaient pas, remarquons qu'on a:
DIX-NEUVIEME LEÇON 239
Le premier membre est une somme de n carrés :
y \ 1 Vit •••1 y n'i
le discriminant de la forme du premier membre est 1. Le
second membre ne peut avoir pour discriminant 0. On a ainsi :
$ = (1 — S) 2^2 — SS-/i2.
Le discriminant est :
(S— l)«-/'S'' = o;
n — p racines sont égales à 1 , et p égales à 0, la somme des
racines est n — p.
La valeur probable de "^y^ est nm- ; d'après la règle expo-
sée plus haut, la valeur probable de Hy"^ sera:
>]î/'2 = [n — p) ni^.
Donc :
S (t/ — y')'^ = pm^,
par différence.
Ainsi : 1" la valeur probable de la somme des carrés des
erreurs commises est nm^; 2° la valeur probable de la
somme des carrés des corrections faites est (n — p)m- ; 3° la
valeur probable de la somme des carrés des erreurs après
corrections est pw?^.
11. La valeur probable de l-y"^ est plus petite que la
valeur probable de S?/-.
C'était aisé à prévoir.
Nous cherchons à déterminer les corrections de façon que
la somme des carrés des corrections. soit minimum: c'est le
principe même de la méthode des moindres carrés.
240 CALCUL DES PROBABILITES
A mesure que les observations augmentent, si nous consi-
dérons l'erreur commise sur une observation, nous allons
démontrer qu'elle tend vers zéro.
Supposons que les observations augmentent constamment ;
le nombFe p demeure constant, ainsi quepm^ ; le nombre des
termes va en augmentant: il y a des chances pour que chaque
terme diminue constamment.
Si nous considérons la plus petite des quantités {y^ — y'kf',
10)71''
elle sera certainement inférieure à
n
Observons une même quantité n fois ; une seule variable
indépendante : p = l.
S (y — P f = m-.
Nous avons n termes, n observations faites dans les
mêmes conditions ; donc :
yy-y)-=-^-
12. Jusqu'à présent, nous avons supposé que la précision
était connue, mais que les observations n'étaient pas faites.
Le problème se pose autrement; on ne sait rien sur la
précision, mais les observations sont faites.
Nous voulons en conclure la valeur de Ji ou celle de mr.
Voici la solution.
Les y ne sont pas connues; les?/' le sont parla méthode
des moindres carrés, sy^ est connu.
J'égale sa valeur à la valeur probable calculée a priori':
d'où m'^.
DIX-NEUVIÈME LEÇON 241
13. Cette méthode est critiquée par M. Bertrand.
En effet, si ou lavait appliquée à une autre combinaison,
par exemple ^y'\ on en aurait déduit une valeur de m qui
n eût pas été la même. La méthode peut devenir suspecte.
C'est un problème de probabilité des causes, et nous appli-
querons les règles de ce calcul.
Ou demande la probabilité a posteriori, pour que h soit
compris entre certaines limites.
Cette probabilité est
CT, est la probabilité a priori de la cause, c'est-à-dire pour
que h soit compris entre fi et h -\- dh ; pi est la probabilité
pour que, si la cause a agi, les observations aient donné des
résultats respectivement compris entre x^ et x^ -\- dx^, x^ et
Cherchons la valeur probable d'une fonction de h,f{h);
cette valeur probable est:
Faisons de suite la remarque que le résultat va dépendre
de la probabilité a priori; le résultat de Gauss ne peut donc
déjà être tout à fait exact.
Si je détermine h par
f[h) = r{h),
cette valeur probable de h dépendra de la fonction.
Si je cherche la valeur la plus probable, ce sera la même
chose.
CALCUL DES PROBABILITÉS. i6
242 CALCUL DES PROBABILITES
On peut se tirer d'affaire à une condition : c'est que le
nombre n soit très grand. Le facteur cr, n"a plus grande
influence; ainsi, pour
r[h) = ix^,
toutes les méthodes conduisent au même résultat, si toute-
fois le nombre des observations est très grand.
VINGTIÈME LECOX
1. Lorsqu'on observe une quantité z, et que les observa-
tions ont donné x^, x.,..-.- x„, on peut représenter cj, et p, par
HT, = 'l (/'i-s") cUidz,
p, = Il(h:^dx., ... dx,^.
où :
\^l
-liZi/î
La probabilité a posteriori pour que h soit compris entre
h et h -}- dh, et z entre ^ et 3- -j- dz, est :
n<j; (/^.gj cJ^AcZ-g dx^dx.J ... (/a;„
/ II'} (/i,^) d/idz dx^dx.2 ... ofa;,j
Les différentielles dx^, dx.^, ... dx„ disparaissent dans ce
rapport, et il faut intégrer par rapport kh de 0 à -[- 2c et
par rapport à^de — x à-f-oc.
Imaginons que, au lieu d'une quantité z, il y en a n, 2-^,
-3-2,... z,,., qui sont fonctions de p variables w,, î<2, ••• ?</», et
que les valeurs observées des z sont a; , , x.^^ ... x„ ; les erreurs
commises sont y,, y. 2-, ••• Vu-
vsi sera la probabilité a priori de la cause : ici, pour que
h soit compris entre h et h -\- dh^ et pour que Uf soit
244 CALCUL DES PROBABILITES
compris entre ^(^ et u^ ^ du^, u.^ entre Mj et u.2 -\- du^ ...,
cj,- 3= t|/ (h, t<|, Mj, •••, «/>) ^^^ du^du^ ... c?Mp.
Pi sera la probabilité de l'effet en supposant que la cause
ait agi.
p,- = l\dx^dx.2 ... o?^„,
ou:
n == \/^-"-^-'.
La probabilité a posteriori sera :
II'j/ (A. M), vt.j ••■•> ^h>^ ^^ dUi^du^ ... du,, dx^dx.^ ... dx„
1 n^ (h, u^, u.^ ..., Uj] dh di(^du.2 ... dUf, dx^dx.^
CtJO/i
11 faut intégrer par rapport k h de 0 à -j- oo , et par rap-
port aux u de — oo à -|- oo ; quant aux différentielles des x,
elles disparaissent comme précédemment.
La probabilité cherchée s'écrit donc :
ïl<hdh dUfdif^ ... du,,
Jll'\dh
du^du.2 ... du,,
2. Elle dépend de la fonction (|/ qui est entièrement arbi-
traire, et qui est soumise à l'idée que nous nous faisons a
priori de la valeur des u et de l'exactitude que nous attribuons
a priori aux observations; mais <^ ne joue pas le plus grand
rôle si les observations sont nombreuses.
Je vais appliquer à cette fonction •} une forme particulière,
en supposant qu'elle ne dépend que de h.
On justifie cette manière de voir en disant que les mesures
donneront en «énéral aux u des valeurs très voisines les
VINGTIÈME LEÇON 245
unes des autres ; cju'elles sont comprises dans un petit
intervalle où la valeur de z variera peu si les observa-
tions sont concordantes.
La valeur probable de h^ sera :
/ W'iflndh du^du.^ ... du,,
/
Yl-ldh du^du^ ... du.
Ces deux intégrales doivent être calculées de la même
manière : h\ varie de 0 à -|- ac et les ?/ de — oo à -|- x .
3. Qu'est-ce que ^y"^ ? C'est une fonction de .c,- qui est
connu, et de zi qui est une fonction des u.
Par la méthode des moindres carrés > on obtient comme
valeur à adopter pour iii la valeur î(^ : les valeurs des u ainsi
définies ne sont pas exactes, mais elles sont les plus conve-
vables à adopter.
ui = M? + y,-,
Vi étant très petit.
Les yt sont des fonctions des y, et on peut les considérer
comme des fonctions linéaires des y, en négligeantles carrés.
Le polynôme
S?/2 = P
sera du second degré par rapport aux y, mais non homogène ;
il atteint son minimum quand les v sont nuls.
Les équations
rfP
- - = o
dVi
doivent être satisfaites quand les r sont nuls.
Donc P ne renferme que des termes du second degré et
246 CALCUL DES PROBABILITES
du degré zéro; il n'y a pas de termes du premier degré.
Pq est le minimum de Sz/"", ce qu'on a appelé Sj/'^, dont
la valeur probable est [n — p) m'^. Donc P^ est très grand en
général, et il y a d'autant plus de chances qu'il soit grand,
qu'il y a plus d'observations.
P„ = (w — p) A,
A étant une constante.
Le polynôme Pj est obtenu en additionnant entre eux les
termes du second degré ; il y a un très grand nombre de
carrés, il y en a n, et les coefficients du polynôme P^ sont
du même ordre de grandeur que n.
P, = (n-p)Q,
Q étant de l'ordre de grandeur de A.
La valeur probable de hy sera :
Jiyj — ' aZL__ __ .
J^ f^\-2 g-/,(„-;,)(A+.Q) dhdv.dv,^ ... dVp
on intègre par rapport à A de 0 à -f- ao , et par rapport aux
w de — 00 à -j- 00 .
4. La première intégrale porte sur
Q—h[n — -p) A
qui dépend de A; et sur
qui dépend des v.
VINGTIÈME LEÇON 247
11 faut calculer haut et bas
CQ-U[><-V)QaV^dc.^...d0,,.
Q est un polynôme homogène et du second degré par rap-
port aux V ; je pose :
co,- = y,- \Jh.
/iQ devient un polynôme Q' homogène et du second
degré par rapport aux w.
L'intégrale devient :
_2
Çe-'<"—v'>'^'diMydi,i^...dLOpli 2
Les limites de l'intégrale restent les mêmes, et la valeur
de l'intégrale est :
où B ne dépend pas de h.
Alors :
gr n n — p
_ f dh\h^iz' -h 2 e-AA{n-p)B
h = -^
•^ 0
ou :
-00
-J 0
248 CALCUL DES PROBABILITES
Je pose :
/?v :=
0
XI
Pdh
^ 0
formule qui dépend de ^.
5. Si nous voulions pousser plus loin, il faudrait intro-
duire une hypothèse sur <\>. Cependant, quand on suppose
n — p très ^rand, la fonction 'j/ n'a plus d'influence.
Lorsqu'on a :
CF'l>"dh
/f.*„
dh
et qu'on fait croître n indéfiniment, la limite de ce rapport
est :
où h.Q est la valeur qui rend <I» maximum.
On a donc ici :
7?v z= -
c'est-à-dire :
1^ r= Jil,
/?Q étant la valeur qui rend <ï> maximum.
A cette condition de n très grand, la valeur probable de
h'' ne dépend plus de i]/ ; la valeur probable de h est toujours
7?y, quel que soit v.
VINGTIEME LEÇON 249
Il n'en serait pas de même si l'on ne supposait pas n très
o"rand.
De plus, y% doit être très grand, non seulement en valeur
absolue, mais par rapport à p d'une part et à v d'autre
part.
Ainsi, si
n — »
il faudrait rendre maximum non plus <I>, mais iI>A-.
6. Si n n'était pas très grand, on aurait à rendre maxi-
mum:
d'où :
si n est grand, la valeur de h est à très peu près celle qui
rend maximum $ [h).
, J n — p
" ~~ 2A ~ 2S2/'2'
car :
Sy 2 = {n — p) A ;
ce résultat est conforme à la loi de Gauss :
Ilî/'2 -— ^^^ p)47l-.
La valeur probable du carré de l'erreur est :
_1_
250 CALCUL DES PROBABILITES
d'où :
et par suite
n — p
^ij- — -^
h ^"-^^
c'est bien la même valeur.
Il ne faudrait pas attacher g-rande importance à ce qu'on
a raisonné sur n — p au lieu de n, parce que n est très grand
et que est voisin de 1.
La règle est donc justifiée si le nond)re des observations
est très grand.
VINGT ET UNIÈME LEÇON
1. Je vais appliquer la méthode des moindres carrés à
une question nouvelle, la recherche d'une fonction
inconnue /" {x).
Nous mesurons certaines valeurs de cette fonction.
r(a„) = A„.
Construisons la courbe :
y = f[x)^
dont on a ainsi un certain nombre de points.
On pourrait toujours, par ces points M,, Ma,.-- M„, faire
passer une courbe, mais cette solution ne serait pas la meil-
leure: on fait passer une courbe près de ces points, aussi
continue que possible.
Un autre procédé présente aussi un certain degré d'arbi-
traire comme le procédé géométrique : je veux que ma
courbe soit de degré q aussi petit que possible.
/•(a;) = Co + C^a;+... + C,x<?.
2o2 CALCUL DES PROBABILITES
q est plus petit que n — 1 ; car si q était égal à n — 1, on
aurait une fonction satisfaisant exactement aux conditions.
Quelle valeur attribuer à 5- ? Cette valeur est arbitraire.
On la choisit d'abord assez petite, puis, si elle est insuffi-
sante, on introduit un terme de plus dans le second membre,
et ainsi de suite.
2. Laissons de côté ce mode de tâtonnements et supposons
q choisi.
Nous déterminerons les coefficients du polynôme de telle
façon que
S[/-(a,)-A,]2
soit minimum.
f[x) est linéaire par rapport aux coefficients C.
Je vais poser:
F(^) = (^ — a^) [x — a.y) ... [oc — a„).
La question se rattache au développement en fraction con-
tinue du rapport
Y{x)
Ce développement s'opère comme si l'on cherchait le plus
grand commun diviseur de F et de F'. On aura successive-
ment :
F =Q^F' + R^,
F = Q^R, + R„
1*« 3 ^^ Q« - ^ ^^'î - 2 ~r ^^« - 1 '
R„_, = Q„R„_,.
VINGT ET UNIEME LEÇON 253
11 n'y a pas de terme R„ dans la dernière équation, car
R„ =- o.
En général, F est de degré n, F' de degré n — 1, R| de
degré n — t, R,, de degré n — p — 1, R„_ , de degré 0 et
tous les Q de degré \ .
On a:
F'
1
F
Q.
1
F'
R,
1
' Q=+l:
R„-, \
R„_3~.. . H
Ainsi
F'
F-Q, +1
Q2 + i
Q3 + •-
^^"-+5:,
3. Nous avons à considérer les réduites successives de ce
développement. Comme
F-Q,F=R,,
à la place de :
F-0,R, =R^,
254 CALCUL DES PROBABILITES
je puis écrire :
-Q,F+F'(1 + Q,Q,) = R,.
Si je pose :
N, = 1, D, = Q,,
j'aurai :
N^F-D,F' = R^.
Si je pose :
Na = -Q2 D, = - (1 + Q,Qo)
j'aurai :
N^F— D-.F' = R.,.
Nous exprimerons de la même manière un quelconque des
restes successifs.
N,F - D,F' = R„
N,^^F- D,^,F =R,,,.
Comme :
R,^, = (N,F - D,F ) - Q,^, (N,, ^F - D,^ ,F').
Si je pose :
^^ i + 2 ^^ N / Q/ + 2 ^^ / + 1 '
^( + 2 ^^ ^i Q(+ 2^(+ I î
j'aurai encore :
R. + 2 = N, + ,F-D,^,F'.
Sur ces relations de récurrence, on constate que :
R,, Ra, ...etR„_2
sont respectivement de degré n — 2, n — 3, ... et 1, et
VINGT KT UNIÈME LEÇON 255
que R„_ , est une constante. N, est de degré 0, Na de degré
1, ..., N, de degré i — 1. On voit aisément que si cette pro-
position est vraie pour N,et N,^ , , elle Test encore pour N,-+ 3.
D/ est de degré i.
4. Je dis maintenant queN, et D, sont le numérateur et le
dénominateur de la réduite d'ordre i.
Les relations de récurrence le rendent évident ; mais on
peut le voir autrement.
J'écris la suite
F = Q,F+R„
R,_2 = Q,R,_, +R„
d"où je déduis :
F' 1
F-Q, + l
Q. + ..
1
Q, + — '
R.-i
Je puis encore écrire l'équation suivante :
N,F - D, F = R,.
Supposons que l'on veuille calculer la réduite
a,_ _1
h Q, -f 1
Q2 +
256 CALCUL DES PROBABILITES
Je n'ai qu'à faire R, = 0 dans l'égalité précédente, et faire
aussi
F = p„ . F' = a,.
a, = QoR; +r^
les R étant devenus des R'.
On a entre lesR' également des relations de récurrence.
h; = QaH^ -H H^
R/_2 = Q,R/-,,
R,- est nul ; donc, N^ et D, étant les mêmes que plus haut,
N,:P, - D,a, = 0,
h ~ D,
N- .
~ est bien la i" réduite,
^/
Quelle relation y a-t-il entre cette réduite et le problème
proposé?
5. L'équation fondamentale est
N,F - D,F = R,.
Faisons attention au degré de tous ces polynômes. Rappe-
lons que : N, est de degré i — 1 ; F est de degré n ; D, est de
degré i ; F' est de degré n — 1 ; R/ est de degré n — 1 — i.
De l'équation fondamentale je tire :
F ' F
VINGT ET UNIÈME LEÇON 257
Je multiplie les deux membres par x^.*.
F — i.\ixv p
Je m'en vais évaluer la somme des résidus dans les deux
membres ; notons d'abord que pour ce calcul nous ne devons
tenir compte que des deux fractions où F entre au dénomi-
nateur.
Supposons ensuite que, dans une fraction rationnelle, le
degré du numérateur soit d'une unité inférieur à celui du
dénominateur, par exemple
A''x"-* + BV-2 + ...^
A'œ" -f-B'a;"-' -f ... '
cette fraction se décomposera en :
X — a [x — a)''
Si je multiplie par x,
X — a
tendra vers SA, ou la somme des résidus, quand x croîtra
indéfiniment, les autres S (c'est-à-dire celles où i» — a entre
au dénominateur aune puissance plus grande que 1) s'annu-
leront.
Mais :
,. xP
lim -=- = o, pour X = ce ,
si le deg-ré de ^P est plus petit que - celui de Q. Donc :
la somme des résidus sera nulle si le degré du numéra-
CALCUL DES PROBABILITÉS. IT
258 CA.LGUL DES PROBABILITES
teur est inférieur de plus d'une unité à celui du dénomina-
teur.
Considérons
F '
le dénominateur est de degré n, le numérateur de degré
n — i — ^ -j- [A. Si :
n — 1 — i -}- p. < n — 1,
c'est-à-dire :
ij. < ï,
la somme des résidus sera nulle.
Ainsi quand ix est égal à 0, 1 , . . . , ^ — 1 , la somme des résidus
sera nulle.
P
6. Quand on a affaire à la fraction rationnelle pr; et que
Q n'a pas de racines multiples et s'annule pour x ^ a, le
résidu pour x ^:^ a est ,-,, ; \'
^ Q (a)
Prenons pour a l'une des valeurs qui nous a servi à cal-
culer/" (a;) ; le résidu par rapport à a de
F
sera :
gH-D,- (g) F^ ia)
F' (a) '
ou :
rt!^-D,- (a).
VINGT ET UNIÈME LEÇON 259
Ainsi, pourvu que u. soit plus petit que i :
Saf^D, (a) = o,
la sommation étant étendue à toutes les valeurs de a :
Clf^ Cl.2, ..., tt^'
Il en résulte que si P,_( est un polynôme quelconque
d'ordre i — 1 :
SP,_, (a)D,(a) = o.
Prenons :
P,-, =D,.;
alors :
SD/, {a) D,- (a) --= o.
Cette équation est vraie pourvu que k soit plus petit que i.
Mais, comme rien ne distingue les deux indices, cette
équation est encore vraie toutes les fois que k est différent
de i.
Les polynômes de Legendre ont une propriété analogue ;
pour deux d'entre eux
on a
/ ^mynd- = 0 ;
ici, au lieu d'intégrales, on considère des sommes finies,
7. Nous voulons obtenir un polynôme d'ordre q plus petit
que il — 1, dont les coefficients seront choisis de telle sorte
que
soit minimum.
260 CALCUL DES PROBABILITES
Si /"(a?) est un polynôme d'ordre ^, il peut toujours être
mis sous la forme
f[x) = C, + C^D, {œ) 4- C,D, {x) -f- ... + C,D, (x).
Il s'agit de déterminer les coefficients C de façon à rendre
minimum la somme des carrés
S (A - Co - C^D, - C,T), - ... - C,D,)2.
8. Développons ce carré.
Sur une première ligne, nous mettrons les termes carrés :
SA2 + nCl + CfSDf + C|SDi + ... + qsD^
Sur une seconde ligne nous mettrons la somme des termes
rectangles tels que
— 2CoSA — 2C^SAD, — ... — 2CçSADç,
où :
SAD, = A^D^ (a^) + ... + A,D, (a„).
; Sur une troisième ligne nous mettrons une somme de
termes tels que :
• 2CoQSD, + 2CASD,D^.
Or:
SD, {a) = o
SD,D,. = o.
Restent la première et la deuxième lignes. Je puis d'ailleurs
abréger l'écriture en posant :
La somme des termes à rendre minimum se réduit à :
SA- + ^CfllDf — 2SC,SAD,.
VINr.T ET UNIÈME LEÇON 261
Je diflérentie par rapport à C, et je divise par 2 ; en éga-
lant à zéro la dérivée par rapport à C, :
C,SD? = SAD„
d'où l'expression suivante pour C, :
SAP,
\^j —
c'est-à-dire
r. —
C ^ 4A- [ad 4- A^D/ [a^) + ••• + A«D, {a„)
D? (a, +D,M«o)+ ...+DM««)
L'analogie avec un autre problème d'analyse est évidente.
Quand on veut développer une fonction f{x) en série pro-
cédant suivant les polynômes de Legendre, on arrive à
ou :
C,
/•(a.) = vC,X,,
L
Ici les relations sont du même genre, sauf que, au lieu
d'intégrales, figurent des sommes.
9. Quel est l'avantage de ces polynômes D ?
Je suppose que l'on ait essayé d'abord de représenter les
observations par un polynôme de degré ^ : on a trouvé alors
Cq, c,,..., Cç. On constate ensuite que la somme des carrés
des erreurs commises est inadmissible : on se résigne alors
à poursuivre avec un polynôme de degré q -\- i. Tout serait
à recommencer, si l'on avait eu recours à un procédé quel-
262 CALCUL DBS PROBABILITES
conque ; ici, au contraire, on n'a qu'à ajouter un terme
Cç+^Dç+^ {x) : les précédents coefficients Cq, C^..., C^, ne
changent pas comme on le voit sur l'expression de Cj.
10. Le problème se pose déjà quand on veut simplement
interpoler une fonction : pourquoi prend-on habituellement
comme solution un polynôme d'ordre n — 1 ?
Voici une fonction / (a?), holomorphe à l'intérieur d'un
certain contour, d'un cercle par exemple. Les valeurs que
nous avons données à la variable sont petites par rapport
au rayon du cercle.
Pour les valeurs a^, a^..-, an de la variable, on connaît la
valeur de la fonction. 11 s'agit de connaître la valeur de la
fonction pour une valeur x à l'intérieur du cercle.
L'intégrale
/,■
r[z)dz)
[z — x) [z — aj [z — «2) ••• [^ —
s'annule prise le long du cercle. D'autre part
1 Ç f (z) dz
2j7: / {z - x) (z — a^) (z — a^)
est la somme des résidus de la fonction / {z) pour les pôles
X, a,, a^f.., a„, c'est-à-dire :
tM _L fl<ï I...
{x~a^){x — a^)...{x—a„) ' (a^ — x){a^ — a.^}...{af — a„)
J'appelle en général P^ le polynôme que l'on obtient en
supprimant dans :
(z — x) [z — a^) {z — a.2) ... [z -— a„)
VINGT ET UNIÈME LEÇON 263
le facteur z — a,, et en remplaçant z par «,.
- F {X) + P, + P, ■+•••+ P„ '
d'où
m=-^riaii-^^ + ivi.).
11. Telle est la formule générale de l'interpolation; au
second membre figurent : 1° un polynôme entier ; 2^ l'erreur
commise qui est JF.
Cette erreur est
f[z) dz X — g, X — a., x — a^
X z — a, z — rt, z — a,,
Si R désigne le rayon de convergence, et que x soit assez
voisin de «; pour que :
X — «, < -^1
chacun des facteurs sera plus petit que -» et sous le
signe / il y a n de ces facteurs.
Donc JF sera très petit si n est très grand.
S'il était seulement probable que le rayon de convergence
ait une certaine valeur, on serait en présence d'une question
de probabilité.
VINGT-DEUXIÈME LEÇON
1 . Je suppose que l'on sache a 2-)riori que la fonction f [x)
est développable, dans un certain domaine, suivant les puis-
sances croissantes de x.
f{x) = A^^A^x-{- ...
Nous ne savons rien sur les A, sauf que la probabilité pour
l'un d'eux, A;, d'être compris entre certaines limites, y et
y H- o?y, est :
'h,
\/\
e 'Hv'^di/.
Nous connaissons par n observations
rM = B^,
Nous cherchons la valeur probable de f{x) pour une autre
valeur de x.
C'est un calcul d'interpolation, avec cette différence que
nous cherchons un polynôme limite.
Je me hâte d'ajouter que je considère la question comme
un simple exercice de calcul, car j'ai introduit arbitrairement
VINGT-DEUXIEME LEÇON 265
la loi de Gauss ; autrement le problème resterait indéter-
miné.
2. Nous avons à déterminer les coefficients A, en nombre
infini de la fonction, à l'aide de n observations : ici, il y a
plus d'inconnues que d'observations, et nous ne pouvons
nous guider que par l'idée que nous nous faisons a priori de
la loi de probabilité.
Nous nous élevons ainsi en généralité plus encore que
nous ne l'avons jamais fait jusqu'ici, puisque nous avons à
déterminer une l'onction inconnue.
Je vais d'abord ne prendre qu'un nombre fini de coeffi-
cients.
3. D'une manière générale, soit un nombre fini d'incon-
nues,
Mj , ^21 •••1 '^p )
p est connu.
Je suppose que la probabilité pour que w,- soit compris
entre u et u -|- du est représentée par la loi de Gauss,
y/h e-'^i-'du-
La probabilité pour que l'un des u s'écarte de zéro sera
d'autant plus petite que h sera plus grand.
Nous connaissons les valeurs de certaines fonctions des ?«,
en supposant les observations parfaitement exactes.
n est plus petit que p, il y a plus d'inconnues que d'ob-
servations.
Je suppose que les x sont fonctions linéaires des u ; c'est
266 CALCUL DES PROBABILITES
ainsi que, dans l'exemple qui précède, les B étaient fonctions
linéaires des A et que l'on avait :
Ba= Ao -\-A^a,, + ...
Je pose donc :
Les observations nous ont appris que y^ est compris entre
X/^ et iJC/c -\~ dx/,. Chercher les u, c'est résoudre un problème
de probabilité de causes. Les causes, c'est que les u sont
compris entre certaines limites ; les effets observés, c'est que
les oc sont compris entre certaines limites.
La formule
va se simplifier ici.
4. Si les ?f ont des valeurs déterminées, les fonctions
linéaires Xi^ auront également des valeurs déterminées, et la
probabilité de ces valeurs sera la certitude ; suivant que ces
fonctions tomberont ou non entre les limites données par
l'observation, la probabilité sera 1 ou 0. Donc la formule de
la probabilité a posteriori se simplifie en
si l'on a représenté par p,- la probabilité de l'effet quand la
cause agit.
StJ/ porte sur toutes les probabilités relatives aux valeurs
des u compatibles avec les observations ; vsi est la probabi-
lité a priori pour que les diverses quantités u soient com-
prises entre certaines limites.
VINGT-DEUXIEME LEÇON 267
La k" inconnue a pour probabilité d'être comprise entre
u;, et ui, -f- duk
zsi comporte p facteurs analogues :
j'écrirai pour abréger :
CI, = Illlu^du.2 ... dUp
d'où :
Scj/ = / Ildu^du.^ ... diip.
Il faut intégrer pour toutes les valeurs des ii compatibles
avec les observations, c'est-à-dire satisfaisant aux inégalités
Xk < Cl.M^ -f C^W2 -1- ... -j- Clu,, < X,, -f rfa;/,.
La probabilité cherchée sera :
rô, Iidu^du.2 ... f/«/.
SCT/
/ Yidu^du.2 ... f^Wp
quand les u satisferont aux inégalités ci-dessus. Sinon
l'on aura 0 comme probabilité.
5. Si je cherche la valeur probable d'une fonction quel-
conque F des M :
/ ¥'^.du^du.^ ... dup
/ lidundu^ ... dUf^
268 CALCUL DES PROBABILITES
Nous allons transformer ces deux intégrales.
Ona:
cck < Vk < X,, -\- dxk.
Je vais prendre pour inconnues ?/^, y^ ...., _y„,et j'y adjoin-
drai p — n fonctions linéaires des u tout à fait quelconques,
Iidu^du.2 ... dup
va se transformer en :
U^dy^dy^ ... dy„dz,dz2 ... dz,,_n.
A est le déterminant fonctionnel des u par rapport aux y
et aux^; comme ce sont des fonctions linéaires, A est cons-
tant. Il vient .
_ FUdy^dy^ ... dy^dz^dz.^ ... dzp_n
Judy^dy^ ... dy^dz^dz^ ... dz^,_„
Nous avons à intégrer d'abord par rapport aux y : y^ par
exemple variera depuis x^ jusqu'à Xf -\- dx^^ c'est-à-dire
très peu ; la fonction sous le signe / va rester sensiblement
constante, et l'on pourra écrire :
_ dxi^dx.-, ... dx ,A YYidz ,^dz .
F ^ -^
dZr.
dx^dx^ ... dx,^, j Udz^dz2 ... dz
p — n
Les différentielles des x disparaîtront.
Fn et n sont des fonctions des z, et nous intégrerons par
rapport aux z àe — oo à -]- oc .
VINGT-DEUXIEME LEÇON 269
H est le produit d'un facteur constant par une exponen-
tielle, e— (''i"i- + /'2"/-+- -l-V/'-); l'exposant est un polynôme
du second ordre et non homogène par rapport aux z, F.
6. Supposons F fonction linéaire des z. Cherchons la
valeur probable de F.
Les valeurs probables des différentes quantités z s'ob-
tiennent en cherchant les valeurs qui rendent minimum
l'exposant P : soit ^^- la valeur de Zi qui rend P minimum.
Alors :
P = P, .-f- Po.
Pq est une constante, et P^ est un polynôme homogène et du
second degré par rapport aux quantités Zi — zf.
L'intégrale
/ {Zi — zf) e-^dz ^dz.2 ... dzp^„
porte sur une fonction impaire par rapport à Zj — zf ; en
intégrant de — x à -f- x , on aura zéro pour la valeur de
cette intégrale.
On en déduit que, si F est égale à F^ quand on y remplace
Zi par zf,
j F — Fq) e-^dZfdz.2 ... dzj,_„
est nulle, prise de — x à -[- x .
De même :
I F — Fqi Udz^dz., ... dz^,_,^ = c»;
270 CALCUL DES PROBABILITES
et par suite :
/ FUdZfdz^ ... dzp^n = Fq / ^dz^dz2 ... dzp_n,
c'est-à-dire :
F-Fo.
Ainsi on obtiendra la valeur probable de F en substituant
à Zf les valeurs qui rendent minimum le polynôme P.
7. Appliquons ces principes au problème que j'ai posé au
début de cette leçon.
Au sujet de f (x), nos inconnues u sont les A et nous avons :
P = 7.oAi+A,A|-f-...+A,AF-}-...
Il faut rendre ce polynôme minimum.
Les valeurs des A seront d'ailleurs arbitraires, sauf les
relations linéaires données par les observations :
r{a,)= B,.
Écrivons que P est minimum. L'accroissement c^P devra
être nul quand les A,- s'accroîtront de dA.i :
dP = AqAoC^A,, + ... -f 7?,A,(iA,- + ... — o.
Les accroissements rfA^, ..., c^A,, ... sont liés par :
df [ttk) = o.
Or, f{a^) par exemple est égal à :
/■(«O = Ao -f k,a^ -}- ... + kia\ + ...
VINGT-DEUXIÈME LEÇON 271
Donc :
o?A(, -{- a^dA^ -\- ... -\- a\dAi -|- ... = o,
cIAq + a.2d\^ -{-...-{- ai^dXi -\- ... = o,
dk^ + a„dki + ... + rt'„f/A, -f ... = o.
8. Pour que P soit minimum, la prejnière équation :
rfP = o
doit être satisfaite quels que soient les dK ; cette première
équation doit être une conséquence des n autres relations
entre ces dk.
Soient e^, £01 ••• ^" ^^^ coefficients convenablement choisis,
par lesquels nous multiplions respectivement les deux
membres de chacune de ces n relations.
hiki = t^a\ -\- z.,a% -j- ... -f- t„a;,
Si je pose :
f^=i + f; + i + -+f+--
le coefficient de z^ dans
sera 9 (a7fl^), etc.
11 vient donc finalement :
f{x) = £^2> (aJfl.) + £2? (^^2) + ••• + £«? («^««)-
272 CALCUL DES PROBABILITES
Nous disposerons des coefficients e de façon à satisfaire
aux observations, d'où n équations à n inconnues.
9. La forme de f [x) dépend des h. Pour que la série qui
représente cp yx) soit convergente, il faut que les coefficients
h augmentent avec une rapidité (suffisante.
Si l'on a:
I ^ I < p et I fl-/, I < p,
c'est-à-dire :
I xuk 1 < p^
la série sera convergente quand :
hi > p2'.
En somme, cela revient à dire que la probabilité pour que
les derniers coefficients A, s'écartent de zéro devient de
plus en plus faible. Il suffit de supposer qu'à partie du n^
rang les h sont infinis. Dans <p (a?), les termes extrêmes où
entrent /?„, A„+^... s'annuleront et cp [x] sera un polynôme
d'ordre n.
10. Cherchons à dégager une impression de l'ensemble
de ce cours. Dans les données des problèmes, il est entré
une part considérable d'arbitraire, même dans les cas les
plus simples, ceux où l'on n'avait affaire qu'à la détermina-
tion d'une constante. Lorsque le nombre des cas possibles
est devenu infiniment grand, les difficultés ont augmenté.
Puis, quand sont intervenues les probabilités des causes, un
fait important s'est dégagé : la présence de cjj a entraîné
diverses hypothèses, mais toutes arbitraires.
VIXdT-DKL'XIHMF-: LKÇoN 'H'A
()n 110 peut (l('|»i)iiillt'r coni]»!!' Icivk^iiI de ces liypollioscs
arl)il raircs les (|iH'sli()iis de protialiililcs : aussi le mot de
calcul scmlilc-t-il aud)iliiMix, cl il iic scrl (pià dissimulci-
litj'îKii'ancc altsnluc.
Ainsi, quelle est la {d'ohahilité pour (pie la (piati'ième
1
dt'ciniale du lotiarillune duu nombre (uilier soit \ ? C est --'
car il n'y a pas plus de raison ponr une décimale que pour
une autre; nous avouons de cette manière notre ignorance
complète, car, en consultant les tables, nous trouverions
cette prohabilili' qui n'est qu'approxiniativement de — -• Là,
le problème a pris une l'orme objective, tout à fait inabor-
dable au matluMuaticieu.
Nous avons vu que si des corps très noml)reux étaient
animés d'une vitesse de rotation uniforme, mais diiïérente
de l'un à l'autre, (pielle qui' fût la distribution initiale des
longitudes, la distribution finale serait sensiblement uni-
forme. Sur des considérations de ce genre, on peut essayer
de fonder une espèce de calcul.
Quelle est la probabilité pour que des comètes, étrangères
au système solaire, aient une orbite hyperbolique ? On sup-
posera jjien que, à une certaine distance du soleil, les co-
mètes sont uniformément réparties dans l'espace ; mais sur
quoi fonder celte hypothèse V en vertu de quelle cause ?
Quelle que soit cette cause, sa probabilité tout au moins
est susceptible d'être représentée par / f [x.y^z) dxdyclz,
étendue à toutes les valeurs qui satisfont aux conditions
imposées. Et alors on dira, on admettra que f est continue,
CALCUL DES l'ItiJUABILITÉS. IS
274 CALCUL DES PROBABILITES
qu'elle varie très lentement, que dans une portion très faible
de l'espace elle est constante.
C'est seulement par des hypothèses de ce genre qu'on
arrivera ainsi à poser les problèmes ; mais on ne doit pas
s'attendre à rencontrer quelque résultat pleinement satisfai-
sant. Le calcul des probabilités offre une contradiction dans
les termes mêmes qui servent à le désigner, et, si je ne crai-
gnais de rappeler ici un mot trop souvent répété, je dirais
qu'il nous enseigne surtout une chose : c'est de savoir que
nous ne savons rien.
FIN
TABLE DES MATIÈRES
Prcmirre Ircdii I
Deuxièmo Icron |o
Troisième leçon ■)7
Qualrième leçon ',0
Cinquième leçon ;;()
Sixième leçon (,2
Septième leçon 7,-,
Huitième leçon ^^)
Neuvième leçon IqI
Dixième leçon I ^lO
Onzième leçon IDI
Douzième leçon
Treizième leçon I5(j
(Jualoizième leçan ICO
Ouinzième leçon D^o
Seizième leçon {()(;
Dix-septième leçon 207
Dix-huilième leron.
!19
Dix-neuvième leçon 231
Vingtième leçon
Viuiil e( unième leçdii 2.")l
Vinat-deuxième leçnn 2nî
Tours. — Imprimerie Desup Frères.
7
c^^^^^ .» •
b». %.
li^
^e
ftm
iwl
mm
S* ^.