Interventions d’I.-J. Bienaymé (1796-1878) à la Société Philomatique de Paris en 1840 et 1843

mardi 16 avril 2013
par  TrotouxD
popularité : 2%

Interventions d’Irénée-Jules Bienaymé à la Société Philomatique de Paris.

1. Séance du 8 février 1840. CALCUL DES PROBABILITÉS : Applications à la statistique médicale, Extraits des procès-verbaux des séances de la société Philomatique de Paris pendant l’année 1840, p. 10-13.

2. Séance du 14 mars 1840. MATHÉMATIQUES : Calcul des probabilités, « Remarques sur la manière dont les personnes peu habituées à observer la nature pourraient entendre ce qu’on appelle la constance des résultats moyens des observations », Extraits des procès-verbaux des séances de la société Philomatique de Paris pendant l’année 1840, p. 18-22.

3. Séance du 21 mars 1840. MATHÉMATIQUES : Calcul des probabilités, « Solution d’une question de probabilité qui est la traduction d’un problème électoral », Extraits des procès-verbaux des séances de la société Philomatique de Paris pendant l’année 1840, p. 23-26.

4. Séance du 25 avril 1840. MATHÉMATIQUES APPLIQUÉES : Probabilités, Extraits des procès-verbaux des séances de la société Philomatique de Paris pendant l’année 1840, p. 37-43.

5. Séance du 13 juin 1840. « Quelques propriétés des moyennes arithmétiques des puissances de quantités positives », Extraits des procès-verbaux des séances de la société Philomatique de Paris pendant l’année 1840, p. 67-68.

6. Séance du 1er avril 1843. HISTOIRE DES MATHÉMATIQUES : Pascal et le calcul des probabilités, Extraits des procès-verbaux des séances de la société Philomatique de Paris pendant l’année 1843, p. 49-50.


Séance du 8 février 1840.

CALCUL DES PROBABILITÉS : Applications à la statistique médicale.

M. Jules Bienaymé expose les observations suivantes sur l’application du calcul des probabilités à la statistique médicale.

« Les difficultés de cette application ne tiennent pas seulement aux obstacles qui se rencontrent quand on veut recueillir des expériences exactes sur la plupart des maladies. Elles dépendent en outre de ce qu’on ne saurait séparer entièrement les effets d’un traitement déterminé de ceux que peuvent et doivent produire la nature abandonnée à elle-même, ou les traitements simples sur lesquels aucune contestation ne s’élève. Le rapport du nombre des guérisons au nombre des maladies observées se trouve donc être une expression complexe de plusieurs probabilités ; et la différence entre les rapports de ce genre résultant de deux traitements différents, n’exprime pas précisément de combien l’action salutaire de l’un de ces traitements a surpassé l’action de l’autre. Cet excès d’une action sur celle qui lui est comparée se trouve divisé par un nombre peut-être très considérable, et capable dès lors de masquer presque entièrement le résultat cherché. On s’assure, par un calcul facile, que ce diviseur n’est autre que le quotient de l’unité par la fraction qui exprime la possibilité de ne pas guérir dans les conditions ordinaires, et abstraction faite des traitements sur lesquels il s’élève des doutes. »

« Ces considérations conduisent à plusieurs formules dont ressortent entre autres les conclusions suivantes :

1° Pour obtenir des résultats moyens assez précis dans la statistique médicale, il faudra souvent recueillir bien plus d’observations que ne semblent l’indiquer les théorèmes de probabilité de Bernoulli, on plutôt de Bayes, dont se sont servi Laplace, Fourier et M. Poisson, quand les données statistiques étaient plus simples. En effet, les formules que donnent ces théorèmes exigent des modifications, soit dans leurs éléments, soit dans leur interprétation, avant de s’appliquer aux questions de statistique médicale pour lesquelles elles n’ont pas été construites.

2° L’effet réel d’un traitement contesté, c’est-à-dire la proportion des individus sauvés sur les individus qui n’auraient point guéri sans ce traitement, sera toujours très difficile à déterminer, puisque les guérisons dues au traitement contesté se confondent naturellement avec d’autres guérisons, dont la statistique ne parviendra à les séparer qu’avec beaucoup de précautions et de peines soutenues d’une haute sagacité.

3° II en sera de même pour la différence réelle entre les effets salutaires de deux traitements, attendu que la différence donnée par l’observation s’éloignera de la différence réelle dans un rapport inconnu le plus souvent.

4° Mais heureusement la connaissance exacte de cette différence n’est pas nécessaire pour prononcer entre deux traitements employés dans des circonstances identiques, parce que la probabilité que l’un des effets surpasse l’autre, sans préciser de quelle quantité, devient indépendante du diviseur inconnu dont il a été question. Seulement alors, pour que la comparaison ait quelque valeur, il faudra s’assurer que le nombre des observations est assez grand ; car la probabilité obtenue pourra être très petite, soit parce que l’un des traitements n’est en réalité que de très peu préférable à l’autre, soit parce que tous deux se seront exercés sur un trop petit nombre de malades en danger de ne pas guérir, pour que la différence puisse acquérir quelque certitude. Cette indécision se présentera de toute nécessité dans bien des cas où le bon sens ne suffit pas seul pour prononcer. On ne parviendra à la trancher qu’en se rendant un compte approximatif de la proportion du nombre des malades qui auraient pu guérir sans les traitements mis en comparaison.

5° L’indécision fâcheuse dont il vient d’être parlé a lieu encore quand on obtient une grande probabilité qu’un traitement est préférable à un autre. Cette grande probabilité peut résulter de ce que le nombre des expériences, étant assez élevé, décide avec une précision très considérable de la supériorité peu marquée d’un traitement sur l’autre. Elle peut résulter aussi de ce que la supériorité est au contraire très prononcée, bien que les expériences soient peu nombreuses. On ne pourra lever le doute que par le même procédé approximatif de l’évaluation du nombre des malades qui auraient pu guérir ou ne pas guérir sans les traitements. II faut avouer que ce sera la une source de discussions délicates, jusqu’à ce qu’on possède des données statistiques très multipliées. »

« Enfin, la construction de formules nouvelles prouve que la statistique médicale est peu avancée ; car des renseignements tant soit peu exacts auraient fait déjà sentir les défauts de l’application qu’on a cru pouvoir faire de la formule de Bayes. C’est, en effet, les relevés statistiques qui font naître par les faits mêmes qu’ils développent les formules propres à en déterminer les lois et les probabilités. »

« Tout le monde sait qu’il en est ainsi dans toutes les sciences d’observation, et que les formules ne se créent et ne se rectifient que d’après les expériences. Toute science veut d’abord une bonne statistique. Il importe donc que la statistique médicale recueille de grandes suites de faits, avant qu’on soit fondé à y appliquer des formules suffisamment appropriées à la nature particulière qui la caractérise. Le calcul des probabilités s’applique à toutes choses ; mais il ne peut qu’accompagner la recherche des faits. C’est ce que démontrent sans réplique les illusions nombreuses par lesquelles se sont laissé séduire de grands génies mêmes qui n’ont pas assez étudié les données pratiques dans les recherches de probabilités. »


Séance du 14 mars 1840.

MATHÉMATIQUES : Calcul des probabilités. — M. Jules Bienaymé communique quelques remarques sur la manière dont les personnes peu habituées à observer la nature pourraient entendre ce qu’on appelle la constance des résultats moyens des observations. Selon lui, les savants, à qui la signification de ces mots est familière, ne devraient pas pour cela négliger d’en faire de temps en temps le sujet de courtes explications, surtout quand leurs recherches doivent finir par entrer dans la masse des idées d’une circulation un peu générale.

« Les mots constance des résultats moyens expriment qu’il devient de plus en plus probable, à mesure que les observations se multiplient, de voir se reproduire des moyennes sensiblement égales, quand il a été déjà recueilli un grand nombre de semblables moyennes peu différentes entre elles. Cette reproduction n’est nullement assurée, bien que très probable, et nul observateur instruit ne regarderait comme contraire à l’ordre de la nature qu’elle n’eut pas lieu pendant une ou plusieurs séries de nouvelles expériences. Ce serait seulement là un fait extraordinaire. Mais pour les gens du monde, parmi lesquels aujourd’hui on répète souvent que les résultats moyens de grands nombres sont fixes, sont constants, il ne serait pas étonnant qu’ils prissent à cet égard une fausse idée. — Ils pourraient imaginer, par exemple, que s’il pleut beaucoup pendant trois mois de suite, et que la quantité de pluie déjà tombée ait atteint à peu près la quantité moyenne annuelle observée depuis longtemps, les neuf autres mois de l’année ne sauraient manquer d’être d’une sécheresse extrême. Ils supposeraient que la compensation est de nécessité absolue, parce que le résultat moyen annuel est une quantité à peu près fixe, qu’il n’a pas varié sensiblement depuis longues années, et que dès-lors l’évènement contraire n’a plus qu’une probabilité infiniment petite, pour ainsi dire. — Ce serait, on le voit, une erreur du même genre que celle qui régnait naguère parmi les personnes qui jouaient à la loterie. Elles avaient appris par les écrits des géomètres combien il est invraisemblable qu’un numéro désigné ne sorte pas dans une série de tirages nombreux ; ainsi il y a plus de 999 à parier contre 1 , qu’une série de 121 tirages , ou de 605 numéros , renfermera ce numéro désigné au moins une fois. Les joueurs en concluaient, quand déjà un numéro était resté dans la roue durant plus de 100 tirages, qu’il y avait par ce fait seul une probabilité énorme de le voir sortir dans l’un des tirages les plus prochains. Les ouvrages populaires sur les probabilités indiquent cette erreur. Mais le paralogisme sur lequel elle repose n’y est pas expliqué nettement : et c’est pour cela sans doute qu’elle a persisté avec force pendant les cinquante années de l’existence de la loterie. Chaque fois que l’absence d’un numéro s’est fait remarquer dans une série de tirages tant soit peu prolongée, les recettes du trésor public se sont augmentées. »

« Puisque le paralogisme dont il s’agit peut s’attacher à des résultats importants, il y a encore utilité a en bien montrer le défaut. On sait que nous croyons d’autant plus à un événement futur, qu’il fait partie d’un ensemble plus certain, et que l’autre partie déjà réalisée de cet ensemble était pour nous moins probable isolement avant d’arriver. C’est à cela que se réduit, en dernière analyse, tout raisonnement conjectural. Notre esprit évalue rapidement la probabilité de l’évènement complet, composé des faits arrives et des faits attendus, comme si l’ensemble de ces faits était encore à venir ; il évalue ensuite séparément la probabilité des faits arrivés, comme s’ils étaient de même encore futurs, puis il divise la première probabilité par la seconde ; ce qui revient à renverser la fraction qui exprime cette seconde probabilité, et a en faire le multiplicateur de la première. Le quotient, ou plutôt le produit ainsi obtenu, est pour nous la probabilité des faits attendus, déduite des faits observes. Cette marche logique ne saurait tromper qu’en un point ; c’est l’évaluation plus ou moins exacte des probabilités primitives des faits considérés, et par conséquent l’appréciation de l’ensemble des faits dont il faut tenir compte. Les joueurs de loterie ne pêchaient nullement par l’emploi de la forme du raisonnement ; mais ils se méprenaient sur le choix des probabilités à comparer. II est bien vrai qu’il y a une probabilité excessive, qu’il est presque certain qu’une série de 121 tirages renfermera un numéro désigné ; mais c’est sous la condition que ce numéro occupera une place quelconque dans l’ordre des tirages. Or on ne s’assujettit plus à cette condition lorsqu’on assigne la place de ces numéros dans les derniers tirages. Ce n’était donc pas cette grande probabilité de la sortie à une place quelconque sur 605 places, qu’il fallait prendre pour terme de comparaison. L’ensemble des faits arrivés et des faits futurs étant, par exemple, 110 tirages consommés sans voir le numéro donné, et 11 tirages attendus, dans lesquels il doit sortir au moins une fois ; la probabilité de cet événement composé devait seule entrer dans le calcul mental qu’un joueur avait à faire. Il se serait alors facilement convaincu que cette dernière probabilité, loin d’être voisine de l’unité, comme celle (999/1000) du résultat moyen d’une place quelconque, n’avait au contraire qu’une faible valeur à peine supérieure à 1 sur 2500. La probabilité de la partie arrivée, c’est-à-dire des 110 tirages sans le numéro donné, étant du même ordre de grandeur 1/1276 , le quotient de l’une par l’autre 1276/2500 ne pouvait donner qu’une probabilité fort médiocre à la partie non arrivée, soit à la sortie du numéro donné au moins une fois en 11 tirages. Ici cette probabilité, qui se réduit à près de 51/100, est précisément égale, comme on le sait à celle qu’on aurait eue avant les 110 premiers tirages ; de sorte que les faits passés ne pouvaient avoir aucune influence sur les faits à venir ; et, en effet, il n’en existe aucune quand les possibilités des événements sont connues comme dans une loterie. »

« Bien que les possibilités des événements naturels soient inconnues, le vice du raisonnement est absolument le même quand on considère la quantité de pluie qui est tombée en trois mois d’une année, et celle qui peut tomber dans les neuf mois suivants. Effectivement, la grande probabilité du résultat moyen annuel presque invariable suppose essentiellement que la distribution de l’eau sur toute l’année peut être quelconque. Il n’y a donc nulle comparaison à faire de cette probabilité avec celle qui doit se rapporter à une distribution spéciale de la pluie. Dans ce cas déterminé, l’événement composé dont on doit calculer la probabilité consiste en une grande pluie pendant trois mois, suivie d’une grande sécheresse. Et il y aura à diviser cette probabilité, quelle qu’elle soit, par celle d’une grande pluie de trois mois calculée isolement. Ces deux probabilités inconnues ne sont pas formées directement dans les résumés d’observations météorologiques, mais on peut les en déduire ; alors seulement on saura s’il y a quelque raison de croire à une sécheresse prochaine quand la quantité moyenne de la pluie annuelle vient d’être à peu près épuisée, ou bien si alors même de nouvelles pluies restent possibles. On trouverait sans doute que c’est ce dernier cas qu’indiquent les tables météorologiques, quoique la quantité moyenne de l’eau tombée chaque année soit jusqu’ici d’une constance remarquable. »

« Le procédé qui vient d’être employé pour rendre l’erreur manifeste est d’une application générale à tous les résultats d’observations qui s’écartent des moyennes constantes de grands nombres d’observations. Si l’on voulait bien y donner quelque attention, il servirait à dissiper plus d’un préjugé répandu dans le monde, même parmi les hommes qui ont reçu ce qu’on qualifie d’ordinaire d’une bonne éducation. »


Séance du 21 mars 1840.

MATHÉMATIQUES : Calcul des probabilités. — M. Jules Bienaymé annonce qu’il est parvenu à résoudre exactement une question de probabilités dont il n’existait pas de solution rigoureuse. II s’agit de déterminer, parmi un grand nombre de paquets de cartes pris au hasard dans une grande quantité de cartes de deux couleurs en proportion donnée, combien il peut se trouver de paquets dans lesquels l’une des deux couleurs, désignée d’avance, l’emporte sur l’autre.

Ce problème méritait qu’on en recherchât la solution véritable parce qu’il offre des difficultés spéciales, et en même temps parce qu’il est susceptible d’une application intéressante. On sait effectivement que c’est la traduction fort simple d’une question électorale, et M. Bienaymé a soin de faire remarquer que l’idée première de cette question ne lui appartient pas, mais que la solution qui en a été donnée pêche par la base.
Voici l’énoncé de ce problème électoral. On suppose le nombre très grand des électeurs d’un grand pays partage entre deux opinions dans un rapport connu ; on suppose de plus les électeurs répartis au hasard en collèges nombreux, et l’on demande quel est, avec une grande probabilité, le nombre des collèges dans lesquels la majorité appartiendra à l’opinion qui possède une pluralité connue dans le corps électoral.

La solution que ce double problème avait reçue était fondée sur l’application erronée d’une proposition très vraie, savoir : que la probabilité de trouver les cartes d’une couleur désignée, en pluralité dans l’un quelconque des paquets, ne dépend que du nombre des cartes de ce paquet, et nullement du rang qu’il a pu occuper dans la répartition de la masse des cartes données. Pour que ce théorème de probabilités conserve toute exactitude, il faut que le paquet considéré soit isolé de tous les autres, qu’on n’ait aucun égard à la composition de ceux-ci, et que le rapport des deux couleurs dans chacun puisse avoir toutes les valeurs possibles. Mais on conçoit que si l’on vient à envisager simultanément deux ou plusieurs paquets, la probabilité de la composition de l’un influe sur la probabilité de la composition des autres ; de sorte qu’on ne peut, sans paralogisme, conclure du théorème précédent que la probabilité de trouver une couleur en pluralité reste constante dans une suite de paquets formés d’un égal nombre de cartes ; ou, si les paquets sont inégaux, que cette probabilité ne change qu’à raison du nombre des cartes qu’ils contiennent.

Malgré l’erreur évidente de cette conclusion, le hasard a voulu qu’elle influât peu sur la solution numérique qui l’avait prise pour base. Pour expliquer cet effet, M. Bienaymé rappelle que les probabilités de résultats de grands nombres sont exprimées d’ordinaire par une intégrale, qui se représente dans la plupart des problèmes de physique, etc., et dont les limites décident des limites mêmes qu’il convient d’attribuer aux valeurs les plus probables. De plus, ces dernières limites se composent de deux termes, dont l’un est proportionnel au nombre des événements considérés, tandis que le second terme n’est proportionnel qu’à la racine carrée de ce nombre. Or, dans la question actuelle, le hasard a voulu que le terme proportionnel au nombre des paquets de cartes, ou des collèges électoraux, n’ait reçu aucune altération de l’inexactitude du raisonnement. Elle n’a altéré que le second terme, qui détermine la grandeur des limites des valeurs probables, et qui est seulement proportionnel à la racine carrée du nombre des collèges. La solution rigoureuse ne modifiera donc que l’étendue de ces limites. Mais elle a donné lieu de rectifier dans l’expression du premier terme une erreur de calcul. C’est une de ces erreurs qui, dans les calculs astronomiques, ont occasionné parfois d’assez vives contestations, parce qu’on attache aux problèmes qu’ils résolvent une très grande importance. C’est l’omission d’une quantité de l’ordre conservé dans l’approximation dont on fait dépendre ce premier terme.

II résulte donc des recherches de M. Bienaymé que les valeurs numériques fournies par la solution dont il indique le défaut, ne recevront de changements notables que dans les limites, mais les valeurs moyennes resteront à peu près les mêmes. Ainsi, par exemple, on avait trouvé que 208 000 électeurs, répartis en 440 collèges électoraux, devraient donner à l’opinion qui possède une majorité de 1/20 (qui compte environ 104 000 contre 94 000), près de 85 collèges sur 100. La solution rigoureuse changera à peine ces chiffres. Les électeurs qui comptent une pluralité de 1/20 devront donc l’emporter au moins d’une voix dans près de 374 collèges. Les électeurs en minorité dans la masse l’emporteront cependant au moins d’une voix dans 66 collèges. On a tiré de cette disproportion entre le rapport des nombres des collèges et le rapport de la majorité à la minorité, une conséquence peu favorable au système d’élections. On a dit qu’une opinion qui possède une minorité très forte n’aurait qu’un très petit nombre de représentants ; et qu’ainsi le système représentatif ne serait qu’une déception, sans les influences que crée la réunion d’électeurs de la même localité et d’autres causes semblables. M. Bienaymé croit qu’il y a lieu de déduire des résultats du calcul une conséquence contraire. Dans les états anciens ou il n’existait qu’une seule assemblée, la minorité la plus forte était nécessairement étouffée. Or on voit que la distribution en collèges assure à une minorité de 1/20 environ 66 députés sur 440. C’est là une garantie tout-à-fait à l’avantage du système moderne, qui tient bien plus compte des individualités, et par suite des minorités, que ne le faisait le système ancien.
En achevant, M. Bienaymé fait encore observer que sa solution pourra, sous le point de vue logique, présenter quelque intérêt, parce que c’est au moyen d’un pur artifice d’analyse qu’il réussit à dégager le problème d’un ensemble de raisonnements très difficiles à suivre, si difficiles même qu’il n’a pu sur le champ remplacer l’ancienne solution, bien qu’il en eut aperçu la défectuosité dès le moment qu’elle a été publiée. Cette défectuosité existe en effet toute semblable dans la solution du jeu de trente et quarante, dans laquelle M. Bienaymé l’avait reconnue antérieurement. Mais l’idée d’employer l’artifice analytique qui conduit à une solution exacte ne lui est venue que récemment.


Séance du 25 avril 1840.

MATHÉMATIQUES APPLIQUÉES : Probabilités. — M. Jules Bienaymé expose un principe de probabilités qu’il croit entièrement nouveau, et qui lui parait susceptible de recevoir des applications continuelles dans les sciences d’observation. Voici en quoi consiste ce principe.

Lorsqu’on a fait un grand nombre d’expériences, ou qu’on a recueilli une masse de renseignements statistiques pour en déduire un certain résultat moyen, on peut les partager en plusieurs groupes, soit d’après l’ordre dans lequel les expériences ont été effectuées, soit d’après toute autre considération particulière à ces expériences. Si l’on détermine ensuite les résultats moyens de chacun de ces groupes naturels, on conçoit qu’ils diffèreront plus ou moins entre eux, et qu’ils s’écarteront plus ou moins du résultat général. D’ordinaire il se trouvera des écarts d’autant plus grands, que les groupes seront plus multipliés. II est facile de voir que l’étendue de ces écarts doit dépendre du résultat observé ; mais il semble au premier coup d’œil qu’elle devrait également dépendre de la possibilité que donne aux phénomènes en question la cause ou le système de causes qui les régit. Cependant il n’en est rien, quand ce système de causes reste constant pendant toute la durée des expériences. On démontre sans peine que, dans ce cas, les relations de probabilité qui doivent exister entre le résultat général et les résultats partiels sont absolument indépendantes de la possibilité des phénomènes ; il n’entre dans les expressions qui les caractérisent que les résultats seuls des observations faites, même alors que la loi de possibilité des phénomènes est connue à l’avance.

Ainsi, par exemple, si l’on tient note des résultats de 120 000 coups d’un dé ordinaire, on saura d’avance que la possibilité d’amener l’as est 1/6, de sorte que ce point devra se présenter à peu près 1/6 de 120 000, ou 20 000 fois. Cependant il pourra arriver que l’as, au lieu de paraître à peu près une fois sur 6, ne se montre en 120 000 coups qu’une fois sur 20, c’est-à-dire environ 6 000 coups. Eh ! bien, malgré cette différence entre le rapport observé et la possibilité réelle, quand on partagera les 120 000 jets de dé en plusieurs séries, et qu’on examinera le nombre des as dans chacune de ces séries, comme la cause sera restée constante, on trouvera que les séries partielles donnent à peu près des nombres d’as proportionnels au nombre des as contenu dans la série totale ; et cela d’autant plus exactement que les séries partielles contiendront chacune plus de coups de dé. Si le rapport total des as s’est trouvé de 1/6 à peu près, sur les 120 000 épreuves, ce sera encore cette fraction 1/6 qui régira les séries partielles, et chacune d’elles offrira, à certains écarts près, environ 1/6 d’as. Si, au contraire, le rapport total s’est trouvé de 1/20, nonobstant la possibilité constante 1/6 de la face du dé qui porte l’as, ce sera la fraction 1/20 qui régira les séries partielles, et il se rencontrera dans chacune d’elles 1/20 d’as, toujours à certains écarts près, dont la probabilité est assignable.

Cependant, comme il vient d’être dit, chaque série partielle, dans ce dernier cas comme dans le premier, aura été formée sous l’influence de la possibilité 1/6 ; et il semblerait a priori que cette possibilité dût donner un grand nombre de séries où il se trouverait 1/6 d’as : de sorte qu’elle n’aurait fourni le rapport extraordinaire 1/20 sur l’ensemble des 120 000 épreuves que par quelques séries fort rares qui s’écarteraient excessivement du rapport de possibilité 1/6. Mais cette présupposition serait inexacte ; et au contraire, quand l’ensemble des coups de dés fournit le rapport 1/20, si éloigné du rapport réel de possibilité |, il devient extrêmement probable, moralement certain (pour employer l’expression de Jacques Bernoulli) que les séries partielles, même très multipliées, s’écarteront peu du rapport 1/20.

La démonstration du principe qui assure ce résultat est très simple. Supposons qu’on ait exécuté un grand nombre c de tirages dans une urne contenant des boules blanches et des boules noires dans un rapport connu, tel que p soit la possibilité d’amener une boule blanche. Supposons encore qu’il soit sorti a boules blanches et b noires, et qu’on partage le nombre total c des tirages en deux séries, la première de m et la deuxième de n tirages. On sait que la probabilité d’amener dans la première série d’épreuves r boules blanches, dont la possibilité est p, s’exprime par le terme du développement de la puissance m du binôme p + (1— p), dans lequel p a l’exposant r, soit :


  \frac{m.(m-1).\cdots.(m-r+1)}{1.2. \cdots .r}p^r  (1-p)^{m-r}

Semblablement la probabilité d’amener q boules blanches dans la deuxième série d’épreuves, sera


  \frac{n.(n-1).\cdots.(n-q+1)}{1.2. \cdots .q}p^q (1-p)^{n-q}

Partant le concours des deux événements (r boules blanches dans la première série, et q boules blanches dans la deuxième) aura pour probabilité le produit des deux précédentes, soit :


  \frac{m.(m-1).\cdots.(m-r+1)}{1.2. \cdots .r} \times \frac{n.(n-1).\cdots.(n-q+1)}{1.2. \cdots .q}p^{r+q}  (1-p)^{m+n-r-q}

Maintenant il convient d’observer que les épreuves sont faites, et qu’il est sorti a boules blanches sur le total c = m + n des épreuves : de sorte que les deux nombres de blanches r et q, dans les deux séries partielles, sont assujettis à la condition r + q = a. Chacun de ces nombres ne peut donc varier que depuis 0 jusqu’à a : ce qui rend impossible un grand nombre de cas qui pouvaient arriver dans deux séries d’épreuves. II n’y a dès lors lieu de considérer parmi les valeurs de la probabilité ci-dessus que celles qui sont données par la condition r + q = a : et puisque ces valeurs deviennent seules possibles, il faut en faire la somme, et diviser l’expression précédente par cette somme. Or, on reconnait sans difficulté que la somme dont il s’agit est


  \frac{(m+n).(m+n-1).\cdots.(m+n-a+1)}{1.2. \cdots .a} p^{a}  (1-p)^{c-a}


ou


  \frac{c.(c-1).\cdots.(c-a+1)}{1.2. \cdots .a} p^{a}  (1-p)^{b}

Le quotient de la probabilité ci-dessus par cette somme est


  \frac{ \frac{m.(m-1).\cdots.(m-r+1)}{1.2. \cdots .r} \times \frac{n.(n-1).\cdots.(n-q+1)}{1.2. \cdots .q}p^{r+q}  (1-p)^{m+n-r-q}}{\frac{c.(c-1).\cdots.(c-a+1)}{1.2. \cdots .a} p^{a}  (1-p)^{b}}

et l’on voit qu’à cause de c = m + n et a = r + q, la possibilité p disparait complétement de ce quotient.

Ainsi la probabilité de trouver r boules blanches dans la première série, et q = a - r blanches dans la deuxième, quand on partage en deux séries un nombre total c de tirages qui a donné a boules blanches, est simplement


  \frac{ \frac{m.(m-1).\cdots.(m-r+1)}{1.2. \cdots .r} \times \frac{n.(n-1).\cdots.(n-q+1)}{1.2. \cdots .q}}{\frac{c.(c-1).\cdots.(c-a+1)}{1.2. \cdots .a}}

expression dans laquelle il ne reste plus que les résultats des tirages, c’est-à-dire des faits observés.

Avec un peu d’attention, on reconnait dans cette expression la suivante :


  \frac{a.(a-1).\cdots.(a-r+1) \times b.(b-1).(b-2) \cdots .(b-m+r+1)}{c.(c-1).\cdots.(c-m+1)} 
 \times \frac{m.(m-1).\cdots.(m-r+1)}{1.2. \cdots .r}

qui est la possibilité de tirer r boules blanches et (m - r) noires d’une urne contenant c boules, dont a blanches et b noires, quand on y prend m boules au hasard, sans en remettre aucune.

Les relations de probabilité entre les séries partielles et la série totale des épreuves, ou des expériences, sont donc non seulement indépendantes de la possibilité réelle des événements, mais de plus elles sont les mêmes que si les faits dont se compose une série partielle avaient été tires au hasard de la série totale des faits observés.

L’application de ce principe (qui s’étend d’ailleurs à tous les cas de probabilités constantes, quel que soit le nombre des espèces d’événements dont le résultat se compose) sera très aisée à faire.

Lorsqu’il importera de connaitre si la cause, ou le système de causes, qui a régi une série d’expériences, n’a point subi de variation pendant la durée de ces expériences, il suffira de les diviser en séries partielles, et de calculer si les écarts des résultats moyens de ces subdivisions sont renfermés dans les limites que leur assigne le résultat moyen général, en vertu du nouveau principe.

II est fort digne de remarque, ajoute M. Bienaymé, qu’on pourra conclure par ce procédé, que la cause a été constante ou variable, sans rien préjuger sur la possibilité réelle qu’elle peut donner aux phénomènes. Cette conclusion subsistera, quand même le résultat moyen s’écarterait complétement de la valeur de cette possibilités, et que par conséquent il donnerait à l’observateur une idée tout-à-fait inexacte de cette valeur. C’est là une conséquence importante, car il en ressort que la statistique, et en général les sciences d’observation, peuvent toujours fournir des données positives sur la constance des lois naturelles, indépendamment de la valeur de ces lois.

Voici la formule à employer quand on divise seulement en deux parties la série des observations, et qu’il ne s’agit que de deux phénomènes exclusifs l’un de l’autre, comme le sont la sortie d’une boule noire et la sortie d’une blanche dans une suite de tirages.

En conservant les lettres déjà employées, on supposera qu’il a été observé a phénomènes d’un certain genre sur un grand nombre c d’expériences, et que le phénomène contraire a par suite eu lieu c - a = b fois. Si l’on prend une série partielle de m de ces observations, on doit trouver, dans l’hypothèse d’une cause constante, que le nombre des phénomènes dont il s’est présenté a sur la masse, est, pour la série partielle, compris entre les limites


  r=N \pm u \sqrt{2m.\frac{ab}{c^{2}}.\frac{c-m}{c}}


N étant le plus grand nombre entier renfermé dans


  (m+1) \frac{a+1}{c+2}


avec une probabilité, exprimée par


  \frac{1}{\sqrt{\pi}} \int_{-u}^u dt e^{-t^{2}} + \frac{e^{-u^{2}}}{\sqrt{2\pi.\frac{ab(c-m)}{c^{3}}m}}.

Le plus souvent la division en deux séries suffira pour manifester la constance ou l’inconstance de la cause. Car on peut remarquer que les limites précédentes sont très étroites.

Fourier, dans les Recherches statistiques sur Paris, avait conseillé de séparer les observations en groupes, afin de reconnaître par les écarts des résultats partiels, si l’on pouvait accorder quelque confiance au résultat moyen général. Mais il n’a donné aucune règle à ce sujet. L’incertitude subsistait donc. On avait même appliqué à l’examen des résultats partiels une formule de Laplace, qui se rapporte à un problème très différent du problème actuel : c’est celle qui exprime les écarts probables d’un nombre m de nouvelles épreuves, quand déjà on a fait c expériences qui ont donné a fois le phénomène attendu. Les limites du nombre r des répétitions de ce phénomène dans ces m épreuves nouvelles (et non dans m des c épreuves déjà faites), sont :


   r=N \pm u \sqrt{2m.\frac{ab}{c^{2}}.\frac{c+m}{c}m}


avec une probabilité


  \frac{1}{\sqrt{\pi}} \int_{-u}^u dt e^{-t^{2}} + \frac{e^{-u^{2}}}{\sqrt{2\pi.m \frac{ab(c+m)}{c^{3}}}}.


Ici N est le plus grand nombre entier contenu dans


   (m+1) \frac{a}{c}.

On voit que ces limites sont plus grandes que celles qui résultent du principe énoncé. Elles les surpassent dans le rapport de \sqrt{c + m} à \sqrt{c - m} (par exemple de \sqrt{3} à 1, si m = \frac{c}{2}). On était par suite exposé, en les employant, à regarder comme résultats d’une cause constante des écarts beaucoup trop considérables, et qui indiquaient positivement l’existence d’une cause variable.

On comprend sur-le-champ que les limites des écarts des nombres qui ont concouru à former un résultat moyen, doivent être bien moindres que ne le sont celles de nombres qui n’y ont pas contribué, bien que les uns et les autres soient régis par la même possibilité constante. Cette prévision s’accorde avec les formules qui dérivent du principe nouveau. Elles ne dépendent plus que des termes du développement du binôme des factorielles : on peut s’en assurer. Et le plus grand terme de cette suite, ainsi que ceux qui I’avoisinent, sont relativement plus grands que les termes correspondants du développement du binôme des puissances. De là des écarts moindres pour une même probabilité.


Séance du 13 juin 1840.

M. Jules Bienaymé donne l’énoncé de quelques propriétés des moyennes arithmétiques de puissances de quantités positives. II rappelle d’abord que diverses questions de mécanique et de probabilités ont conduit depuis longtemps à démontrer que la moyenne arithmétique des carrés de plusieurs quantités est plus grande que le carré de la moyenne arithmétique de ces quantités. On peut énoncer ce théorème d’une autre manière, et dire que la racine carrée de la moyenne des carrés de certaines quantités est toujours plus grande que la moyenne de ces quantités. On voit alors plus aisément que cette proposition n’est qu’un cas particulier d’une autre plus générale, qui consiste en ce que la racine d’un degré quelconque de la moyenne arithmétique des puissances de même degré, est toujours plus grande que toute expression semblable dans laquelle le degré est inférieur. C’est ce qui s’indique algébriquement en disant que la valeur de


 \left( \frac{c_1a_1^m + c_2a_2^m + \cdots + c_na_n^m}{c_1 + c_2 + \cdots + c_n} \right)^{\frac{1}{m}}

croît ou diminue toujours avec m.

Cette proposition et plusieurs conséquences qui s’en déduisent sur les grandeurs relatives des moyennes de puissances sont susceptibles de nombreuses applications analogues à celles qui dépendent simplement de la moyenne des carrés. On en conclut, par exemple, que


 \frac{a_1 + a_2 + a_3 + \cdots + a_n}{n} < (a_1^{a_1}.a_2^{a_2}.a_3^{a_3}. \cdots . a_n^{a_n})^ {\frac{1}{a_1 + a_2 + \cdots + a_n}}

On savait déjà qu’au contraire


 \frac{a_1 + a_2 + a_3 + \cdots + a_n}{n} > (a_1.a_2.a_3. \cdots . a_n)^ {\frac{1}{n}}.

Séance du 1er avril 1843.

M. Bienaymé communique les résultats de quelques recherches qui montrent que Pascal avait porté les applications du calcul des probabilités beaucoup plus loin qu’on ne le croit communément.

La dix-neuvième lettre du Recueil du chevalier de Méré fait apercevoir comment ce bel-esprit avait eu d’ingénieuses idées que Pascal étendit sur-le-champ, en les appuyant sur les bases solides des mathématiques.

Dans les Pensées, Pascal emploie souvent le mot parti, aujourd’hui remplacé par les mots espérance mathématique. II applique ce terme de jeu aux chances des événements de la vie ; et même il forme sur la croyance à l’existence de Dieu et d’une vie future un argument qui est resté célèbre, bien qu’on n’ait pu en approuver les éléments. On sait aujourd’hui par le texte de cet argument, dont M. Cousin a donné toutes les parties, que ce morceau n’était pas même rédigé, et qu’il n’offre point de sens mathématique complet.

Quoi qu’il en soit, on ne reconnait pas moins dans cet essai imparfait toute l’importance que Pascal attachait aux probabilités. Cette importance se trouve établie, en outre, par le petit traité de Dubois de la Cour, intitulé : Qu’il y a des démonstrations d’une autre espèce et aussi certaines que celles de la géométrie. Ce petit morceau, méprisé par Condorcet, prouve que Dubois n’avait pas compris Pascal, et n’avait pas vu que ce grand génie attachait un sens géométrique aux probabilités et aux témoignages ; mais en même temps il met hors de doute que Pascal communiquait à ses amis les vues et les espérances que lui donnait son nouveau calcul.

Mais l’autorité la plus positive à cet égard est celle de Jacques Bernoulli, dont le théorème fameux est demeuré le fondement de toute théorie des probabilités. On lit, p. 225 de la quatrième partie de son Ars conjectandi, que ses idées lui ont été suggérées, partiellement du moins, par les chapitres 12 et suivants de l’Art de penser, dont il appelle l’auteur magni aciminis et ingenii vir. Or, cet Art de penser n’est autre que la Logique de Port-Royal, publiée l’année même de la mort de Pascal (1662). Les derniers chapitres contiennent de véritables Éléments du calcul des probabilités applique à l’histoire, à la médecine, aux miracles, à la critique littéraire, aux événements de la vie, etc. ; et ils se terminent par l’argument de Pascal sur la vie éternelle.

On pourrait alléguer que la Logique est due à Arnault. Mais on sait que les écrivains de Port-Royal se faisaient volontiers des prêts mutuels dans des vues de perfectionnement.

Quoi qu’il en soit, la citation même de Bernoulli assure à la France la priorité entière de l’invention du calcul des probabilités : bien que le traité que Pascal avait rédigé et présenté à l’Académie des sciences sous le titre : Aleæ geometria, (t. IV, p. 410) semble perdu pour toujours.