Vous êtes sur la page 1sur 19

Journ@l Electronique dHistoire des Probabilits et de la Statistique

Electronic Journ@l for History of Probability and Statistics Vol 1, n1; Mars 2005

Lucien March (1859-1933) Une statistique mathmatique sans probabilit?


Michel ARMATTE1
Rsum La carrire de Lucien March, ingnieur statisticien d'Etat entre 1900 et 1930, est clate entre les tches administratives dues sa position cl auprs de la Statistique gnrale de la France , les innovations mcanographiques, l'application des outils de la statistique de Karl Pearson aux questions dmographiques et conomiques, et la diffusion en France des thses phnomnalistes et eugnistes qui les accompagnaient. Elle offre un point d'entre intressant pour comprendre les enjeux de la statistique mathmatique du dbut XXe, en particulier ses rapports difficiles avec le calcul des probabilits. Abstract Lucien March had a very large spectrum career of engineer and State-statistician between 1900 and 1930. It covers administration of the Statistique Gnrale de la France, use of machines in census, applications of Karl Pearson's statistical tools to demography and economics, and diffusion of Pearson's epistemology and eugenics. A study of this career is a good entrance into the mathematical statistics of the first nineteen's, especially its hard relation to the calculus of probabilities.

*** Il y a deux avantages prendre la carrire de Lucien March comme fil conducteur d'une exploration de la statistique des premires dcennies du XXe sicle. En premier lieu, le cas de Lucien March illustre parfaitement l'tonnante varit des activits et centres d'intrt que semble runir la profession de statisticien cette poque. Si le personnage n'est pas inconnu, il n'est pas non plus le prototype du grand savant. Il l'est par contre de l'ingnieur statisticien d'tat, plac au carrefour de recherches, de dbats, et d'actions concernant tour tour la mcanisation du recensement, les questions dmographiques du moment entre natalisme et eugnisme, la philosophie des sciences, la mthodologie de la statistique conomique (professions, chmage, salaires, prix), et le rle des mathmatiques dans cette mthodologie. Engag la fois dans les tches routinires de la statistique administrative et dans des innovations fondamentales pour ces divers champs, Lucien March fait preuve d'un clectisme qui n'est cependant pas isol. Entre ingnierie de la production de chiffres, science administrative des "choses remarquables d'un Etat", science de la population, science de la socit, discipline ancillaire de l'conomie politique, et branche des mathmatiques relative aux raisonnements inductifs, la Statistique n'arrte pas de chercher sa voie et de redfinir son essence profonde, mais aussi son rle social. En second lieu, le cas de Lucien March illustre la position caractristique d'une catgorie importante de statisticiens concernant l'articulation de la mthodologie statistique avec le calcul des probabilits. Dans la tradition laplacienne du dbut XIXe, l'analyse statistique n'est rien d'autre que l'application du calcul des probabilits aux questions de la philosophie naturelle (par exemple la mcanique cleste) ou aux "sciences morales". Si Laplace entendait pas l principalement les questions de tmoignages, de jugement des tribunaux, de dcision des assembles, et de dures de vie, ou encore de bnfices des tablissements, Poisson, Quetelet, L.A. Bertillon, et quelques autres, en avaient fait l'outil principal, via le concept d'un homme moyen, d'une analyse des socits en terme de causes constantes, qui permettait de fonder les sciences sociales de la seconde moiti du XIXe. Mais la suite des critiques de Bertrand, de l'cole allemande de Lexis et Bortkiewitz, et de l'cole

Centre A. Koyr et Universit Paris Dauphine, michel.armatte@dauphine.fr

Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

biomtrique anglaise, cette doxa identifie par les statisticiens au modle de l'urne invariante qui fonde le modle binomial et la loi des erreurs, se trouve srieusement mise mal dans la communaut des statisticiens qu'ils soient dmographes ou conomistes. Ds lors deux tentations sont possibles : jeter l'enfant avec l'eau du bain en refusant tout modle probabiliste comme dfinitivement trop loign des ralits observes, ou bien adopter de nouveaux modles probabilistes plus gnraux que le modle normal. Le tiraillement entre ces trois attitudes vis--vis du calcul des probabilits tradition laplacienne, rnovation et dpassement, ou rejet systmatique est particulirement perceptible au tournant du sicle dans le domaine des statistiques conomiques, jusque dans les annes 1930, dont on sait qu'elles marquent un retour en grce des probabilits la fois chez les mathmaticiens et logiciens grce aux approches formelles, parfois axiomatiques, de Von Mises, Borel, Frchet et Kolmogorov, et chez les conomtres de la Cowles Commission.

1. La carrire d'un statisticien au tournant du sicle


Qui est donc Lucien March pour cumuler ainsi toutes les facettes d'une discipline qui n'est pas encore acadmique, et pour incarner le refus de toute une gnration de voir cette discipline ravale au rang d'application d'une branche des mathmatiques, peu recommandable au demeurant? L'essentiel de ce que l'on sait sur lui, se trouve dj expos dans la thse de Marietti sur la SGF, dans la notice ncrologique de Huber qui lui avait succd, dans notre thse [Armatte, 1995)], dans les articles de Desrosires [1998] et Jovanovic et Le Gall [2001], et ne progressera gure en l'absence d'archives de la Statistique Gnrale de la France qui semblent bien avoir disparu jamais. Nous nous contentons donc d'une prsentation synthtique de sa biographie. N le 6 dcembre 1859, Lucien March (prononcer Marc, comme le fait Bunle dans les entretiens accords A. Desrosires) est entr l'Ecole polytechnique en 1878 et sorti dans le corps de l'artillerie de marine. Il a d'abord t ingnieur dans l'industrie mcanique avant d'tre appel en septembre 1892 l'Office du Travail cr un an plus tt, et dont le sousdirecteur tait le polytechnicien de sa promotion Arthur Fontaine (1860-1931). March est charg du recensement professionnel coupl au recensement gnral de 1896. C'est cette occasion qu'il rencontre l'exposition universelle de 1889 l'ingnieur amricain Hollerith (1860-1929) faisant dmonstration de sa machine cartons perfors initialement destines au dpouillement du Census amricain de 1890. Aprs une tude de son fonctionnement in situ lors du congrs IIS de Vienne en 1892, il fait adopter ces machines (perforatrice, trieuse, tabulatrice), et du personnel recrut en grand nombre (une centaine) par une socit de droit franais cre par Hollerith, pour le dpouillement mcanique du recensement des entreprises de 1896, celui de la population continuant passer par les communes. La Statistique Gnrale de la France, fonde par un arrt du 3 avril 1840 sur la base d'un Bureau de statistique du Ministre du commerce mis en place par Thiers en 1833, a t dirige successivement par Moreau de Jonns, Legoyt (1852), Challot (1871), Toussain Loua (1875), Victor Turquan (1887), et Blancheville (1896). Elle fut ensuite place sous l'autorit du directeur de l'Office du Travail, puis intgre celui-ci en aot 1899 dans une Direction du Travail dirige par A. Fontaine au sein du Ministre du Commerce, et installe ds 1901 dans les nouveaux locaux de l'avenue Rapp2. Deux statisticiens adjoints, Huber et Risser, sont recruts en 1901, et March devient le chef des services techniques de l'Office et de la SGF. Pour le dpouillement du recensement de 1901, il carte les machines Hollerith, pour une question de cot, et aussi d'inadaptation la dcentralisation, mais rcupre pour la SGF le

2 Voir [Marietti 1947] et [Huber 1937]

2 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

personnel mis sa disposition quatre ans plus tt par Hollerith3. Il met au point une nouvelle machine, le classi-compteur dont le principe est plus simple et assez diffrent : pas de stockage de l'information dans les cartes perfores, ce qui est une rgression vu d'aujourd'hui, mais une conomie de temps l'poque, et saisie des donnes des bulletins sur un clavier dont chacune des 60 touches est affectable une modalit de rponse, et fait avancer d'une unit le compteur associ. Les compteurs se transforment en imprimante sur une feuille qui prend la trace de leurs valeurs. Il obtient galement que les oprations ne passent plus par les communes et les prfectures mais soient entirement centralises la SGF. En 1906 et 1907, les services techniques de Lucien March sont prenniss par un rattachement direct la Direction du Travail, elle-mme loge au nouveau Ministre du Travail. La SGF est rorganise dans ce cadre avec un effectif statutaire de "2 statisticiens, 3 statisticiens adjoints4, 1 chef de travaux, 4 secrtaires comptables, 9 contrleurs, 6 vrificatrices, 6 garons, 1 concierge"5 et Lucien March en devient le chef (1907) puis le directeur (1910-1920) alors qu'elle prend son autonomie par rapport la Direction du Travail. Cette priode correspond un nouvel engagement de March dans des travaux de statistique conomique, via le Comit d'tudes relatives la prvision des chmages industriels, cr par un arrt de juin 1911, auprs de la SGF, prsid successivement par Levasseur et Cauws, puis Albert Thomas. Il fait suite une premire commission6 tablie en 1905 et charge de prparer un programme d'enqutes annexes au recensement de la population, puis une Commission des crises tablie en 1908 et prside par A. Picard7. Ce Comit avait demand qu'un service d'observation des prix soit annex la SGF. Inscrit au projet de budget pour 1913, celui-ci ne reut son statut et ses financements qu'aprs guerre, en octobre 1917. La premire guerre mondiale entrane en effet une rupture des crdits de la SGF, et une mobilisation des intellectuels sur de nouvelles tches de rorganisation de la production, en particulier des mathmaticiens Paul Painlev (Ministre de la Guerre) et mile Borel (secrtaire gnral de la Prsidence du Conseil), de l'historien Simiand et du sociologue Halbwachs membres du cabinet du ministre de l'Armement Albert Thomas. Le service des prix, charg de suivre les indices conomiques et d'informer le gouvernement de ce qu'ils annonaient, a jou un rle important aprs guerre, dans la dfinition du programme de reprise de l'activit conomique. A lui seul il comportait davantage de statisticiens que la SGF dix ans plus tt. En 1919, la veille du dpart en retraite de March8, la SGF comprenait statutairement 43 personnes (dont 4 statisticiens et 6 statisticiens adjoints) et le Service d'observation des prix en comprenait 14 (dont 2 statisticiens et 3 statisticiens adjoints)9.
3 Voir [Peaucelle 2004] qui s'intresse principalement aux cots compars de ces innovations 4 C'est ce moment que furent recruts les statisticiens adjoints Lenoir, Dug de Bernonville, Bunle et Chabrol. 5 [Marietti 1947] p. 35. 6 Cette premire commission prside par Foville, l'ancien ministre Pierre Baudin, regroupe, outre 3 snateurs, 2 dputs, et 4 autres politiques, les statisticiens-conomistes J. Bertillon, F. Faure, A. Fontaine, de Foville, Y. Guyot, C. Laurent, E. Levasseur, L. March. 7 [SGF 1913] 8 Lucien March quitte la Direction en 1920 pour tre remplac par Michel Huber. La SGF sera directement rattache la Prsidence du Conseil par un dcret de 1930. En 1942 elle est absorbe par le SNS fond par Carmille. En 1946 le SNS devient l'INSEE. 9 Vingt ans plus tard Carmille cre un Service de Dmographie d'une toute autre ampleur (925 emplois) et dot de plusieurs ateliers de mcanographie, qui absorbera la petite SGF en 1941, et consacrera la victoire provisoire Ville-

3 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

Cette carrire d'une vingtaine d'annes la tte de la SGF fit de Lucien March le principal animateur des dbats sur la statistique conomique dans diffrents lieux savants. C'est d'abord la Socit de Statistique de Paris (SSP) : il y entre en 1897 et la prside en 1907. C'est ensuite l'Universit : il est le principal fondateur en 1922, avec Borel, Huber, et Darmois de l'Institut de Statistique de l'Universit de Paris, plac sous la tutelle des quatre Facults, et qui forme chaque anne moins d'une dizaine d'tudiants, ce qui est peu, mais c'est la seule formation la statistique mathmatique, ct des enseignements de Levasseur au Collge de France, de Liesse au Conservatoire des Arts et Mtiers, puis de Divisia au CAM, l'Ecole polytechnique et aux Ponts et Chausse, lesquels constituent plutt une introduction au traitement de donnes conomiques et sociales10. Il est surtout le reprsentant de la statistique officielle franaise l'Institut International de Statistique (IIS) dont il fut membre en 1901. Principal organisateur de la session de Paris en 1909, une rencontre qui devait jouer un grand rle dans la diffusion des mthodes nouvelles de l'cole biomtrique londonienne (Galton et Pearson), il est avec ses partenaires anglais, le responsable d'un double transport de la corrlation et de la rgression vers le continent et vers le milieu des conomistes11. Ce rle de passeur est accentu par le fait que March soit le premier franais bien connatre les travaux de Karl Pearson dont il adopte (et adapte, parfois de manire critique) les trois principaux ingrdients : les outils d'analyse statistique, exposs par Pearson dans les Contributions mathmatiques la thorie de l'volution entre 1895 et 1906, principalement la mthode des moments, le systme de courbes de distribution, et la corrlation -, mais aussi comme nous le verrons, le programme eugnique, et la philosophie des sciences12.

2. March et la mthodologie statistique


2.1. Distributions
Les premires tudes de March, en 1898, se proposent de chercher des fonctions mathmatiques ajuster sur des distributions empiriques de salaires qu'il souhaite comparer, et qui proviennent de diverses enqutes13. Pourquoi les ajuster? Pour pouvoir les rsumer par quelques valeurs caractristiques, et la plus importante selon lui est le mode (qu'il appelle valeur normale) et que l'on obtient comme maximum de la densit. Lucien March choit d'ajuster une forme sophistique de la courbe de Pareto. On en rappelle rapidement les caractristiques. La loi des revenus de Pareto apparat pour la premire fois dans le Giornale degli Economisti en 1895, puis dans un recueil publi par l'Universit de Lausanne l'anne suivante, et enfin dans le premier chapitre du livre III du Cours d'Economie Politique. Exploitant des donnes anglaises de Giffen de 1843 et 1879-80, ainsi que des donnes italiennes (Benini), prussiennes (Soetbeer, 1876-86), saxonnes (Ammon), bloises, et parisiennes, Pareto propose de reprsenter dans un plan cartsien les logarithmes des revenus x en fonction des logarithmes du nombre N(x) des revenus suprieurs x. Or dit-il 1)Nous sommes de suite frapps du fait que les points ainsi dtermins ont une tendance trs marque se disposer en ligne droite (...) 2)Nous observons que les lignes droites ainsi traces font avec l'axe des
des "renseignements individuels continus" sur les "dnombrements anonymes et globaux", comme le dira Alfred Sauvy.
10

Sur l'ISUP, Voir [Pressat 1987]

11 Voir les articles de Yule, Bowley et Edgeworth dans le BIIS de 1909. 12 Voir [Porter 2004] ou notre note de lecture sur cet ouvrage dans Mathmatiques et Sciences Humaines, 2005. 13 Une enqute de la chambre de commerce de Paris de 1860, une enqute de l'Office du travail de 1891-93, une enqute allemande sur les mineurs de Dortmund, et une enqute amricaine du Dpartement fdral du Travail.

4 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

abscisses des angles qui ne sont pas trs diffrents l'un de l'autre.(...) Nous nous trouvons ici en prsence d'une loi naturelle, qui nous rvle une tendance des revenus se grouper d'une certaine faon, au moins dans les socits et pour les poques considres. (...) Ces rsultats sont trs remarquables. Il est absolument impossible d'admettre qu'ils sont dus au hasard. Remarquant que la pente de la droite ajuste peut tre prise pour mesure de l'ingalit de la distribution, Pareto fait de son ajustement l'outil permettant de trancher le dbat entre libraux et socialistes sur la question de la pauprisation croissante des masses laborieuses, en faveur des premiers videmment. Un de ces mules, Otto Ammon, se saisira de la loi de Pareto pour en tablir des versions plus sophistiques, et pour en faire le chanon manquant permettant de fonder l'ingale distribution des revenus dans les socits industrielles sur la rpartition naturelle normale des capacits humaines. Cette naturalisation des ingalits sociales est l'oeuvre chez plusieurs conomistes, comme par exemple Andr Liesse qui consacre son ouvrage sur le Travail (1901) une refondation de l'conomie sur un tel principe. Chez Pareto, l'ajustement est totalement empirique et ne drive d'aucun principe gnrateur de type probabiliste. Dans l'addition au cours de 1897, convaincu par les thses de Lexis, il affirmera que s'il faut chercher un modle, celui-ci doit tre plusieurs urnes, mais le modle de combinaison de lois binomiales dont il accouche ne le satisfait pas, parce que pour lui, c'est la formule empirique qui prcde la formule thorique, comme Kepler a prcd Newton, et qui doit concentrer d'abord notre attention. D'autre part Pareto rejette l'usage de la mthode des moindres carrs pour ajuster la droite sur le nuage de points. Dans un papier de 1909, il en donnera quatre justifications. 1) Contrairement au cas de la thorie des erreurs de mesure, on n'observe pas n fois le mme objet donc les carts au modle ne sont pas des erreurs 2) la forme de la fonction f n'est pas connue a priori; 3) les carts (qui ne sont pas des erreurs) ne suivent pas une loi normale 4) Dans le cas d'une variable transforme par le logarithme la mthode des moindres carrs minimise des erreurs relatives et pas des erreurs absolues sur la variable observable, donc ces dernires peuvent tre trs importantes. Dans un cas comme celui de la courbe des revenus que Pareto qualifie de problme d'interpolation terme permettant de comparer plusieurs mthodes y compris celle des moindres carrs sans rfrence aux distributions de probabilits - il en conclut qu'il est prfrable d'utiliser la mthode de Cauchy. Dans son tude de 1898, Lucien March s'inscrit dans cette tradition. Il choisit comme formule de dpart une formule emprunte dit-il Otto Ammon, que l'on appelle parfois la 3me loi de Pareto, de densit telle que log y = A + B.log x + Cx. Elle lui est galement inspire par le systme de courbes de Pearson (type III). March ralise 3 ajustements de cette formule, par la mthode des moindres carrs, par la mthode des moments de Pearson, par la mthode de Cauchy, et conclut aisment que les deux dernires mthodes l'emportent. Ces conclusions insistent fortement sur l'intrt de l'approche de Pearson, et confirment totalement ce que dit Pareto de la supriorit de la mthode de Cauchy sur celle des moindres carrs. Il est important de noter que l'approche de l'ajustement d'une distribution par ces trois auteurs s'oppose assez radicalement celle que dveloppent au mme moment d'autres statisticiens. Dans une srie d'articles (1883, 1892, 1896) de la mme priode, Edgeworth met en place une modlisation des distributions asymtriques par une loi des erreurs gnralise qui est un dveloppement en srie de la loi multinomiale, dont la loi normale est une premire approximation. Il remarque que cette loi des erreurs gnralise peut se dduire par un simple changement de variable une translation dit-il de la densit normale, et il cherche gnraliser cette mthode de translation pour rendre compte de donnes comme celles des salaires : "Je propose de traiter les groupes asymtriques d'observations comme s'ils taient gnrs de la manire qui vient d'tre dcrite, comme si chaque membre du groupe observ 5 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

tait une certaine fonction du membre d'un groupe normal; et de reprsenter le groupe par une formule qui, selon cette hypothse, constitue la seconde approximation de la vraie distribution. Ce n'est pas que cette hypothse soit universellement bonne, ni que la formule soit toujours la plus approprie, mais elle est parfois la formule, et en gnrale une bonne formule." "() La thse principale de ce papier est que la prfrence doit tre donne des formules ayant une certaine affinit avec la loi normale, vues comme si elles taient produites par quelques modification des conditions de convergence de la loi normale : ces conditions sont au nombre de deux : la coopration d'un nombre infini d'agents indpendants, et la petitesse des effets de chaque agent sur le rsultat total. (...) Dans la recherche d'une base a priori pour une loi gnrale de frquences, je me spare des distingus statisticiens qui regardent la prcision de l'ajustement comme le seul test d'une formule reprsentative. Ainsi le professeur Pareto, inventeur d'une belle et utile reprsentation de la frquence de revenus de diffrentes grandeurs, semble oppos l'ide mme d'une courbe de probabilit gnralise.14" Edgeworth et Bowley publient en 1902 une tude dans laquelle cette loi des erreurs gnralise est ajuste des donnes de salaire. L'quation de translation n'est pas ajuste par les moindres carrs, mais par une mthode de mdiane gnralise. Bowley, tout autant l'lve de Pearson que d'Edgeworth, russit d'ailleurs l'exploit de ne pas voquer les moindres carrs dans son trait, pas plus dans son long chapitre sur les mthodes d'interpolation que dans celui qui traite de l'ajustement, ou encore de la corrlation. La mthode n'apparatra que dans un dernier appendice de la quatrime dition.

2.2. Corrlations.
Un second exemple de recherches statistiques que March va dvelopper est son travail sur "la comparaison de courbes statistiques" [March 1905]. Il y construit une ligne de coefficients de concordance entre deux sries temporelles sur la base de la notion de concomitance que l'on trouve dans la Logique de Mill, et d'un simple comptage des concordances et discordances emprunt Fechner. Le coefficient de corrlation empirique du "product moment" de Pearson15 est situ dans cette ligne plus gnrale des coefficients de concordance et du problme nouveau qui se pose aux conomistes de ce qu'il appelle la covariation de deux sries temporelles. La reconstruction de la corrlation en covariation est bien un emprunt Pearson, mais un emprunt rappropri qui s'accompagne 1) d'un rejet de tout lien avec la notion de distribution normale que le coefficient r de Pearson soit d'abord et avant tout un estimateur du paramtre de la forme quadratique de la densit de la loi normale deux dimensions n'intresse pas March et 2) d'une affirmation de la spcificit des corrlations calcules en conomie, savoir la dimension temporelle des sries, laquelle constitue en quelque sorte leur lment commun, la source essentielle de leur liaison. Cette dimension temporelle explique d'ailleurs la rticence des conomistes passer du graphique temporel o sont superposes les volutions de deux sries x et y au graphique cartsien dans lequel le nuage de points (xi, yi) rvle la liaison des variables sous condition d'une limination de la variable temps. Elle explique aussi que de nombreux conomistes et March en est - pensent que le coefficient de corrlation ne se suffit pas lui seul, et qu'il ne

14

[F.Y. Edgeworth 1898 et 1899].

coefficient de corrlation entre x et y est gal au rapport de la covariance entre x et y au produit des cartstypes de x et y.

15 Le

6 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

prend sens qu'associ au graphique temporel. March traite dans le JSSP (1904-5) des reprsentations graphiques et propose l'IIS une normalisation de celles ci qui permette des usages comparatifs. La mme dimension temporelle des donnes conomiques suggre aussi une srie de traitements pralables de ces donnes avant de calculer une corrlation : on peut par exemple dcomposer les sries en tendance et en cycles, ce que proposera Hooker en 1901, et la corrlation des sries en tendance ou en carts cette tendance ont en gnral des valeurs et des interprtations diffrentes. Il en est de mme si l'on considre les variables en niveau ou en diffrences (ou accroissements), voire en taux de croissance (accroissements relatifs) et March [1928], trs soucieux de pointer les risques d'une simple transposition des outils biomtriques l'conomie, s'attachera distinguer ce qu'il appelle coefficient de covariation diffrentielle et coefficient de covariation tendancielle. La notion de corrlation que March importe de l'cole anglaise est donc totalement reconstruite dans un double souci de la dcrocher totalement de tout contexte probabiliste et de coller au plus prs des donnes observes et des significations spcifiques qu'elle prend dans le champ conomique.

2.3. Indices et baromtres.


Dans le cadre du service d'observation des prix cr en 1917, March est charg de la confection des Indices du mouvement gnral des affaires, dits d'abord en recueil par la revue politique et parlementaire, et quelques annes plus tard placs sous le contrle scientifique et financier de l'ISUP . Les Indices constituent une sorte de Baromtre conomique la franaise, pendant de ceux de Harvard (Persons), de Louvain (Dupriez), de Londres (Beveridge), de Berlin (Wagemann) et de Moscou (Kondratieff). Le recueil de ces Indices, publis jusqu'en1939, renferme chaque mois dix planches grand format. La premire dcrit graphiquement les volutions de trois indicateurs (type A,B,C de Harvard16) pour la France le Royaume Uni et les Etats-Unis. Les autres planches, l'exception des deux dernires consacres au commerce et la finance anglaise, reprsentent une cinquantaine d'indicateurs franais (finance, commerce extrieur et intrieur). Un texte de deux pages accompagne ces planches, constitu d'un commentaire (variable) de la conjoncture et d'une note explicative sur les conditions de productions de ces indices. Techniquement l'laboration des indices est assez simple : les indices sont exprims en "valeur relative par rapport une moyenne mensuelle calcule durant la priode 1904-1913", ce qui n'limine ni la tendance ni la saisonnalit; d'autre part, ils ne rsultent pas de regroupements mcaniquement oprs sur la base des corrlation observes; ce ne sont le plus souvent que simples ratios, moyennes ou indices budgtaires. March ne se contente pas de publier ces indices, il en discute les fondements thoriques (dans la thorie quantitative de la monnaie par exemple) et les principes de construction [March 1922, 1923, 1924, et 1927]. Sa conception des baromtres est intressante noter pour notre propos : il rejette la fois l'indice unique qui rsumerait l'ensemble du mouvement des affaires (comme Juglar le fera par exemple avec les encaisses de la banque de France), et l'indice synthtique labor comme moyenne pondre de plusieurs sries. Il prfre juxtaposer les indices plutt que les combiner. C'est que la moyenne n'a de sens pour lui que si elle prend bien en compte une totalit. Il s'oppose l'interprtation probabiliste des indices, en terme directement drivs de la thorie des causes constantes de Laplace, Poisson et Quetelet : puisqu'un indice des prix est une moyenne (pondre) de prix relatifs, ces moyennes oprent une compensation des effets des causes accidentelles et spcifiques chaque bien, et ne retiennent que les effets des causes constantes

16 Les courbes A, B, C reprsentent respectivement le march financier, le march montaire et le march des produits industriels.

7 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

qui sont l'uvre, c'est--dire la variation de valeur de la monnaie. Cette thorie, dfendue, sous certaines conditions, par Edgeworth dans 3 memoranda de 1887-89, l'amenait prciser ce que devaient tre les pondrations pour un indice montaire. Mais elle est battue en brche par plusieurs auteurs dont Keynes [1909] qui souligne que les conditions d'un transfert de la loi des erreurs ne sont pas runies : les prix des biens ne sont pas indpendants, pas de mme importance, et de plus la probabilit n'est pas pour lui une limite de frquences : "nous devons rejeter les canons de pondration du Professeur Edgeworth parce qu'ils sont fonds sur une analogie partiellement fausse avec la thorie des erreurs. (...) La simplicit apparente de la mthode est illusoire, et occulte la quantit importante d'information empirique que nous devons possder [sur la loi de variation de la valeur d'change] pour pouvoir l'appliquer avec succs. Il n'y a pas de mthode probabiliste a priori valable en toute circonstance pour la construction des nombres indices." Aprs 1914, l'inflation prit en Europe une importance trs inquitante. La question des pondrations fut nouveau dbattue et Irving Fisher entreprit une tude systmatique de toutes les formules d'indices dans deux ouvrages [Fisher 1911 et 1922] d'o il ressortait finalement que la question des pondrations n'tait pas aussi dterminante que celle de la prcision des relevs de prix. L'approche de l'indice montaire par L. March est plus proche de celle de Keynes, et plus tard de Divisia, et trs critique par rapport la justification probabiliste : parce que la moyenne peut cacher "des accumulations dissimules", parce que les prix ne sont pas indpendants et obissent des lois de substitution, parce que l'indice ne prend pas en compte toutes les transactions, parce que sa forme varie suivant le temps et le lieu17.

3. La philosophie des sciences de Pearson et March.


Ce souci de dvelopper une statistique qui soit au plus prs des phnomnes vient d'une philosophie que March partage avec Pearson. C'est celle de la Grammaire de la Science, un ouvrage de Karl Pearson dont il traduit et prface la 3me dition en 1912. Cette prface ne laisse aucun doute sur son adhsion aux thses phnomnaliste de Pearson et la primaut de la notion de contingence : la science traite principalement de phnomnes qu'elle dcrit, classe, et rsume mais elle ne saurait se prononcer sur la chose en soi : " L'homme de science ne met donc en uvre pour ainsi dire que les numros d'un catalogue d'impressions sensibles diffrencies, rapports concrets ou ides abstraites. Entre ces rapports et ces ides il tablit des relations nouvelles qui s'imposent l'esprit avec d'autant plus de force qu'elles sont mieux en harmonie avec sa propre constitution. La certitude ou l'vidence scientifique rsulte de l'accord de la pense avec elle-mme, soit dans l'exercice de sa facult d'identifier, soit dans l'exercice de son pouvoir d'abstraction et de gnralisation. Il n'est de certitude scientifique que dans le monde des concepts; non seulement le noumne, mais encore la perception sont en dehors du certain. L'homme de science n'affirme ni ne nie la ralit du monde extrieur; il n'affirme ni ne conteste non plus la lgitimit d'ides dont l'origine serait hors du fond commun des impressions sensibles immdiates ou accumules. Il dclare simplement que, pour lui, l'envers des phnomnes et l'intuition spontane, - mme si celle-ci, comme on l'a suppos, est le fruit

17 Pour tre complet, il faudrait aussi signaler les recherches empiriques sur les liens prix-salaires entreprises par le Directeur de la SGF [March/SGF 1910 et March 1922].

8 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

des acquisitions de l'espce, - sont inaccessibles l'intelligence, sont irrductibles aux rapports rationnels que peut former la pense exerce"18 L'agnosticisme que March partage avec Pearson quant la nature mme des choses se conjugue avec un rejet de la ncessit et de la causalit, notions limites qui n'ont plus qu'une place secondaire dans le discours scientifique, et que doit remplacer la notion bien plus gnrale de contingence : "Puisqu'il n'est point de ncessit hors de la sphre des conceptions, les lois naturelles n'expriment que des contingences () Entre les changements de la cause et de l'effet il y a simplement accord statistique plus ou moins troit : le professeur Pearson a consacr d'importants travaux aux moyens de mesurer les degrs de cet accord." En d'autre terme le coefficient de corrlation et la notion de rgression sont les instruments de mesure de cette contingence des phnomnes quoi se ramne toute science. Seule cette philosophie pouvait donner une telle importance la statistique dans le concert des sciences. L'irruption de la contingence comme fondement des sciences d'observation est le point essentiel qui permet, comme March l'a bien compris, un renforcement mutuel du point de vue pistmologique et de la pratique scientifique : il faut bien mesurer ce que cette pense philosophique doit la statistique (les notions de classes d'vnements, de similitude, de contingence) mais aussi la force que cette philosophie peut confrer la pratique de la statistique, et la manire dont elle peut orienter son dveloppement. Mais la contrepartie est svre : il faut abandonner toute prtention l'analyse causale. March y est prt, et, en accord avec Pearson, il critique ou ignore ceux qui, comme ses contemporains Moore (1914) ou mme Lenoir (1913), interprtent les corrlations en terme de causalit, et posent les premires pierres d'une conomtrie structurelle faite de relations stables entre grandeurs macro conomiques. L'eugnisme est aussi un point de vue, et un programme d'action, qui donne sens la statistique dmographique, en mme temps que celle-ci permet d'argumenter des discours eugnistes. March en pouse les thses, au moins partir de 1912, date du congrs international de Londres auquel il participe, avec Huber, Barriol et Faure, mais plus vraisemblablement avant cette date l'occasion de ses premires recherches dmographiques et de ses lectures des travaux de Pearson. En tout cas sa conviction est suffisante pour qu'il prenne l'initiative ds l'anne suivante de la fondation d'une Socit franaise d'eugnique dont il fut le trsorier archiviste. Anne Carol19 a montr cependant que l'eugnisme franais est davantage une cration des mdecins hyginistes, des spcialistes de la puriculture ou de "l'hominiculture" (titre d'un ouvrage de Jules Amar repris par le doyen Landouzy), que des statisticiens. La liste des 104 membres de la socit publie dans le premier numro de la revue Eugnique comprend 65% de mdecins. La socit ne russira pas s'adosser un laboratoire de recherche comme l'a fait Galton, et ds le milieu des annes 1920 ses effectifs baissent, l'obligeant se fondre dans la socit d'anthropologie. March restera le plus actif des membres, avec 12 articles sur une trentaine publis dans Eugnique, et c'est encore lui qui mnera la dlgation franaise (avec Vacher de Lapouge et Cuenot) au second congrs international d'eugnique New York (1921). Entre Bertillon pre, auteur d'une Dmographie figure de la France et de quelques fameux articles du Dictionnaire de Dechambre ("moyenne", "taille","mariage"...), et Bertillon fils, auteur d'un Trait de dmographie incorpor son Cours lmentaire de Statistique(1895) et fondateur d'une Alliance nationale pour l'accroissement de la population franaise , puis Alfred Sauvy et Alexis Carrel la fin des annes 30, March est certainement un maillon important d'une cole dmographique

18 [Pearson 1912], note du traducteur (L. March). 19 [Carol 1995]

9 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

franaise. Mais, comme l'a montr Desrosires, son attirance pour l'eugnisme est modre par une vision nataliste partage par la plupart des dmographes franais, et qui se dmarque du modle anglais : les franais sont plus inquits par une baisse gnrale de la natalit que par les dgts de la fcondit diffrentielle.

4. Lucien March et le calcul des probabilits


L'approche de la mthode statistique que dveloppe Lucien March peut maints gards tre caractrise de mathmatique. Par opposition avec les analyses que l'on trouve dans le JSSP avant 1910, qui s'appuient principalement sur tableaux, moyennes et graphiques, le changement est quantitatif la thorie statistique ne reprsente pas 10% des articles du JSSP dans la premire dcennie du XXe - et qualitatif : de nouveaux outils mathmatiques sont mis en uvre comme les ajustements, la corrlation et la rgression. Cependant cette statistique mathmatique n'est pas celle que vont dvelopper Darmois, Borel, Lvy et Frchet deux dcennies plus tard : non seulement, comme nous l'avons vu, elle privilgie les observations et ne trouve aucun principe pour se construire en thorie, mais elle ne s'appuie absolument pas sur le calcul des probabilits. Les premiers ouvrages du calcul des probabilits qui succdent au trait de Bertrand [1889] sont ceux de Poincar [1896], Borel [1909], de Laurent [1908], de Carvallo [1912], de Bachelier [1912] et de Keynes [1921]. Ils ne sont pas cits par Lucien March. Et ce n'est pas un simple oubli. Le rejet de la probabilit chez March est totalement explicite dans ses textes de mthodologie. Dans son discours d'investiture comme prsident de la SSP, March [1907] affirme: "[Aujourd'hui] on substitue au moins implicitement la notion de tendance celle de loi, celle de frquence celle de probabilit. L'cart moyen le plus souvent utilis est calcul sur les observations elles-mmes et non d'aprs un rapport hypothtique de probabilit, () ou bien on introduit de nouveaux concepts comme celui de stabilit" [s'en suit une rfrence prcise mais non explicite aux travaux de Dormoy et Lexis] () La forme classique de la courbe en cloche ne convient pas pour les phnomnes qui ne se dveloppent pas symtriquement autour d'une valeur moyenne. " Il publie en 1908 dans le JSSP un court article sur la terminologie en statistique, d'aprs une intervention au IVe congrs des sciences mathmatiques, dans lequel sa position vis--vis de la probabilit se fait trs claire : "Une diffrence essentielle spare la frquence observe en statistique et la probabilit mathmatique. En statistique nous ignorons les circonstances initiales des faits observs; notre connaissance peut tout au plus s'tendre quelques parties de l'enchanement intermdiaire entre les conditions originelles et le rsultat () Dans le schma des probabilits les combinaisons et rptitions qui contiennent en puissance le rsultat final sont compltement connues; seul le jeu du dclenchement qui fait apparatre certaines combinaisons demeure imperceptible en raison de l'exigut de son action. L'accord d'une distribution de frquences, observe en statistique, avec une distribution de probabilits n'implique donc qu'une analogie apparente entre l'enchanement des faits statistiques et la formation des probabilits." () Aussi serait-il opportun, en statistique, de renoncer l'emploi du mot probabilit pour exprimer l'attente que fait natre la constatation d'une frquence; car si dans la thorie des probabilits, la convention sur laquelle repose cette attente inspire une parfaite confiance, en statistique le degr de confiance que mrite cette attente est souvent modifi par l'tude des liaisons des faits, par les enseignements des sciences sociales. D'ailleurs, les applications du calcul seraient peu prs aussi commodes si l'on oprait sur des frquences au lieu d'oprer sur des probabilits; les noncs des propositions 10 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

devraient tre transforms, mais ils seraient plus rigoureux et viteraient bien des critiques adresses aux anciens noncs. Par exemple lorsque Laplace contestait le caractre accidentel des carts du coefficient de natalit masculine observ Paris, Londres et Naples, en assimilant la dtermination du sexe un tirage au sort, il s'exposait aux critiques que Bertrand a adresses son nonc. () Dans les applications la statistique il ne parait pas suffisant de substituer la notion de probabilit a posteriori celle de probabilit statistique que suggre Blaschke. Pour que les personnes insuffisamment averties ne se mprennent pas sur la porte de ces applications, il semble prfrable d'carter compltement de l'analyse des rsultats statistiques le terme probabilit et le mot probable entendu dans le sens mathmatique." En 1907, la session de l'IIS Paris est l'occasion d'une confrontation intressante entre les positions de Lucien March, Wilhelm Lexis et de Francis Edgeworth sur cette question, ce dont tmoigne le compte rendu du BIIIS paru en 1909. Lexis affirme (p.55) que "Le plus utile est de ramener les phnomnes la loi de Gauss ou des lois drives et non de chercher construire des formules empiriques beaucoup moins intressantes. Le fondement le plus solide doit toujours rester la loi de Gauss qui est une loi de la nature". Edgeworth renchrit et introduit son rapport en affirmant que "la loi de Gauss est toujours la loi classique idale de la statistique, mme si elle n'est pas toujours exactement vrifie dans la nature"(p.92) . Un peu plus loin, il a cette belle phrase souvent cite : "les probabilits ne se rattachent pas seulement la statistique comme l'arbre la vigne dont il supporte les branches; il y a aussi un entrelacement de racines, une liaison des premiers principes, qu'il est difficile de dissquer". Dans une autre dclaration comme prsident de sance (p. 132) il dit : " La loi de Gauss est d'une importance capitale parce qu'elle est la loi des choses soumises un mlange complexe de causes indpendantes. C'est ainsi qu'elle rgit le monde des atomes. L on ne peut la modifier, pas plus qu'on ne peut, dans l'expression de la loi de gravitation, remplacer le carr par le cube parce que le carr est la ralit. La loi des erreurs est aussi gnrale que la loi de la gravitation. () Si la loi des erreurs n'est pas toute la science statistique, c'en est une partie, une partie essentielle." Le papier qu'il prsente reprend ensuite systmatiquement les apports du calcul des probabilits qui passent par la loi normale, la loi des erreurs gnralises dont nous avons dj parl, la loi log-normale de Galton-MacAllister, la thorie probabilit de l'indice montaire, et les diffrentes mthodes d'ajustement, pour conclure "c'est se mprendre que de supposer que les derniers dveloppements des probabilits ont discrdit la loi des erreurs". Dans la mme session, March introduit son rapport en affirmant : " Deux genres de thories s'opposent actuellement, l'une rattachant toutes les distributions la loi des erreurs de Gauss, l'autre, avec Pearson, cherchant des lois o interviennent des probabilits variables. Il ne me semble pas qu'on doive condamner aucune de ces tendances". Il dveloppe ensuite de nombreux exemples d'ajustements qui prouvent que "la loi de Gauss semble au premier abord peu en harmonie avec les faits naturels". Il rejette clairement les calculs d'erreur probable sur des rsultats, et l'emploi des mots "probabilit" et "corrlation", mais pas l'usage des procds mathmatiques. De tels procds oprent, dit-il, "comme un crible logique appropri l'analyse et la synthse des rapports numriques qui constituent le principal objet de la statistique" et dont il donne 3 exemples : les indices, les enqutes partielles par la mthode reprsentative, et la comparabilit des graphiques. Il obtiendra qu'un Comit des mthodes de comparaison statistique soit institu l'IIS pour 11 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

traiter de ces sujets. Le rejet des probabilits n'est pas pour lui synonyme d'un rejet des mathmatiques. Il a d'ailleurs propos plusieurs fois un nouveau terme pour cette mathmatique de la statistique, celui de plthomtrie qui figure pour la premire fois dans un texte publi en 1910 sous le titre "du mode d'exposer les principaux lments de la thorie statistique". "Le principe de compensation, sur lequel est base toute comparaison de faits collectifs, [et qui est] la gnralisation de la formule du march quitable que les hommes ont sans doute adopte depuis qu'ils vivent en socit", lui semble une base suffisante pour fonder la statistique; en commenant par la moyenne, qu'il dfinit comme la grandeur qui, rpte n fois, fournit le total des quantits. Par march quitable, il entend la condition que le total des quantits livres soient gal au total des quantits demandes, quelles que soient les valeurs des livraisons partielles. Drle de renversement qui consiste fonder la statistique sur un principe conomique, qui reprend donc l'origine de l'esprance mathmatique dans les contrats alatoires, en niant que cela se rapporte la notion de probabilit. Supposant ensuite que chaque valeur observe est une valeur possible extraite d'une "distribution primaire" nous dirions "la ralisation d'une variable alatoire" il retrouve toute la thorie de l'chantillonnage et de la dcomposition de variance (ou "fluctuation") sous la forme d'un "principe de conservation" des moyennes et fluctuations divises par n dans la transformation des distributions primaires en distribution secondaire, y compris les proprits asymptotiques, la distribution normale des erreurs considres comme somme d'erreurs lmentaires uniformment rparties, la typologie des courbes de Pearson, les droites de rgression et la covariation 20. Le dfi est donc relev : on peut exposer toute la statistique mathmatique en un cours de 40 pages, sans un mot sur la probabilit. Le principe expos ici sera repris dans la seconde partie de son ouvrage testament, construit sur la base de ses cours l'ISUP21, et publi en 1930 : les principes de la mthode statistique. Un ouvrage de 800 pages, d'une richesse incomparable puisqu'il aborde en plus des sujets classiques de l'analyse statistique, les mthodes de la statistique administrative (premire partie), et des applications de la statistique assez originales la conjoncture et aux affaires (marchs, stocks, contrle de fabrication, cots, bilans). Mais ce livre arrive trop tard aussi bien dans la vie de March que dans celle de la discipline. La statistique des annes 1930 aura renou avec d'autres sources, celles du calcul des probabilits renouvel par l'cole franaise, mais aussi celles de la statistique gomtrique de Fisher. Si l'on doutait encore de la pense de March sur la probabilit, cet extrait du compterendu qu'il donne du trait de Bachelier en 1912 enfonce le clou : "Pour ce qui intresse la statistique, on peut poser qu'en principe la thorie de cette science n'a point ncessairement invoquer la calcul des probabilits. Celui-ci est fond sur des conditions, soit connues a priori, soit impliquant une suffisante continuit difficilement assimilable aux conditions fondamentales des faits d'observation dont traite la statistique () Mais le calcul des probabilits et les applications aux jeux de hasard constituent par la difficult mme des raisonnements et par l'attention qu'ils exigent une excellente gymnastique de l'esprit"

20 Cela revient dit-il considrer une arme de s rgiments (groupes de distributions primaires) dont chacun comprend n compagnies, et prendre un homme par compagnie pour faire l'chantillon qu'il appelle distribution secondaire. est intressant de noter ici qu'aprs 1933, le cours de "mthode statistique (lments)" de March est repris par Huber puis Dug de Bernonville, tandis que celui de "statistique mathmatique" de Darmois (et assur deux annes par Borel) change radicalement de prsentation en donnant toute sa place au calcul des probabilits (voir le tableau comparatif des contenus de ce cours donn par [Pressat 1987] p.25.
21 Il

12 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

On retrouve dans cette dernire phrase un dernier argument qui a dfinitivement plomb le calcul des probabilits comme un ensemble de "jeux et casse-tte" sans aucune autre utilit sociale que de dvelopper une gymnastique de l'esprit. De1900 aujourd'hui, la liste des cours et traits qui ont privilgi cet aspect de "problem solving" sans offrir aucune rflexion articule sur la probabilit a t assez longue22. D'o d'ailleurs l'intrt du petit livre de vulgarisation de Frchet et Halbwachs en 1924 qui ouvrait une toute autre perspective.

5. La crise gnrale du modle probabiliste standard


Le positionnement de March sur la mthodologie statistique et ses liens au calcul des probabilits ne sont pas atypiques. Il est tout fait reprsentatif d'une situation de transition qui a dur environ 25 ans, entre 1895 et 1920, et dont l'enjeu est tout fait clair si l'on se rfre plusieurs arnes dans lesquelles l'avenir de la statistique est dbattu, ou encore aux diffrentes sources qui permettent l'historien d'aujourd'hui de s'en faire une ide. Il y a d'abord bien videmment le corpus des traits de la discipline. Une tude statistique des contenus de ces traits23 sur une priode d'un sicle et demi rvle une volution significative d'une science ayant un objet propre successivement l'tat, le territoire, la population, le systme conomique et social une science qui se dfinit par sa mthode - l'induction numrique et peut s'appliquer n'importe quel champ de connaissance, qu'il relve des sciences naturelles ou des sciences humaines. Cette volution de la discipline se fait d'ailleurs en toute conscience et les statisticiens comme Meitzen [1890] ou Julin [1921, p. 43] font rfrence la statistique comme mthode qui pourrait succder la statistique comme science. Poursuivie par des moyens statistiques aprs codage des contenus, l'tude du mme corpus rvle un tournant plus prcis qui s'opre dans les annes 1900-1930 avec l'introduction dans ces traits d'une srie de rsultats mathmatiques qui en deviennent petit petit l'ossature. Les ouvrage de Maurice Block (1878), J. Bertillon (1895), Meitzen (1891) Von Mayr (1897), Faure (1906) sont reprsentatifs d'une statistique qui est d'abord une discipline administrative de production de l'information, et de traitement sommaire de celleci, avec des outils qui ne dpassent pas le tableau, le graphique et la moyenne. Tout au plus y trouve-t-on, avec ou sans critique, les traces d'une tentation d'infrence vers des rgularits ou des lois au sens de Quetelet. Ce qui n'enlve rien leur intrt comme expos des principes d'une science administrative et logique de construction des faits sociaux. Mais les ouvrages de Czuber (1921), Niceforo (1925), Fisher (1925) Jordan (1927), Darmois (1928), Rietz (1924 et 1927), Risser et Traynard (dans le trait de Borel, 1933) sont d'une toute autre facture : ce sont de vritables traits de statistique mathmatique dont les objets principaux sont les thormes de Bernoulli et de Laplace, les mthodes d'ajustement de distributions, la modlisation des sries chronologiques, la thorie des moments, celle de la corrlation, et celle des sondages; toutes ces mthodes sont ddies des infrences inductives sur des distributions, des liaisons et des volutions, et sont largement fonde sur le calcul des probabilits. Cependant le mme corpus fait apparatre une catgorie de traits intermdiaire la fois par ses dates de parution (entre 1910 et 1925) et par ses thmatiques (ils sont peu prs tous centrs sur la mthodologie du traitement de donnes conomiques) : Bowley (1901 et 5 ditions ultrieures), Yule (1910 et 14 ditions successives), Liesse (1905), King (1912), Secrist (1917), Jerome (1924), Julin (1921), Crum et Patton (1925), Young (1925), March

22 Comparer le trait de l'actuaire Laurent [1908] qui est une collection dcousue de petits problmes et celui de Carvallo [1912] bien structur autour des thormes fondamentaux, de Bernoulli et Laplace est ce titre instructif. Carvallo souligne d'ailleurs dans son introduction que son livre est n d'un besoin exprim par March pour le recrutement de statisticiens. 23 Voir Armatte (1991, 1995, 2001)

13 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

(1930), Galvani (1934). L'appoche de la majorit de ces ouvrages, amricians pour la plupart, et lis l'introduction de la statistique juste avant que des chaires lui soient ddies, est une approche empirique du traitement des donnes conomiques, o la collecte, les graphiques, les rsums statistiques, les index-numbers, et les calculs de corrlation et rgression dominent, sans que soient dvelopps les bases probabilistes. On trouverait une volution analogue dans les journaux des socits de statistique parisienne (la SSP) anglaise (RSS) et amricaines (ASA). Un troisime corpus peut tre voqu, c'est celui des deux ditions allemande et franaise de l'Encyclopdie des Sciences mathmatiques pures et appliques24. Emmanuel Czuber, auteur de L'article "Wahrscheinlichkeitsrechnung" (calcul des probabilits) dans l'Encyklopdie de Klein considre que la thorie de Laplace "ne prsente plus qu'un intrt historique" et de nombreux indices montrent que le travail critique de Bertrand pour dconsidrer une grande partie de l'hritage laplacien a port ses fruits : "il n'est gure possible de donner une dfinition satisfaisante de la probabilit" dit son traducteur franais Le Roux. Suit une prsentation trs clate de petits problmes de jeux qui tmoigne de la crise du calcul des probabilits au tournant du sicle, avant les travaux de Borel, Bachelier, Frchet, P. Lvy, Kolmogorov. L'article "Anwendungen der Wahrscheinlichkeitsrechnung auf Statistik" (Application du calcul des probabilits la Statistique) de la mme encyclopdie dont l'auteur allemand est Ladislaus von Bortkiewicz est encore plus rvlateur des effets de cette crise pour la statistique. Son papier est totalement clat entre d'une part une tentative de fondement de la statistique et d'autre part une longue discussion d'ajustements empiriques de donnes dmographiques dans lequel l'apport de la probabilit est totalement inexistant. L'auteur franais, l'actuaire Oltramare, a du faire prcder la traduction d'une mise en garde sur les difficults se saisir des modles probabilistes pour traiter des donnes statistiques : "Vu la nature un peu spciale du sujet, il est ncessaire d'expliquer quels points de vue on peut envisager l'application aux donnes statistiques des rgles du calcul des probabilits. Les points de vue concernant l'objet mme de la statistique diffrent en effet beaucoup les uns des autres. Le domaine traiter est trs tendu, il embrasse natalit, mortalit, morbidit, criminalit etc.; les rsultats sont reprsents le plus souvent par des rapports qui peuvent parfois tre regards comme nous fournissant des valeurs particulires de fonctions plus ou moins dtermines. Il s'agit surtout pour le statisticien, de chiffrer dans la mesure du possible la valeur ou le degr de prcision des nombres obtenus, et le cas chant, de dterminer le plus exactement possible la nature, la forme et les coefficients des fonctions dont il possde un certain nombre de valeurs particulires. Le calcul des probabilits nous donne pour cela des rgles simples suivre, mais dans le cas bien entendu o ses principes seraient rellement applicables. La premire chose faire est de s'en assurer. () En gnral toutefois la concordance n'existera pas (...) les carts qui existent entre ces moyennes et les valeurs particulires qui ont servi les former, bien que pouvant prsenter le caractre d'erreurs accidentelles, dpassent souvent notablement les limites prvues par la thorie. Devons-nous dans ce cas repousser le calcul des probabilits, nous priver de ses avantages ou attendre pour l'appliquer que les causes relles de l'vnement soient mieux connues? Quelques statisticiens ne l'ont pas admis; par des artifices de calcul, la considration des probabilits variables, ils sont parvenus dans bien des cas tendre le champ d'application de ses principes, et (...) ramener les rsidus un caractre normal."

24 Voir [Armatte, 2005].

14 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

Ces lignes refltent un conflit latent sur l'hritage de Laplace. Ceux qui s'accrochent au dogme laplacien de la loi normale ne sont plus trs nombreux. Et pourtant la thorie des erreurs de Gauss et Laplace qui a li la mthode des moindres carrs la loi normale aurait d lui assurer une certaine prennit. Ce fut le cas en astronomie et en godsie, davantage d'ailleurs en Allemagne et en Belgique qu'en France, comme l'a montr la thse de M.F. Jozeau [1997]. Ce fut le cas de manire inespre dans les sciences sociales avec le succs de la physique sociale de Quetelet forme autour du concept d'homme moyen : son existence dpend d'une homognit atteste par la loi normale. Mais en dmographie comme en conomie, les conomistes ont d'abord boud la statistique jusque dans les annes 187025, et quand ils commencent alors l'adopter, dans le contexte des crises conomiques de la fin de sicle, c'est pour chercher dans les chiffres accumuls les symptmes du cycle des affaires, pour en capter les composantes. Les tests de Dormoy et Lexis, comparant la dispersion empirique des frquences de tel ou tel phnomne sur une ou deux dcennies avec la dispersion que fournirait le modle binomial ont conclu que les rgularits de Quetelet celles qu'il attribuait par exemple la propension au crime taient presque toujours illusoires, l'exception du sex-ratio la naissance, et que dcidment le modle probabiliste de l'urne de composition fixe tait de peu d'utilit pour rendre compte des sries observes26. Constatant par exemple un rapport lev entre ces deux dispersions pour la mortalit sur 10 ans, Bertrand conclut : "L'assimilation une urne de composition invariable n'est donc pas acceptable. La vicissitude des vnements rgle sans cesse la composition de l'urne. Tantt c'est le cholra qui passe et y verse des boules noires. Ce sont des eaux plus pures et plus fraches qui apportent les boules blanches." Si les erreurs astronomiques pouvaient tre supposes normales c'est qu'elles avaient t rduites aux seules erreurs accidentelles, par rapport un modle d'orbites driv des formules de la mcanique de Newton. En conomie point de tel modle thorique. Point de sparation des causes accidentelles d'avec les causes variables qui s'enchevtrent. C'est cette interdpendance possible des causes, soit qu'elles se renforcent soit qu'elles s'annulent qui conduit des dispersions infrieures ou suprieures, et suggrent des modles que Lexis baptise "hyponormal" et "hypernormal". Une cole alternative se dessine qui prend ses racines dans les travaux de Poisson, Cournot et Bienaym sur les "modles d'urne variable" et dont Lexis est le principal porte parole la fin du XIXe sicle. Il s'agit de sauver le calcul des probabilits en lui fournissant de nouvelles bases qui lui permette de produire nouveau des modles plausibles pour les donnes dmographiques et sociales. Bortkiewicz (1868-1931), lve de Lexis Gttingen, est sur la priode qui nous intresse le principal auteur engag dans ce programme. Inventeur en 1898 de la "loi des petits nombres" - il aurait t prfrable qu'il la baptise loi des vnements rares - qui gnralisait la loi limite de Poisson, il a fourni un premier modle d'une loi asymtrique, de variance lgrement suprieure, vers laquelle converge la loi binomiale quand la probabilit de l'vnement considr dans l'preuve rpte est faible. Cependant la carrire de Bortkiewicz est peine commence quand il rdige son article de l'Encyklopdie et c'est pour cela sans doute que l'article balance entre une reconstruction probabiliste nouvelle de la statistique mathmatique (premire partie) et une dclinaison trs classique des ajustements empiriques des donnes dmographiques, avec lesquels s'est longtemps confondue la statistique. Bortkiewicz s'est illustr ensuite par la poursuite des recherches de Lexis sur la stabilit et l'homognit des sries27, mais aussi par
25 26 27

Voir [Mnard 1977] Armatte (1989) Sa dernire publication, [Bortkiewicz 1931] est particulirement riche.

15 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

plusieurs controverse importante avec Gini, sur le sujet de la mesure des ingalits, et avec Karl Pearson28, auquel il reprochait principalement la constructions de formules d'ajustement sans aucun fondement thorique. On rappelle que le principe de ces formules tait de driver tout un "systme de courbes" servant de modles de distribution, dont les fameuses lois Beta, sur la seule base d'une quation aux diffrences ajuste des lois binomiale et hypergomtrique. On ne peut douter que Bortkiewicz ait t finalement avec Lexis le meilleur reprsentant de ce courant d'un renouvellement du calcul des probabilits qui devait la fois batailler sur un front contre les hritiers directs de Laplace encore attachs au seul modle normal, comme Edgeworth et sur un autre front contre ceux qui pensaient pouvoir se passer des probabilits, comme Pareto, Pearson, et plus fortement encore, Lucien March, Warren Persons Harvard, Knapp de Strasbourg, et plus tard encore Franois Divisia Paris. Deux lments ressortent avec force de ce rapide balayage des activits de L. March. Les travaux statistiques de Lucien March donnent une premire impression d'clectisme qui caractrise bien la situation du statisticien du dbut XXe, capable de s'investir la fois dans les dispositifs d'enqute et de recensement, dans le traitement mcanique des informations (mcanographie), dans la mthodologie d'analyse mathmatique, dans les enjeux de l'volution dmographique et dans la fabrication d'outils de prvision conomique, dans les dbats de philosophie des sciences. En second lieu, l'impression d'clectisme fait place un sentiment de forte intgration de ces diffrents engagements. Ils font systme. Le rle attribu aux graphiques et aux indices non agrgs, le souci d'un ajustement le plus fin possible de modles mathmatiques aux distributions pour en faire des rsums stnographiques comme aurait dit Pearson s'expliquent assez bien par un souci constant de coller aux ralits des phnomnes. Le dni de ralisme attribu au calcul des probabilits et ses modles s'accorde avec un agnosticisme sur les essences et une application de la rgle d'Occam chre au Pearson de la Grammaire. Ce rejet de l'alea ne doit pas tre pour rien dans son dsintrt relatif pour les sondages, le seul des 3 thmes du comit de mthodologie qu'il a anim l'IIS sur lequel il n'ait pas travaill, et qui n'occupe qu'une toute petite place dans son trait. Dans ses Principes , l'analyse statistique est d'abord prsente comme une comptabilit. Son engagement fort dans le recensement et son traitement mcanographique en ferait-il davantage un homme des registres qu'un homme des enqutes, comme le sera galement Carmille? Finalement la mthodologie statistique est prise dans une sorte de toile d'implications sociales et cognitives assez fortes faite de choix philosophiques (la contingence) et politiques (l'eugnisme, le natalisme, le taylorisme), accrochs un systme technique qui privilgie l'investigation systmatique par recensement, le traitement mcanographique, la tabulation et la reprsentation graphique, aux dpens d'un recours des modles plus essentiels, que ce soit ceux du calcul des probabilits ou ceux de l'conomie mathmatique qui ne l'ont gure attir. Inventeur d'une terminologie qui ne lui survivra pas plthomtrie, covariation, valeur normale - March est aussi bien le disciple contemporain de Karl Pearson, que de Cheysson, Le Chatelier, Colson, Rueff, Divisia et plus largement la famille des ingnieurs conomistes franais attachs aux valeurs traditionnelles de la famille, de l'Etat-Providence, et d'une science positive soucieuse de s'en tenir aux phnomnes, leur objectivation sous forme de lois empiriques, et l'exploitation de leur "valeur pratique" comme le disait Borel.

28

Voir par exemple [Bortkiewicz 1915]

16 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

Abrviations : JSSP : Journal de la Socit Statistique de Paris BIIS : Bulletin de l'Institut International de Statistique JRSS : Journal of the Royal Statistical Society Bibliographie
AMMON O., 1896, Gesellschaftsordnung, 2 ed., Iena. ARMATTE M., 1989, "Modles statistiques de l'homognit et de la stabilit d'une population au XIXme sicle", in Les mnages; mlanges en l'honneur de J.Desabie, Paris, INSEE ARMATTE M., 1991, "Une discipline dans tous ses tats: la Statistique travers ses traits (1800-1914), Revue de synthse, IVme srie, N2, Avril-juin 1991 ARMATTE M., 1992, "Conjonctions, conjoncture et conjecture. Les baromtres conomiques", Histoire et Mesure, VII, 1-2, p. 99-149. ARMATTE M., 1994, "Franois Divisia (1889-1964 ) ", in Les professeurs du Conservatoire National des Arts et Mtiers. Dictionaire biographique 1794-1955, C. Fontanon et A. Grelon (dir), Paris, INRP/CNAM, tome 1, p.424-440. ARMATTE M., 1995, Histoire du Modle linaire. Formes et usages en Statistique et en Economtrie jusqu'en 1945, Thse EHESS, sous la dir. de J. Mairesse. ARMATTE M., 2001, "Developments in Statistical reasonning and their links with mathematics" in Changing Images in Mathematics, From the French Revolution to the new Millenium, U. Bottazzini et A. Dahan Dalmedico (ed) , London, Harwood Acad. Publish, pp. 137-162. ARMATTE M., 2005, "Les Probabilits et les Statistiques dans l'Encyclopdie des Sciences Mathmatiques Pures et Appliques : promesses et dceptions.", paratre dans un ouvrage consacr l'Encyclopdie, sous la direction d'Hlne Gispert et Catherine Goldstein. BAUSCHINGER J. et ANDOYER H., 1908, "Thorie des Erreurs", Encyclopdie des Sciences Mathmatiques Pures et Appliques, dition franaise de J.Molk, Paris, Gauthier-Villars BERTILLON J., 1895, Cours lmentaire de Statistique Administrative , Paris, Socit des Scientifiques, 593 p. Editions

BERTRAND J., 1971, Calcul des probabilits, 3me dition, New York, Chelsea, XLIX + 317 p.; 1re ed. 1889; 2me ed. 1907. BORTKIEWICZ L. (von), 1909, "Statistique". Encyclopedie des Sciences Mathmatiques Pures et Appliques, Tome I, 4me Vol., 3me fasc., 453-480, Jules Molk (ed), Gauthier-Villars, Paris; expos par F. Oltramare, d'aprs "Anwendungen der Wahrscheinlischkeitsrechnung auf statistik", Encyklopdie der mathematischen Wissenschaften, Leipzig, Teubner, 1901. BORTKIEWICZ L. (von), 1915, "Realismus und Formalismus in der mathematischen Statistik, Allgemeines statistisches Archiv, 9, p. 222-256. BORTKIEWICZ L. (von) , 1931, The relation between stability and homogeneity, Ann.Math.Stat., 2, 1-22. BOWLEY A. L., 1901, Elements of Statistics, King and Son, London. 2me ed 1902, 335 p.; 4me ed. 1920, 454 p.; Traduction franaise sur la 5me edition par L. Suret et G. Lutfalla, 1929. BUNLE H., 1911, "Relations entre les variations des indices conomiques et le mouvement ds mariages", JSSP, p. 80-91. CAROL A., 1995, Histoire de l'eugnisme en France.Paris, Le Seuil. CARVALLO E., 1912, Le Calcul des Probabilits et ses applications, Gauthier-Villars, Paris, 163 p. DARMOIS G., 1928, Statistique Mathmatique, Librairie Douin, Paris. DESROSIERES A., 1998, Lucien March (1859-1933) : A pioneer of Quantitatuive Economics, in Warren J. Samuels (ed), Euroepean Economists of the early 20th Century, Vol 1, Northampton, Edward Elgar.

17 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

DIVISIA F., 1932, "Economique et Statistique. A propos d'un livre rcent", Revue d'Economie Politique, SeptOct. 1932, p. 1457-1495. Extraits dans Bulletin X-Crise, 14-15, 1933-34. EDGEWORTH F. Y., 1925 (1887-1889), "Measurement of Change in Value of Money" et "Tests of accurate measurement", partir de trois mmoires prsents la BAAS en 1887-89, Papers relating to political economy, London, Macmillan, Vol. I, p. 195-335. EDGEWORTH F. Y., 1896, "On the asymetrical probability-curve", Phil Mag.. EDGEWORTH F. Y., 1898-1900, "On the Representation of Statistics by Mathematical Formulae", Journal of the Royal Statistical Society, 61, p.671-700; 62, p. 125-140, 373-385, 534-555; 63 (Suppl.), p. 72-81. EDGEWORTH F. Y., 1909, "Sur l'application du calcul des probabilits la statistique", BIIS, Tome XVIII, p. 220-253. JOVANOVIC F. et LE GALL P. , 2001, March to numbers. The statistical style of Lucien March, History of Political Economy, Vol. 33, Supplment, p. 86-110. JOZEAU M.F., 1997, Godsie au XIXe sicle : de l'hgmonie franaise l'hgmonie allemande. Regards belges, Thse de Doctorat, Universit Paris VII, Edition IREM. JULIN A., 1921, Principes de Statistique thorique et applique, Prface L.March, tome1: Statistique thorique, Marcel Rivire, Paris, 712 p. KEYNES J. M., 1909, "The Method of Index Numbers with Special Reference to the Measurement of General Exchange Value", Collected Writings of John Maynard Keynes, D. Moggridge (ed), Macmillan Cambridge University Press, 1983, Vol. XI, p.49-173. LAPLACE P. S., 1986 (1825), Essai philosophique sur les probabilits, postface B.Bru, d'aprs la 5me dition (1825), Paris, C. Bourgois. LENOIR M., 1913, Etudes sur la Formation et le Mouvement des prix, Thse de Doctorat, Paris, Giard et Brire. LEXIS W., 1875 , Einleitung in die Theorie de Bevlkerungs-statistik, Strasbourg, Trbner. LEXIS W., 1877, Zur Theorie der MassenerScheinungen in der menschlichen Gesellschaft, Freiburg, F.Wagner. LEXIS W., 1879, "Ueber die Theorie der Stabilitt statistischer Reihen", Jahrbuch fr Nationalfonomie und Statistik, Vol. 32, p. 60-98. MARCH L., 1898, "Salaires, quelques exemples de leur distribution", JSSP, p. 193-206, et 241-248. MARCH L., 1904-1905, "Les reprsentations graphiques et la statistique comparative", JSSP, 1904, p. 398, 407; 1905, p. 47-48. MARCH L., 1905, "Comparaison numrique de courbes statistiques", JSSP, p.255-277. MARCH L., 1907, "L'organisation de la statistique gnrale de la France", discours en prenant la prsidence de la SSP, JSSP, p.35-43 MARCH L., 1908, "Remarques sur la terminologie en statistique", extrait d'une communication au congrs de mathmatiques de Rome, JSSP, p. 290-296. MARCH L., 1909, "De l'application de procds mathmatiques la comparaison des statistiques", BIIS , Tome XVIII, 1re Livraison, p. 254-264. MARCH L., 1910a, "Essai sur un mode d'exposer les principaux lments de la thorie statistique", JSSP, p. 447-486. MARCH L., 1910b, "Influence des variations de prix sur le mouvement des dpenses mnagres Paris", JSSP, p. 45, 124, 136. MARCH L., 1911a, "Les moyens de rendre comparables les courbes statistiques", BIIS, Tome XIX, 1re Livraison, p.50. MARCH L., 1911b, "Statistique", in De la mthode dans les sciences, Paris Alcan. MARCH L., 1912a, Revue de "Calcul des probabilits" de Louis Bachelier, Paris Gauthiers-Villars, JSSP, p. 258. MARCH L., 1912b, "La thorie des salaires. A propos de l'ouvrage du Professeur Ludwell Moore : Laws of Wages", JSSP, p. 366-383.

18 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005

MARCH L., 1920, "La mthode statistique", Mtron, Vol. I, N1, p. 22MARCH L., 1921a, "Les modes de mesure du mouvement gnral des prix", Metron, Vol. I, N4, p. 73. MARCH L., 1921b, "La mthode statistique en conomie politique", Revue de mtaphysique et de morale, 28, p.137-173. MARCH L., 1922, Mouvement des prix et des salaires pendant la guerre, Paris, PUF. MARCH L., 1923a, "Les indices du mouvement gnral des affaires", JSSP, p. 166, p.221 MARCH L., 1923b, "Rapport sur les indices de la statistique conomique", BIIS, 2me Livraison, p.3. MARCH L., 1924, "Les indices conomiques", Metron, Vol. III, N3, p. 334MARCH L., 1927, "F. Edgeworth et les indices des mouvements des prix", JSSP, p. 261MARCH L., 1928, "Diffrences et corrlation en statistique", JSSP, p. 38-58. MARCH L., 1930, Les principes de la mthode statistique, Paris, Alcan, 796 p. MARIETTI P. G., 1947, La Statistique Gnrale de la France, Thse de Doctorat en Droit, Univ.de Paris. MEITZEN A., 1890 (1886), History,Theory, and Technique of Statistics, American Academy of political and social science, Philadelphia; Trad.angl.et introd.R.P.Falkner d'aprs Gechichte, Theorie und Technik der Statistik, Berlin. MENARD C., 1977, "Trois formes de rsistance aux statistiques: Say, Cournot, Walras", in Pour une histore de la Statistique, tome 1, Paris, INSEE. PARETO V., 1896, La Courbe de la Rpartition de la Richesse, Lausanne, Facult de Droit / Librairie ViretGenton. PARETO V., 1897 (1964) , Cours d'Economie Politique, Lausanne, F.Rouge et Paris, F.Pichon; Oeuvres Compltes, Dir. Giovanni Busino, Tome 1, Genve, Droz. PEARSON K., 1895, "Mathematical Contributions to the Theory of Evolution. II. Skew Variation in Homogeneous Material", Phil. Trans. of the R.S., 186A, p. 343-414. PEARSON K., 1912 (1892), La Grammaire de la Science, traduction et prface de L.March sur la 3me dition (1911), Paris, Alcan. PEAUCELLE J.L., 2004, "A la fin du XIXme sicle, l'adoption de la mcanographie est-elle rationnelle?, Grer et comprendre, N77, Septembre 2004, p.60-74. POINCARE H., 1912, Calcul des Probabilits, Leons professes la facult des sciences de Paris (2me semestre1893-94), 2me dition (1re dition 1896), Paris, G.Carr, 274 p. PORTER T., 2004, Karl Pearson. The scientific life in a statisticalage, Princeton UNiv. Press. PRESSAT R., 1987, "Quelques aspects de l'histoire de l'enseignement de la statistique", JSSP, 128-1, p.15-29. RIETZ H. L. (ed), 1924, Handbook of mathematical statistics, N.Y., Houghton Miffling Cy. RISSER R. et TRAYNARD C. E., 1933, Les principes de la statistique mathmatique, Fasciule IV du tome I du Trait du calcul des probabilits et de ses applications par Emile Borel, Paris Gauthier-Villars. S.G.F., 1910, Salaires et cots de l'existence diffrentes poques jusqu'en 1910, note prliminaire de L.March, Paris, Imp.Nat. S.G.F., 1913, Historique et travaux de la fin du XVIIe sicle au dbut du XXe, avec 103 tableaux graphiques relatifs aux travaux les plus rcents (Exposition universelle de Gand), Paris, Imprimerie nationale. YULE G. U., 1909, "Les applications de la mthode de corrlation aux statistiques sociales et conomiques", C.R. XIIme session I.I.S., Paris, B.I.I.S., tome XVIII, p. 265-277. ZIZEK F., 1913, Statistical Averages. A methodological Study, trad. amricaine W.M.Persons, New York, Henry Holt and Cy, 392 p.

19 Journ@l Electronique dHistoire des Probabilits et de la Statistique - Vol.1 n1, Mars 2005