Les statistiques de Zemstvo sont-elles numérisées ?

Les statistiques de Zemstvo sont-elles numérisées ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Des statistiques massives ont été recueillies à la fin de l'Empire russe (1861-1917) - les "Statistiques de Zemstvo". Ils sont disponibles sur microforme à Yale (http://www.library.yale.edu/slavic/microform/zemstvo.html). ont-ils été numérisés ? Si non, y a-t-il un problème avec les données qui a rendu difficile la numérisation ?

Merci JR


Cette collection de microformes semble être publiée par Brill. Leur site Web indique que l'index de recherche sur CD-ROM est disponible gratuitement, et ils ont également un guide de 60 pages au format PDF à télécharger gratuitement. La collection elle-même est extrêmement chère, ce qui explique pourquoi seule une poignée de bibliothèques de recherche de premier plan aux États-Unis et en Europe semblent l'avoir dans leurs collections.

Je ne vois aucune preuve (en anglais, je ne connais pas le russe) suggérant qu'une version numérique de la collection elle-même est en préparation, mais je ne trouve pas cela très surprenant. La numérisation d'une si vaste collection de données coûterait cher et le public cible serait restreint.


UNE HISTOIRE DES LIMITES ADMINISTRATIVES RUSSES (XVIII - XX siècles)

L'histoire de la division administrative n'est plus seulement une question d'intérêt académique pur, mais aussi de quelques moyens pratiques. Un large éventail de données sur la nature, l'utilisation des terres, la population, l'économie, la culture et la vie sociale a été collectée, traitée et stockée par le gouvernement avec l'affiliation à la division administrative existante.

  1. mauvaise compatibilité des cartes de différents âges en raison de diverses échelles, systèmes de coordonnées, projections, technologie de cartographie
  2. la nécessité de traiter des données textuelles nombreuses et variées, ayant néanmoins une référence spatiale
  3. grande flexibilité des frontières administratives elles-mêmes.

Certains spécialistes ont compilé des ensembles de données qui comprenaient l'histoire de la division administrative à leurs fins étroites. L'ensemble de données d'anciens enregistrements d'herbier avec une affiliation administrative de plus de 2000 découvertes de plantes a été construit pour l'étude des refuges arborés-plantes sous la dernière glaciation. Cela a aidé à convertir les anciens noms de lieux et l'affiliation administrative des découvertes en un nom moderne (Kozharinov, 1995).

Il y a environ 25-20 ans, l'histoire de la division administrative a été étudiée dans le cadre d'un projet [2] d'Atlas de l'histoire de l'URSS avec un succès partiel. De nombreuses sources cartographiques avaient été révélées (Kabuzan, 1981), mais l'équipe du projet n'avait pas réussi à surmonter les problèmes mentionnés ci-dessus. Actuellement professeur A.V. Postnikov de l'Institut d'histoire des sciences de Moscou a écrit un livre très détaillé sur l'histoire de la délimitation de la frontière sud de l'empire russe au Pamir (Postnikov 1998, 2001) et travaille actuellement sur un livre sur l'histoire de la Russie frontières en Asie centrale. Dr N.N. Kamedchikov et feu le professeur A.A. Lutyi de l'Institut de géographie de Moscou a travaillé sur la numérisation de la division administrative soviétique pour les recensements de la population de 1959 et 1989. Il existe des informations sur le projet SIG des frontières historiques de la Biélorussie (Karchevskii K.A., 2000). L'Institut d'histoire de la Russie a publié une carte de la division administrative russe du XVIIe siècle [3] (Division administrative. 1996).

Le but de notre projet est de construire un SIG historique de la division administrative russe et de ses changements pour la fin du XVIIIe - début du XXe siècle. Cela fournira un cadre flexible pour organiser et comparer des données historiques référencées spatialement pour la communauté universitaire et universitaire.

Il est maintenant temps de révéler, d'étudier et d'exposer des cartes d'archives russes et des données historiques. Il y a encore dix ans, les anciennes cartes russes étaient à peine disponibles pour les chercheurs. Presque toutes les cartes d'archives malgré leur âge et leur échelle ont été classées. Ce fut un obstacle pour la recherche dans divers domaines et mal influencé à l'étude comparative de l'histoire, de la géographie et de la cartographie russes dans le contexte international. Les réformes des dix dernières années ont ouvert les archives et les collections cartographiques à la recherche, et nous espérons que les choses ne reculeront pas.

Frontières et pouvoir : un bref aperçu

Les étapes de la division administrative

La division administrative et les frontières doivent être étroitement liées au pouvoir politique du pays, ses vues sur lui-même, ses sujets, ses objectifs et ses fonctions. Faire de « bonnes clôtures » est exactement la façon dont l'État « voit » (Scott, 1998) le pays et le peuple, un discours de pouvoir et de gouvernance. En Russie, on peut identifier quatre étapes principales dans l'histoire de la division administrative.

Stade médiéval tardif (XV - XVII siècle) : Le pays était divisé en unités administratives de premier niveau ( uezd ) qui étaient divisées en unités de deuxième niveau ( volost' ). A cette époque, il n'y avait pas de frontières administratives fixes ni sur les cartes ni comme points de repère. Il y avait beaucoup de terres vides et une très petite population. Ainsi, le sujet le plus précieux du pouvoir central était les personnes travaillant sur la terre, pas la terre elle-même. Les autorités centrales dressaient périodiquement des listes [4] de personnes et de villages appartenant aux mêmes uezd et volost'. Désormais, elles sont utilisées par les historiens pour reconstituer la division administrative médiévale [5].

Stade pétrinien (début du XVIIIe siècle - 1775) : Pendant presque tout le siècle, l'État pétrinien a « construit » des frontières spatiales qui devaient représenter la hiérarchie du pouvoir, ou, en utilisant l'argot politique russe moderne « verticale du pouvoir ». La cartographie s'accompagne de l'introduction de la nouvelle approche politique, la « cartographie du pouvoir » (Harley, 1988). Les géomètres pétriniens ne se contentent pas de tracer des frontières, ils les mettent en pratique. À cette époque, non seulement les gens sont devenus le sujet de l'État, mais l'ensemble de l'espace géographique et tout ce qu'il comprenait comme les forêts et les minéraux (Karimov, 1999). Le Reglament Petrine Generalnii [Règlement général -AK] dans le chapitre consacré aux cartes et plans énonce l'objectif principal de la cartographie : les provinces qui lui appartiennent, il faut qu'il y ait des cartes ou des tableaux généraux et particuliers dans chaque collège » (cité par D. Shaw, 1996). À cette époque de changements, les modèles conceptuels primaires encore peu clairs et les attentes de l'administration centrale avaient été fondés sur la diversité de la vie réelle et testés sur les gens. La division à quatre niveaux avait été introduite : gubernia, province, uezd et volost' .

Étape de stabilité (1775 - 1917) : En 1775, Catherine la Grande, entre autres réformes, introduisit la réforme de la division administrative et des frontières. Cette réforme résumait la longue période de changements. Les arpenteurs de la fin du XVIIIe - début du XIXe siècle devaient ajuster les lignes de démarcation en fonction des lignes des rivières et des lacs, et "arrondir" les frontières en coin. C'était d'une part l'adaptation des modèles politiques conceptuels à la variété de la nature et de la vie historique, de l'autre l'ajustement et la clarification des modèles mêmes de gouvernance et d'administration régionale. A cette époque, les frontières administratives devinrent vraiment quelque chose de pratique. C'était aussi une tentative de diviser le pays en régions à population égale. 41 gubernia ont été introduites, chacune composée d'uezd et de volost'. Cette division administrative, la même que toute la procédure de gouvernement territorial en général, est restée intacte jusqu'en 1917. Au cours des 130 années suivantes, seules quelques nouvelles gubernias avaient été fondées.

Stade moderne (1917 - présent) : Après la révolution de 1917, la division administrative a changé souvent et rapidement selon la politique du gouvernement central. Les autonomies nationales ont été introduites en 1920 - 1924 à tous les niveaux [6]. Sauf pendant une courte période, la division à trois niveaux existait : oblast' (niveau de gubernia), raion (niveau d'uezd) et sel'sovet - conseil rural (niveau de volost' ). En 1927 - 1929, lorsque l'équipe stalinienne établissait un contrôle politique sur le pays, les gubernia ont été regroupées en okrugs et une division à quatre niveaux a été introduite. Dans les années de la Seconde Guerre mondiale, les okrugs avaient été licenciés. Sous Khrouchev, un cadre de grandes régions économiques [7] a vu le jour en 1957, mais l'oblast est revenu après son limogeage en 1964.

En général, découpage administratif, frontières et « clôtures » restent le discours de l'État, du pouvoir, « discipliner et punir », parlant en termes de Foukault.

Sondages, cartes, archives

Stade pétrinien (début XVIIIe siècle - 1775) :

Ces deux atlas couvrent tout le pays (avec la Sibérie et le nord du Kazakhstan) et montrent la division administrative (au niveau de la province et de la province). Outre les atlas, il restait de nombreuses cartes et graphiques qui leur ont servi de sources, ainsi que de nombreuses cartes de géomètres pétriniens qui n'ont pas été utilisées. Le nombre approximatif de sources cartographiques des géomètres pétriniens qui pourraient être utilisées dans le projet est d'environ trois cents, mais une recherche détaillée devrait révéler de nouvelles sources d'archives. En outre, plusieurs atlas régionaux ont été compilés, par exemple l'atlas de Nerchinsk couvrant le territoire de la Sibérie du sud-est.

Les sources pour cela avaient été des cartes manuscrites de différentes parties du pays (échelles de 1:420000 à 1:840000). La tâche principale de l'arpentage à cette époque était la vue d'ensemble rapide des grandes régions du pays. Ainsi, le niveau de précision de la carte a été intentionnellement réduit [8], mais les principaux objets tels que les rivières, les villes et les villages, les grandes forêts et les marais pouvaient être localisés sur les cartes. Beaucoup d'objets ont été cartographiés à distance. Parfois, les villages de l'uezd sont simplement répertoriés en marge. Mais les géomètres ont accordé une attention et une précision particulières à la cartographie des limites administratives et de la ligne le long (Melnikova, 1954, Postnikov, 1989). La plupart des cartes avaient été réalisées en projection de De l'Isle ou projection Mercator (Postnikov, 1989, p. 44). En général, les limites sur les cartes pétrines pourraient être redessinées et numérisées avec une bonne qualité.

Les cartes et les documents de terrain correspondants sont stockés à Moscou aux Archives d'État russes ou aux documents anciens (RGADA), aux Archives d'État russes pour l'histoire militaire (RGVIA) et à Pétersbourg aux Archives historiques d'État russes (RGIA) et au Département des manuscrits de la Bibliothèque de l'Académie. des sciences (BAN). Une précieuse collection de cartes contemporaines de la Russie rassemblées par De l'Isle est conservée à la Bibliothèque nationale de France [9].

Chaque enquête cartographique était suivie de la collecte de données statistiques détaillées sur la population, les voies navigables, les forêts, les tribus locales, le commerce, etc. Au niveau le plus général, elles avaient été utilisées par Kirilov qui a compilé l'aperçu statistique du pays, publié pour la première fois en 1831 ( Kirilov, 1977), mais de nombreuses données géographiques diverses et détaillées restent encore inutilisées. En 1837 et 1851, les données statistiques générales et détaillées ont été recueillies par des questionnaires envoyés par l'Académie. A ces données s'ajoutent des relevés statistiques qui pourraient être rattachés aux cartes de découpage administratif : plusieurs recensements de population paysanne, statistiques de recrues de l'armée, statistiques forestières etc. RGIA, Archives de l'Académie des Sciences de Pétersbourg.

Stade de stabilité (1775 - 1917)

De nombreux relevés cartographiques de grande valeur ont été effectués par des cartographes du cadastre et des arpenteurs militaires. Dans le dernier quart du XVIIIe siècle, deux éditions d'un atlas [10] ont été imprimées décrivant le nouveau cadre des divisions gubernia et uezd. Notoires sont les décorations des cartes étant une sorte de message politique du gouvernement de Pétersbourg sur la façon dont il voit les régions de l'Empire.

Ces atlas étaient basés sur les enquêtes foncières à l'échelle du pays [11] effectuées par le cadastre russe. Jusqu'à la deuxième décennie du XIX siècle, la Russie européenne était couverte par l'enquête détaillée à grande échelle. Sa tâche étroite consistait à dresser un registre de la propriété foncière, mais les cartes et les plans réalisés avaient été topographiques au sens plein, montrant les terres arables, les prairies et les forêts, les marais, les établissements, les routes, la division administrative de tous les niveaux, etc. - le contenu standard de cartes topographiques. L'arpentage pourrait être une source précieuse pour l'histoire de la division administrative de la fin du XVIIIe au début du XIXe siècle.

Au total il y a eu des centaines de milliers de plans à grande échelle (1:8400), plusieurs centaines d'atlas uezd (1:33600 - 1:84000) et une centaine de cartes de gubernia (1:420000 - 1:840000) . Tous les documents généraux limitrophes - cartes, index, statistiques tabulaires sont manuscrits.

L'enquête générale limitrophe s'est accompagnée d'enquêtes statistiques très détaillées au niveau de chaque village et parcelle. Il comprenait des données tabulaires liées à la parcelle sur l'utilisation des terres, la population, les cultures et récoltes habituelles, la liste des oiseaux sauvages, les animaux à l'intérieur de la parcelle, des données sur les rivières, les lacs et les sources, souvent - sur les espèces de poissons d'eau douce. 90 pour cent des données statistiques pré-révolutionnaires ont été recueillies et mises à jour à cette époque. Cette période doit être considérée comme la plus prometteuse pour le type de projet que nous allons développer.

Les documents de l'Enquête générale des frontières sont conservés à Moscou à RGADA, RGVIA, à Pétersbourg à RGIA, Département des manuscrits de la Bibliothèque nationale de Russie et de nombreuses archives de l'oblast'. Normalement, les cartes et les atlas sont conservés séparément des statistiques correspondantes, mais dans les mêmes archives.

Le XIXe siècle n'est pas une nouvelle étape au sens plein. Le cadre général de la division administrative n'a pas changé depuis 1775. En Biélorussie, en Ukraine, en Crimée et à la frontière de l'Asie centrale, la division administrative de ces régions est devenue plus subdivisée. Ce processus a été accéléré par l'abolition du servage en 1864 lorsque de nombreux paysans se sont installés dans la steppe du sud de la Russie. Mais à cette époque, l'initiative sur l'arpentage et la cartographie descend du registre foncier à l'état-major général. Les topographes militaires ont cartographié de nombreuses cartes et plans précis et détaillés qui méritent un paragraphe spécial [12].

Les principales sources d'étude de la division administrative de cette période sont les enquêtes militaires menées par l'état-major russe. Les topographes militaires étaient soucieux de mettre à jour les cartes du siècle précédent et de créer des cartes plus précises et plus détaillées. Depuis 1830 Les cartes de l'état-major montrent le relief. De nombreuses enquêtes ont été effectuées, parmi lesquelles - Une carte à cent listes de l'empire russe, 1801 (1:840000), F.F. Shubert "Carte spéciale de la Russie européenne", 1821-1839 (1:840000), dessins topographiques de la Sibérie, 1820 e - 1830 e , Survey of the Western Russia, 1845-1863, 1:126000, A.I. Enquête Mende sur la Gubernie russe interne, 1847-1866, échelles de 1:42 000 à 1:816000, I.A. Carte spéciale de Strelbitsky, 1865 - 1917 [13] et bien d'autres (Postnikov, 1989). La Russie européenne était le polygone de la plupart des enquêtes, mais beaucoup d'entre elles ont eu lieu en Asie centrale, Pamir, Sibérie, Kazakhstan. Évidemment, les frontières administratives sont indiquées sur la plupart de ces cartes.

Les cartes militaires sont stockées principalement à Moscou chez RGVIA et RGADA. Le nombre total de cartes réalisées par les topographes militaires pourrait difficilement être évalué, mais il est sans doute supérieur à plusieurs centaines de milliers. La plupart d'entre elles malgré l'âge avaient été classées avant 1992. Les cartes classées n'étaient pas disponibles pour les recherches sauf pour des raisons très valables. Ces cartes étaient stockées dans une archive à distance spéciale en Sibérie. En 1990, ces cartes ont été retournées à RGVIA et sont maintenant disponibles.

Semblable aux arpentages du XVIIIe siècle, la cartographie militaire a été suivie d'enquêtes statistiques. Les topographes militaires ont rassemblé des informations détaillées sur la population, les maisons, les cultures, les récoltes, l'utilisation des terres, les chevaux. I.A. L'enquête Mende sur la Gubernia interne est la plus notable. Le programme a été fait de manière à ce que les cartes et les données tabulaires soient comparables aux données de l'enquête générale des frontières. Les géomètres de Mende ont rassemblé des statistiques sur la population, l'utilisation des terres, les cultures, les récoltes, les oiseaux et animaux sauvages, les poissons d'eau douce, etc.

Outre les statistiques militaires, d'énormes volumes de données tabulaires avaient été rassemblés, mis à jour et publiés périodiquement par l'administration locale [14] de gubernia en 1864 - 1918. Dans les parties du pays où le zemstvo n'était pas établi, des enquêtes statistiques ont été menées et mises à jour par le commission statistique sous la tutelle du gouverneur. Ces enquêtes comprennent des informations sur de nombreux aspects, de la population et de l'utilisation des terres à l'éducation, la santé et les statistiques criminelles. Toutes ces données sont liées au niveau de division administrative correspondant - gubernia, uezd, volost' et villages séparés. La plupart de ces informations ont été publiées et disponibles dans les bibliothèques principales, les non publiées sont stockées dans les archives de la RGIA et de l'oblast. Les statistiques de Zemstvo seront un ajout important au système d'information proposé.

Scène moderne : 1917 à nos jours

Tous les changements administratifs de la période soviétique sont référés aux Actes correspondants des pouvoirs suprêmes. Il existe des guides sur la division administrative pour chaque année et des cartes spéciales détaillées montrant les réformes administratives du niveau supérieur et moyen. Ces données pourraient être directement exploitées dans le SIG, redessinées, numérisées et traitées.

La grande quantité de statistiques officielles recueillies par l'Agence centrale de statistique et les enquêtes statistiques de l'oblast pourraient être superposées sur des données spatiales. Les informations les plus fiables sont les informations antérieures à 1930. Des données sélectionnées des niveaux fédéral, oblast et raion depuis 1970 sont disponibles sous forme électronique. Les statistiques officielles actuelles ont pu être obtenues sous forme électronique à partir de 1990 environ.

Divisions spéciales

Il y avait plusieurs types de divisions spéciales en plus des gubernia administratives et des uezd. Depuis 1864, le pays était divisé en districts judiciaires. Un groupe de Gubernia était un sujet d'un tribunal de district. Il y avait une division du diocèse établie par l'Église orthodoxe. Il existait aussi des districts militaires subordonnés au gouverneur général, et quelques autres types. Les unités judiciaires spéciales, militaires et autres comprenaient généralement plusieurs gubernia ou même ne correspondaient pas au cadre de division administrative. C'était une forme de « division des pouvoirs » dans l'espace géographique.

SIG : approches et plans

Nous prévoyons de concevoir notre SIG historique afin d'atteindre les résultats suivants : (1) reconstruire la division administrative à n'importe quel niveau hiérarchique pour la période de temps demandée (2) reconstruire la dynamique temporelle des frontières administratives pour les unités locales (3) vérifier l'affiliation administrative des une zone ou un village, (4) visualiser la dynamique temporelle des changements de nom pour l'établissement ou l'unité locale (5) en perspective permettre aux chercheurs de saisir de nouvelles informations, d'extraire des données et de les utiliser à leurs propres fins avec les logiciels SIG les plus courants (et via Interface Web).

Nous allons procéder par les étapes chronologiquement indépendantes suivantes :

  1. Construisez la couche de base en numérisant les données de 1914
  2. Compiler la base de données "Map Bibliography", rechercher des sources supplémentaires afin de trouver les plus précises et les plus informatives pour la reconstruction des changements de division administrative au cours de la période entre 1914 et 1775
  3. Concevez un jeu de données géographiques " Limites administratives" à l'aide d'Oracle 7.3 pour décrire de manière transparente tous les types de modifications administratives
  4. Compiler la base de métadonnées sur les sources statistiques, organisée par unités administratives

Couche de base

En prenant comme base la division administrative de la Russie en 1914, nous la considérons comme la plus précise et la plus complète pour l'ensemble du territoire de la Russie. En même temps, cette date correspond à la dernière année stable avant les changements fondamentaux post-révolutionnaires.

Nous devons composer cette couche à partir de la carte Strelbitskii, des relevés topographiques en Sibérie et des relevés militaro-topographiques en Asie centrale pour le début du XXe siècle. Toutes les données seront numérisées dans ArcInfo 8 jusqu'au niveau volost. En conséquence, nous aurons environ 6 à 10 000 polygones. La géométrie des périodes antérieures jusqu'à 1775 sera saisie et conservée sous forme de modifications apportées à la couche de base.

Problèmes

Les principaux types de problèmes auxquels nous devons faire face concernent le traitement et l'interprétation des données.

La première traite de la nécessité d'utiliser différentes méthodes pour la saisie des données afin d'assurer la compatibilité de diverses sources. Une distinction doit être faite entre les données produites à différentes époques.

Les cartes du XIXème siècle pouvaient être numérisées directement. Elles ont des échelles de 1:84 000 à 1:420 000 qui permettent de les généraliser à l'échelle 1:1 000 000 en gardant une précision à un niveau acceptable. La dernière échelle est choisie comme base pour l'ensemble du produit afin de conformer nos matériaux aux couches déjà préparées à l'Institut de géographie (groupe de N.N. Kamedchikov) et d'accorder nos efforts avec la communauté internationale.

Parlant de matériaux très volumineux et divers en général, nous aimons souligner que la précision, la technologie et les instruments des relevés militaires sont comparables aux cartes modernes. Il y avait un programme spécial de mesures astrogéodétiques pour soutenir les levés topographiques, et la plupart des données géodésiques avaient été publiées. Même la projection Bonne utilisée par les géomètres du XIXe siècle est prise en charge par la version Workstation d'Arc/Info GIS ! Toutes les instructions et données nécessaires à la numérisation et au recalcul sont facilement disponibles à partir des instructions d'enquête imprimées. Il existe même des évaluations de la précision et des erreurs standard de bon nombre de ces mesures astrogéodétiques et de relevés cartographiques [15].

La numérisation des cartes de la fin du XVIIIe siècle est possible dans une large mesure. Les plans parcellaires à grande échelle de l'Arpentage Général Bordant sont réalisés sans projection. Mais les atlas uezd, les plans de Gubernia et les cartes d'ensemble à petite échelle pour l'ensemble du pays sont réalisés en projection Mercator. La précision de ces cartes est bien supérieure à celle des levés pétriniens. Plus d'objets ont été cartographiés par triangulation et mesures, parmi eux - les routes, les frontières administratives, les rivières et les frontières de la propriété foncière. Le réseau de triangulation avait été beaucoup plus serré et le nombre de points astrogéodétiques était plus élevé. Les caractéristiques géométriques de ce cadastre et les moyens de les superposer aux cartes modernes avaient été étudiées par Gedymin (1960) et ses conclusions nous rassurent sur la possibilité d'utiliser ces cartes avec le SIG moderne.

Les cartes produites avant 1775 ne pouvaient pas être saisies de manière adéquate sous forme électronique. Bien qu'ils aient des échelles détaillées (1:420 000 - 1: 840 000) et des projections avec des paramètres connus (Mercator ou De l'Isle [16]), la technologie des relevés n'était pas précise et l'erreur standard par rapport aux cartes modernes était grande . Pour certains territoires, l'enquête était exploratoire. Il est raisonnable de redessiner les limites à partir de ces cartes sur la base topographique moderne, puis de les numériser.

Les problèmes d'interprétation des données sont apparus car les relevés des grands territoires ont duré de nombreuses années (le General Bordering Survey a commencé en gouvernorat de Moscou en 1766 et s'est terminé en 1822 dans le sud de la partie européenne). On peut parler de "tranche" synchronique pour une seule gubernia mais pas pour toute la Russie européenne. Il est important que la cartographie et l'exploration géographique aient suivi l'expansion de la frontière russe depuis le XVIe jusqu'à la fin du XIXe siècle. Certaines régions annexées d'Asie centrale ont été cartographiées à très grande échelle pour étayer des actions militaires ou des différends de délimitation (Postnikov, 2001) ou leur valeur potentielle pour une colonisation future comme en Extrême-Orient et en Sibérie. Certains - avec de petites ressources et une population rare - ont été cartographiés à petite échelle. En général, il y a une prédominance notable des matériaux cartographiques pour la partie européenne par rapport à la Sibérie et l'Asie et il pourrait y avoir plusieurs écarts d'échelle, lorsque seuls des matériaux à petite échelle sont disponibles.

Pour les premières enquêtes et pour les territoires de la Sibérie, l'essence de la frontière était de distinguer l'affiliation administrative des villages et des villes. Cela signifie que la précision de la délimitation ne nécessite pas une numérisation précise de la ligne de démarcation à partir des cartes. Pour ce genre de cartes, nous devons vérifier les limites par la base de données Settlements, qui est maintenant en cours de démarrage. De plus, nous prévoyons d'utiliser une couche hydrographique, qui est très utile pour localiser les limites et les établissements. Il est compilé par le revendeur local d'ESRI, Inc.

De plus, nous allons utiliser des informations indirectes pour combler les lacunes. Il s'agit de l'édition complète des lois de l'empire russe, fixant l'établissement et la révocation de la liste officielle gubernii des colonies fixant les noms de lieux, les colonies et leur affiliation. Les données seront également extraites des rapports annuels du Gouverneur, conservés dans les archives de l'oblast.

Le moyen de résoudre le problème de l'interprétation des données pourrait être la conception flexible de la base de données permettant de conserver des intervalles de données (champs "from"-"to"), des versions de limites ou des entrées multiples pour le même objet (dérivées de différentes sources). Elle est très proche de l'approche pratiquée par les développeurs de SIG historiques chinois (L.W. Crissman, 2000).

Structure de la base de données

Le concept de la base de données suppose un ensemble de tables relationnelles, construites dans Oracle 7. Cela permettra de traiter des requêtes complexes selon des axes temporels et spatiaux. Il n'y a qu'un brouillon de la base de données, qui, à notre avis, reflète la spécificité des données que nous possédons et avec lesquelles nous allons travailler. Le principe de base est que nous distinguons plusieurs types d'objets au sein de notre système :

    Objets référencés géométriquement de deux types : polygones et points

La plus petite entité spatiale sera un polygone artificiel avec une séquence historique unique d'affiliation administrative. À chaque instant, il fait partie d'une unité administrative existante. Les objets ponctuels représentent les établissements.

Les objets virtuels correspondent à des unités administratives jusqu'à ce qu'ils portent le même nom. On suppose que le changement de nom signifie que le nouvel objet administratif est apparu. Cela reflète la situation réelle, alors que le changement de nom signifie généralement une réorganisation administrative radicale.

La plupart des statistiques recueillies au cours des XVIII-XIX siècles se rapportent à l'établissement unique, et seules les statistiques généralisées à uezd et volost'. Ainsi, les attributs seront incorporés dans la base de données « Etablissements » et comprendront le projet de liste de paramètres suivante : nombre de population, nombre de ménages, quelques statistiques agricoles.

Nous pouvons supposer que la structure de notre base de données après avoir commencé à la remplir d'informations peut progressivement changer. Dans tous les cas, il doit refléter de manière transparente tous les types de changements administratifs survenus au cours de la période examinée.

Types de changements administratifs

L'analyse du matériel déjà collecté montre plusieurs types de changements dans la division administrative, survenus au cours de la période observée :

Les modifications de la géométrie des limites sont de deux sous-types :

    résultant de la combinaison de deux ou plusieurs unités ou de leur séparation

Dans les périodes de réformes administratives, jusqu'à 90 % des unités administratives avaient été modifiées par décennie. En période de calme, les ajustements locaux ne dépassaient pas 1 à 5 % par an. Il est difficilement imaginable qu'une frontière change deux fois ou plus par an. Les statistiques agricoles liées à l'unité administrative ont été recueillies une fois par an conformément au cycle agricole.

Les changements de toponymes des unités administratives et des implantations signifiaient généralement une réorganisation sérieuse d'une unité, mais étaient moins graves pour les implantations. Avant 1917, de nombreuses agglomérations portaient plusieurs noms : folkloriques et officiels. Parfois, les noms folkloriques ne pouvaient pas être cités et, selon une instruction spéciale des arpenteurs de 1770, quelques lettres de ces noms devaient être modifiées pour qu'elles sonnent mieux. Les noms locaux et officiels ont été fixés dans uezd Bordering Atlas et dans les registres statistiques sur l'utilisation des terres. Après 1917 nous n'avons qu'un nom officiel et très souvent il est différent du pré-révolutionnaire. Les changements de noms ont été principalement motivés politiquement.

Les changements de statut administratif étaient rares et impliquaient des transformations du statut hiérarchique de l'unité administrative. Cela peut se produire en raison de l'augmentation (diminution) de la population, de facteurs politiques. Par exemple, après la réinstallation forcée des tadjiks des hauts plateaux du Pamir vers les plaines, le statut des districts des hauts plateaux s'est réduit.

En comparaison avec le système administratif chinois, il n'y avait pas de système de codage jusqu'à nos jours.

Ce qui est déjà fait

Au moment où nous avons commencé à construire une base de données des établissements pour le début du XXe siècle qui sera un matériel d'aide supplémentaire pour la vérification des limites. Nous sommes maintenant à la phase de pré-projet et aujourd'hui nous avons déjà :

  • a compilé une petite base de données de descriptions bibliographiques de cartes provenant d'archives et de bibliothèques russes avec leurs codes, qui est présentée sur Internet et peut être recherchée. Il s'agit d'un prototype de service d'information bibliographique lié à notre système d'information à l'avenir. Dans un futur proche, nous prévoyons d'établir la base de données bibliographique distribuée conforme à la norme Z39.50
  • préparation des données à numériser pour l'année 1914
  • commencer à enregistrer des méta-informations sur des ensembles de données statistiques conformément à la norme Dublin Core.

Conclusion

  • La communauté scientifique a vraiment besoin du système d'information intégrant les données du département administratif de l'histoire comme cadre de ses propres études,
  • Il y a beaucoup d'anciens documents cartographiques dans diverses archives qui constitueront une bonne base pour le SIG des frontières administratives russes, la plupart d'entre eux étant maintenant disponibles pour les chercheurs,
  • L'exactitude des anciennes cartes correspond soit aux cartes modernes, soit les données pourraient être converties à l'aide de technologies de l'information modernes et de méthodes élaborées par un chercheur local,
  • Le SIG historique doit être fait comme un système ouvert, devenant ainsi un cadre de projets et d'initiatives et se développant comme une ressource collaborative.

Le travail sur le SIG des limites administratives est maintenant en phase de démarrage. Le calendrier, le volume et le contenu du système dépendront du petit financement indirect que nous recevons déjà de nos institutions et des subventions potentielles que nous allons solliciter. Nous apprécierions toute opportunité de projets collaboratifs, ouverts à toute recommandation et prêts à mettre nos données en conformité avec les données de nos partenaires potentiels.

Bibliographie

  • Division administrative de l'État russe à la fin du XVIIe siècle. Carte. Dans la patrie [Rodina]. Moscou, 1996, Vol. 9.
  • Alexandrovskaïa O.A. (1989). Emergence de la géographie russe au XVIIIe siècle. [Stanovlenie geograficheskoi nauki v Rossii XVIII veka]. Moscou, 'Nauka'.
  • Baransky N.N. (1926) Géographie économique de l'Union soviétique. Aperçu des régions GOSPLAN. [Economicheskaia geografiia Sovetskogo Soiuza. Obzor po oblastiam Gosplana]. Moscou - Léningrad.
  • Crissman L.W. (2000). Projet de conception de base de données et de système de géocodage, http://www.people.fas.harvard.edu/

Les références:

[1] Les données historiques ne sont pas seulement utilisées par les historiens. Les chercheurs travaillant avec d'anciennes collections de minéraux, d'insectes, de plantes et même de chansons folkloriques ont souvent besoin de localiser les lieux de découvertes sur la carte de la division administrative moderne. Les décideurs environnementaux utilisent des cartes historiques pour localiser d'anciennes zones d'animaux rares ou pour révéler des forêts anciennes intactes (voir http://www.forest.ru).

[2] Le projet a été réalisé à l'Institut d'histoire de l'URSS. Il comprenait l'académicien Ia. E. Vodarskii, L.G. Beskrovnyi, V.M. Kabuzan, A.V. Postnikov.

[3] La moitié nord de la carte était basée sur la carte de J. Got'e de la division administrative russe au nord de la rivière Oka (Got'e, 1906).

[4]Livres d'enquête - pistsovye knigi .

[5] Il n'y avait pas de cartes du XVIIe siècle qui pourraient être utilisées pour étudier la division administrative.

[6] Niveau fédéral - Républiques socialistes soviétiques nationales - membres de l'Union des Républiques socialistes soviétiques - URSS, niveau républicain - républiques nationales autonomes, incluses dans la République socialiste soviétique nationale, oblast national, okrug et raion - division de niveau inférieur.

[7] Approche élaborée par les géographes économiques soviétiques et utilisée au Comité de planification de l'État (GOSPLAN) (Baransky, 1926).

[8] Il s'agissait d'un différend entre des hommes d'État russes et des praticiens de la géographie de haut rang, comme Kirilov, Tatichev et Miller s'intéressant à la cartographie rapide du pays et l'académicien J.-N. De l'Isle, premier directeur de l'observatoire de Saint-Pétersbourg et auteur du premier programme d'arpentage du territoire russe. Les activités de l'académicien De l'Isle en Russie suscitent toujours des réactions controversées. Il était l'auteur d'une projection spéciale pour la Russie utilisée jusqu'aux années 1870. Il a beaucoup fait pour développer l'astronomie et la mesure des coordonnées en Russie. Mais son programme d'arpentage basé sur les nombreuses observations astronomiques précises, demandait trop de temps et de personnel et restait donc sur papier.

[9] De l'Isle appartenait à une famille de l'historien Claude de l'Isle. Son frère Guillaume, élève de l'astronome et cartographe J.-D. Cassini, est devenu célèbre pour ses cartes et son globe publiés en 1702. J.-N. De l'Isle a été fortement influencé par les idées sur la mesure de la Terre, la cartographie du monde, la collecte de nouvelles données géographiques et les observations astronomiques. Il envoya des copies des cartes et cartes russes à Paris en pensant à préparer une révision de la carte de son frère. Cela lui a coûté sa haute position à l'Académie et en 1747 il devait quitter la Russie (Urness, 1990). La contribution de De l'Isle à l'astronomie et à la cartographie russes est encore sous-estimée et peu étudiée.

[10] Atlas russe composé de quarante-quatre cartes et divisant l'Empire en quarante-deux gouvernorats. Saint-Pétersbourg, 1792. Edition II en 1800.

[11] Generalnoe Mezhevanie ou Enquête générale frontalière.

[12] Le professeur A.V. Postnikov a fait une recherche exhaustive sur l'histoire des relevés militaires du XIXe siècle (Postnikov, 1989).

[13] A été utilisé par l'état-major de l'Armée rouge jusqu'en 1939.

[14] En 1864, il a été établi un gouvernement autonome élu dans la plupart des gouvernements russes - zemstvo

[15] Professeur A.V. Postnikov a prouvé que les relevés militaires du XIXe - début du XXe siècle satisfaisaient aux exigences modernes en matière de précision de la carte. En tant que membre de la Commission du ministère des Affaires étrangères pour la vérification de la frontière soviétique - chinoise en 1980, il a élaboré des méthodes spéciales d'utilisation de vieilles cartes et d'observations de terrain à cette fin.

[16] Le dernier conçu spécialement pour les cartes de la Russie par l'académicien De l'Isle.


Contenu

Le système a été créé pour protéger l'ordre public et lutter contre le crime dans l'Empire russe. Il a été réorganisé le 1er mars 2011, sous la Fédération de Russie (à l'exception des structures existantes non liées au ministère de l'Intérieur).

16ème siècle Modifier

En 1504, des chevaux de frise furent installés à Moscou, sous lesquels les gardes, issus de la population locale, étaient stationnés. La ville a été divisée en zones, entre lesquelles des portes avec des treillis ont été construites. Il était interdit de circuler dans la ville la nuit ou sans éclairage. Par la suite, le Grand Prince Ivan IV a établi des patrouilles autour de Moscou pour une sécurité accrue.

Le Sudebnik d'Ivan IV a transféré les affaires "sur les voleurs guidés" à la juridiction des anciens honoraires. Avant cela, les lettres d'honneur étaient comme des récompenses et étaient décernées par une pétition de la population. Ces lettres ont permis à la société locale de gérer de manière indépendante le travail de la police. Dans les villes, les fonctions de la police étaient dirigées par le maire.

L'administration des voleurs a été mentionnée pour la première fois en 1571 et a existé de manière continue jusqu'au XVIIIe siècle. Des sources écrites de Moscou ont mentionné les boyards et le vol organisé depuis 1539. Konstantin Nevolin croyait que l'administration des voleurs était une commission temporaire établie pour mettre fin aux vols. Cependant, comme les vols n'ont fait que s'intensifier, la commission temporaire s'est transformée en un comité permanent et, par conséquent, l'administration des voleurs est restée.

17ème siècle Modifier

Par un décret du 14 août 1687, les affaires de l'administration des voleurs ont été transférées aux administrations Zemsky. En avril 1649, le Grand Prince Alexis publia un décret sur le système de bénédiction urbaine utilisé auparavant. Par décret dans la ville blanche (maintenant connue sous le nom de Belgorod), une équipe devait être créée sous la direction d'Ivan Novikov et de l'employé Vikula Panov. Le détachement était censé maintenir la sécurité et l'ordre, ainsi que protéger contre les incendies. Ils ont été trahis par cinq employés en treillis et "une personne à 10 mètres" avec des rugissements, des haches et des conduites d'eau.

Les policiers des grandes villes s'appelaient Zemsky Yaryg. La couleur des uniformes variait entre les villes. A Moscou, les officiers étaient vêtus de vêtements rouges et verts. Sur la poitrine, ils avaient les lettres "З" (Z) et "Я" (YA) cousues.

En 1669, les détectives remplacent universellement le rôle des anciens honoraires.

18ème siècle Modifier

La police de Saint-Pétersbourg a été établie en tant que police principale en 1715 par décret de Pierre le Grand. Initialement, le personnel de la police de Saint-Pétersbourg se composait du chef adjoint de la police générale, de 4 officiers et de 36 grades inférieurs. L'employé de bureau et dix greffiers travaillaient dans le bureau principal du commissariat de police. La police a non seulement maintenu l'ordre dans la ville, mais a également rempli plusieurs fonctions économiques et s'est engagée dans l'amélioration de la ville - pavage des rues, drainage des marécages, ramassage des ordures, etc.

Le 7 juin 1718, l'adjudant général Anton de Vieira est nommé général Polizeimeister. [5] Pour l'aider à terminer le travail, le Bureau de la police en chef a été créé et un régiment de l'armée a été transféré à l'autorité du général Polizeimeister. Tous les grades de ce régiment sont devenus policiers.Grâce aux efforts du général de Vieira, en 1721, les premières lanternes et bancs de repos ont été installés à Saint-Pétersbourg.

Le 19 janvier 1722, le Sénat au pouvoir établit la police de Moscou. L'Ober-Polizeimeister devait être nommé par l'empereur dans les rangs militaires ou civils. Par les instructions du 20 juillet 1722, l'Ober-Polizeimeister a supervisé la protection de la paix publique à Moscou en tant que chef du bureau de police de Moscou. Entre 1729-1731 et 1762-1764, le chef de la police de Moscou s'appelait le général Polizeimeister.

Le 23 avril 1733, l'impératrice Anna a signé un décret "sur l'établissement de la police dans les villes". Ce décret a donné à la police des pouvoirs légaux et lui a permis d'imposer des sanctions dans les affaires pénales.

19e et 20e siècle Modifier

En 1837, un règlement sur la police du zemstvo a été publié, selon lequel le chef de la police du zemstvo élu par la noblesse est devenu le chef de la police dans le uyezd. Les policiers nommés par le gouvernement provincial lui obéirent. Eux. à leur tour, le dixième, sotsky, cinq cent mille paysans obéirent.

En 1862, une réforme de la police est menée. Le titre de maire a été aboli les conseils municipaux dans les villes qui étaient subordonnés à la police de district ont été rattachés aux tribunaux zemstvo, renommés services de police de district, et dans les villes qui ont conservé leur propre police, distincte de la police de district, ils ont été renommés dans les services de police de la ville.

En 1866, une garde zemstvo fut établie dans les districts du royaume de Pologne.

En 1866, le chef de la police de Saint-Pétersbourg Fiodor Trepov envoya une note à Alexandre II, qui disait : « Une lacune importante dans l'institution de la police métropolitaine était l'absence d'une partie spéciale dans le but spécial de mener des recherches pour résoudre des crimes, trouver des mesures générales pour prévenir et réprimer les crimes. Ces responsabilités incombaient aux rangs de la police extérieure qui, portant tout le fardeau du service de police, n'avait ni les moyens ni la possibilité d'agir avec succès à cet égard. Pour remédier à cette lacune, il a été proposé de créer une police d'enquête ».

Pour la première fois dans la police russe, des unités spécialisées pour résoudre les crimes et mener des enquêtes ont été créées à Saint-Pétersbourg, où en 1866 une police de détective a été créée sous le bureau du chef de la police. Auparavant, les fonctions de détective étaient exercées par des enquêteurs médico-légaux et par l'ensemble de la police telle qu'elle existait à l'époque. Initialement, le personnel de l'enquête criminelle de Saint-Pétersbourg était petit, le département était composé, en plus du chef de son assistant, de 4 fonctionnaires en mission spéciale, de 12 détectives de police et de 20 détectives civils.

Le département de détective a été fondé en 1866, fonctionnant sous le département de police du ministère de l'Intérieur, et en 1907, des départements similaires avaient été créés dans d'autres grandes villes de l'Empire russe, notamment Moscou, Kiev, Riga, Odessa, Tiflis, Bakou, Rostov-sur-le-Don et Nijni Novgorod. D'autres quartiers étaient desservis par des unités de police rurale ou de gendarmerie.

En 1879, l'institut des officiers de police dans les zones rurales a été créé. Les policiers étaient destinés à aider les policiers « pour l'exercice des fonctions de police, ainsi que pour la surveillance des centurions et des contremaîtres ».

Depuis 1889, le chef de la police de district a commencé à être appelé officier de police de district.

En 1903, à la campagne, à l'origine dans 46 provinces, une garde de police de district a été mise en place. En 1916, il s'étendait à 50 provinces.

Le 9 août 1910, le ministre de l'Intérieur Piotr Stolypine a publié une instruction aux officiers des départements de détective, qui a déterminé leurs tâches et leur structure. Chaque département de détective était composé de quatre divisions structurelles-bureaux :

  • Détention personnelle.
  • Recherches.
  • Observations.
  • Bureau d'enregistrement des informations.

Par ordre de Piotr Stolypine, au département de police, des cours spéciaux ont été créés pour former les chefs de départements de détective. Lors du Congrès international des criminalistes, tenu en Suisse en 1913, la police policière russe a été reconnue comme la meilleure au monde pour résoudre les crimes.

La force de police de 3 500 hommes de Petrograd a constitué la principale opposition aux émeutes, qui ont marqué le début de la révolution de février. Après la défection des unités de l'armée en garnison dans la ville, la police est devenue la cible principale des révolutionnaires, et beaucoup ont été tués. La police de l'empire russe a été dissoute le 10 mars 1917 et le 17 avril, le gouvernement provisoire a créé la milice populaire (Militsiya) en tant que nouvel organisme d'application de la loi.

Militsiya soviétique Modifier

Décisions du gouvernement provisoire « Sur l'approbation de la milice » et « Réglementation temporaire sur la police », publiée le 17 avril 1917, la « milice populaire » a été créée. La milice populaire est déclarée l'organe exécutif du pouvoir de l'État au niveau local, « directement sous la juridiction du zemstvo et des administrations publiques de la ville ».

Parallèlement à la « milice populaire » d'État, les conseils de députés ouvriers organisaient des détachements de « milice ouvrière » et d'autres formations armées, qui étaient sous l'influence de diverses forces politiques, et parfois en dehors d'elles. En même temps, la milice ouvrière n'était pas subordonnée aux commissaires de la milice de la ville.

Le Conseil de la milice populaire de Petrograd, formé le 3 juin sous les auspices des bolcheviks, est entré en conflit avec le chef de la milice de la ville, lançant des slogans politiques en rapport avec le refus de payer des frais supplémentaires pour le service dans la milice des travailleurs à travailleurs recevant un salaire complet dans les usines. La structure étatique la plus importante sera détruite.

Le principe de l'auto-organisation des forces de l'ordre a été mis en œuvre par le Parti bolchevique pendant un certain temps après octobre 1917. Le décret du NKVD "Sur les milices ouvrières" du 28 octobre (10 novembre) 1917 ne prévoyait pas les formes organisationnelles de l'appareil de milice d'État.

La milice ouvrière avait le caractère d'organisations d'amateurs de masse, était formée sur la base d'escouades volontaires, de sorte qu'elle ne pouvait pas arrêter le crime effréné.

Le 10 mai 1918, le Collegium du NKVD adopte un arrêté : « La police existe en tant qu'état-major permanent de personnes exerçant des fonctions spéciales, l'organisation de la police doit être réalisée indépendamment de l'Armée rouge, leurs fonctions doivent être strictement délimitées. . "

La milice a été formée le 10 mars 1917, remplaçant les anciennes organisations policières russes du gouvernement impérial. Il y avait des détachements de milices populaires et de milices ouvrières organisés en unités de police paramilitaires. Après la dissolution de l'Union soviétique, la milice a continué d'exister en Russie jusqu'au 1er mars 2011.


StephenShenfield.NET

Note d'introduction

Dans les années 1980, alors que j'étais au Centre d'études russes et est-européennes de l'Université de Birmingham, j'ai rédigé un doctorat. thèse sur la méthodologie mathématique et statistique de l'enquête sur le budget familial soviétique. Macmillan a proposé de publier un livre basé sur la thèse, mais j'aurais dû réviser le manuscrit et réduire considérablement sa longueur. Il était difficile de décider quoi omettre. J'ai été distrait par d'autres choses et je n'ai jamais écrit le livre. La thèse n'a été lue que par une poignée de spécialistes qui l'ont empruntée à la bibliothèque universitaire.

L'autre jour, j'ai découvert avec grand plaisir que la bibliothèque avait numérisé les thèses soumises à l'université. Ils sont désormais tous en accès libre. Pour télécharger ma thèse, cliquez ici. Si la plupart des contenus n'intéressent en effet que quelques spécialistes, je pense que quelques chapitres peuvent intéresser un lectorat un peu plus large. L'un de ces chapitres, reproduit ci-dessous, devrait plaire aux personnes intéressées par l'histoire des sciences et des mathématiques. Il montre que de la fin du XIXe siècle à la fin des années 1920, les statisticiens russes avaient environ une décennie d'avance sur leurs collègues occidentaux dans les domaines de la statistique mathématique et de la théorie de l'échantillonnage - des réalisations qui ont été presque complètement détruites par le stalinisme.

Le développement historique de la statistique mathématique et de la théorie de l'échantillonnage en Occident, en Russie tsariste et en URSS

Le terme "statistiques" est utilisé dans deux sens distincts. Il peut se référer à des informations quantitatives sur des phénomènes socio-économiques, ou à l'étude des problèmes généraux de collecte, de présentation, d'analyse, d'interprétation et d'utilisation de ces informations.[1] Alternativement, il peut faire référence à la discipline des statistiques mathématiques, qui traite d'un ensemble particulier de méthodes mathématiques, basées sur la théorie des probabilités, pour collecter et analyser des données de toutes sortes. Les statistiques mathématiques peuvent être appliquées à la fois à la collecte et à l'analyse de statistiques socio-économiques et à la collecte et à l'analyse d'autres types de données - par exemple, à la conception et à l'analyse d'expériences scientifiques. Inversement, les statistiques socio-économiques peuvent être collectées et analysées avec ou sans l'aide de statistiques mathématiques.

Cette situation s'applique également à la pratique et à la théorie de l'échantillonnage. La théorie moderne de l'échantillonnage probabiliste constitue une branche de la statistique mathématique. En tant que tel, il peut être appliqué non seulement à la collecte et à l'analyse de statistiques socio-économiques, mais également dans d'autres domaines, tels que le contrôle de la qualité de la production. De même, les statistiques socio-économiques peuvent être collectées avec ou sans l'application de la théorie moderne de l'échantillonnage. Cette théorie n'est pas appliquée à la fois lorsque les données sont collectées par dénombrement complet de la population et lorsque des méthodes d'échantillonnage non probabilistes d'origine pré-moderne sont utilisées.

L'objectif central de cette thèse est l'Explication des statistiques mathématiques, et de la théorie moderne de l'échantillonnage en particulier, à l'exercice de statistiques socio-économiques représenté par l'Enquête sur le budget familial soviétique. Nous ne couvrons donc pas tout l'éventail des questions, ni socio-économiques, ni statistiques mathématiques, mais considérons l'intersection entre les deux.

La pratique statistique soviétique contemporaine ne peut être correctement comprise que dans une perspective historique. C'est beaucoup plus vrai de la pratique statistique soviétique que de la pratique statistique occidentale, car la pleine application des statistiques mathématiques aux statistiques socio-économiques continue d'être entravée par des facteurs qui ont leur origine dans la période stalinienne. En particulier, les formes pré-modernes d'échantillonnage restent beaucoup plus utilisées en URSS qu'elles ne le sont en Occident.

Ce chapitre décrit le schéma du développement historique des statistiques socio-économiques, des statistiques mathématiques, et surtout de l'interaction des deux. Les sections 2 et 3 sont consacrées au développement de la statistique mathématique en général et à son application dans les statistiques socio-économiques, tandis que les sections 4 et 5 couvrent le même domaine en ce qui concerne l'échantillonnage en particulier. Le modèle de développement en Occident - Europe occidentale et Amérique du Nord - est traité dans les sections 2 et 4, le modèle de développement plus ou moins indépendant en Russie tsariste puis en URSS dans les sections 3 et 5.

2 Le développement historique de la statistique mathématique en Occident

Les statistiques socio-économiques, sous forme de statistiques d'État, remontent aux recensements des anciennes civilisations fluviales. Les statistiques mathématiques, en revanche, sont apparues relativement récemment. Son précurseur était l'école de « l'arithmétique politique » fondée au XVIIe siècle en Angleterre par Graunt et Petty, qui utilisaient des probabilités élémentaires pour étudier des problèmes publics tels que les causes de la maladie (Pearson 19-8). D'autres progrès dans l'analyse de la variation statistique ont été réalisés par des mathématiciens du XIXe siècle comme Poisson, Gauss et Quetelet. La statistique mathématique a finalement émergé sous sa forme contemporaine au cours de la période 1890-1940. Les contributions les plus cruciales à ce processus ont été les premières théories de la corrélation et de la régression de Galton, la théorie « classique » de l'inférence statistique de Neyman et Pearson et les travaux de Fisher sur l'analyse de la variance.

Malgré l'orientation socio-économique de l'arithmétique politique, le développement des statistiques mathématiques au XIXe et au début du XXe siècle a été principalement motivé par les besoins des sciences physiques et surtout biologiques. L'étude gaussienne de la variation statistique concernait principalement le problème de l'erreur expérimentale en science appliquée. Galton s'intéressait avant tout à l'hérédité Gossett ("Étudiant") a été conduit au test t de signification statistique par les besoins de la production de bière dans la brasserie Guinness à Dublin Fisher s'occupait de la conception d'expériences sur le terrain entre les guerres à Rothamsted Station expérimentale dans le Hertfordshire, en Angleterre. La nouvelle discipline fut pendant quelque temps connue sous le nom de « biométrie ».

L'application des statistiques mathématiques aux statistiques socio-économiques a été retardée par l'isolement des statistiques d'État des nouveaux développements théoriques. Les fonctionnaires chargés de la statistique de l'État manquaient de la formation mathématique nécessaire pour apprécier la valeur potentielle de leur travail des méthodes probabilistes, tandis que la plupart des mathématiciens pionniers de ces méthodes semblent ne s'être guère intéressés aux statistiques de l'État. L'interaction entre statistiques socio-économiques et mathématiques n'a d'abord été promue que par quelques réformateurs qui comprenaient les deux sujets, comme le professeur Bowley, l'occupant de la première chaire consacrée aux statistiques en sciences sociales (à la London School of Economics). En Grande-Bretagne, l'écart a été considérablement comblé lorsqu'un service statistique public plus professionnel a été mis en place après la Seconde Guerre mondiale, bien que la relation institutionnelle entre les statistiques d'État et les statistiques mathématiques reste une source de certaines difficultés, même aujourd'hui.

3 Le développement historique des statistiques mathématiques en Russie tsariste et en URSS

Il s'est développé en Russie à la fin du XIXe siècle une tradition autonome de statistiques socio-économiques, principalement basée sur les services statistiques du gouvernement local zemstva,[3] qui était plus sensible aux applications potentielles des statistiques mathématiques que les statistiques de l'État occidental. du temps. Des statisticiens russes classiques comme Chuprov étaient à la fois des statisticiens socio-économiques et mathématiques.

Les statistiques soviétiques des années 1920 représentaient à bien des égards une continuation de la tradition zemstvo. Les statisticiens de l'Administration centrale de la statistique (TsSU) bénéficiaient à la fois d'un généreux soutien de l'État et d'une grande autonomie professionnelle
(Wheatcroft 1980). Ils s'intéressèrent beaucoup aux travaux des statisticiens mathématiques occidentaux, dont ils développèrent plus avant les méthodes et les appliquèrent à l'analyse économique. En même temps, ils critiquaient la statistique mathématique occidentale pour son « empirisme vide » et son manque d'intérêt pour les questions de fond (Yastremskii 1927).

À la fin des années 1920, un groupe de statisticiens mathématiciens associés à la Nouvelle politique économique a été attaqué par les staliniens. Certains statisticiens staliniens ont utilisé cette campagne pour tenter de discréditer les statistiques mathématiques en tant que telles, au motif que les méthodes probabilistes, bien qu'éminemment adaptées à l'analyse de l'anarchie du marché capitaliste, étaient étrangères à une économie socialiste planifiée. D'autres ont fait valoir que, bien que les "démolisseurs" aient abusé des statistiques mathématiques à des fins anti-étatiques, la planification ne pouvait pas éliminer tous les phénomènes probabilistes (par exemple, la météo) et que l'application correcte des statistiques mathématiques restait donc nécessaire (Smit 1930). Le conflit entre ces deux points de vue a continué tout au long de la période stalinienne, et les défenseurs des statistiques mathématiques ont été justifiés dans les années qui ont suivi la mort de Staline.

Les opposants dogmatiques aux statistiques mathématiques n'ont à aucun moment atteint une domination totale. Ainsi, même dans les années qui ont suivi la Seconde Guerre mondiale, lorsqu'ils ont profité de la campagne « anti-cosmopolite » pour dénoncer « les ennemis du peuple... qui propagent les théories bourgeoises sous le mot d'ordre de la défense des mathématiques » (Méthodologie 1952), ils ont fait pas réussi à supprimer les méthodes statistiques de contrôle de la qualité dans l'industrie aéronautique, dont le besoin pratique a été réalisé par la direction. Cependant, l'influence prolongée des dogmatiques a eu un impact puissant sur les statistiques soviétiques.

Premièrement, l'interaction des mathématiques avec les statistiques socio-économiques a été interrompue. « La possibilité d'appliquer les méthodes de la statistique mathématique à l'étude statistique des phénomènes sociaux », et souvent même « l'opportunité de méthodes mathématiques de toute complexité en statistique », ont été niées (Nemchinov 1955). De nombreux statisticiens mathématiques ont quitté les statistiques socio-économiques pour travailler dans d'autres domaines.[4] Une "théorie générale des statistiques" a émergé qui a exposé une méthodologie non informée par les statistiques mathématiques.[5]

De nombreux travaux sur l'application socio-économique des statistiques mathématiques ont été menés depuis les années 1950. Néanmoins, la plupart de ces travaux ont été effectués dans des instituts extérieurs à TsSU et n'ont pas beaucoup affecté les méthodes utilisées au sein même de TsSU. Il est publié dans des revues telles que Uchenye zapiski po statistike (« Notes scientifiques sur les statistiques ») et Ekonomika i matematicheskie metody (« Méthodes économiques et mathématiques ») plutôt que dans la revue TsSU Vestnik statistiki (« Courrier statistique »). ne figurait pas parmi les organisations participant à la série de conférences sur l'application des statistiques mathématiques en économie tenues à partir de 1972[6].

De plus, l'enseignement des statistiques mathématiques et l'enseignement des statistiques socio-économiques restent dans une large mesure isolés les uns des autres dans les établissements d'enseignement. Les statistiques mathématiques occupent rarement une place prépondérante dans les programmes des établissements qui forment le personnel de TsSU - les tekhnikumy statistiques (écoles professionnelles), l'Institut économique et statistique de Moscou, etc. - tandis que les facultés de mathématiques des établissements d'enseignement supérieur enseignent un domaine très abstrait et type non appliqué de statistiques mathématiques.

Deuxièmement, les positions dogmatiques de la période stalinienne n'ont pas encore été complètement dépassées. On rencontre encore occasionnellement des exposés sur l'idée que les schémas probabilistes sont inapplicables aux phénomènes socio-économiques (Maslov 1971 pp. 35-6) [7], ou sur l'idée que les méthodes probabilistes contredisent la nature d'une économie planifiée (Lipkin 1977) .Il se peut bien que des positions de ce genre disparaissent de la circulation lorsque l'ancienne génération, éduquée à l'époque stalinienne, quittera la scène. Cependant, des attitudes moins explicites provenant au moins en partie du dogme antérieur peuvent être plus persistantes.

Les approches soviétiques de la prévision fournissent un exemple de telles attitudes (Shenfield 1983a). R. Oui. Boyarskii, le directeur de l'Institut de recherche scientifique de TsSU, observe que les statisticiens de l'État sont habitués à traiter des chiffres qui sont (soi-disant) particulièrement précis et doivent donc surmonter une "barrière psychologique" avant d'accepter les résultats non uniques de la prévision probabiliste (Metodologicheskie 1977 pp 8-9).

Une discussion des tests de signification par Boyarskii (1980) montre qu'il reste lui-même influencé par un autre principe de la doctrine stalinienne des statistiques - l'idée que la fonction des statistiques est d'illustrer des théories déjà connues pour être vraies plutôt que d'évaluer des hypothèses provisoires. Il soutient que, même si un test de signification statistique rejette une corrélation apparente entre l'échelle de production et la productivité de 0,1 comme un écart aléatoire par rapport à zéro, il est naturel pour un économiste ayant une connaissance théorique des économies d'échelle de considérer cela comme un corrélation. De ce point de vue, il est impossible qu'une analyse statistique puisse jamais discréditer des hypothèses antérieures.

4 Le développement historique de la théorie de l'échantillonnage en Occident

La plupart des statisticiens socio-économiques du XIXe siècle considéraient que seules les données des recensements complets pouvaient être considérées comme des « statistiques à proprement parler ». C'était une attitude compréhensible à une époque où les seules méthodes d'échantillonnage pratiquées étaient largement connues pour leur manque de fiabilité.

La plus importante de ces toutes premières méthodes d'échantillonnage était « la méthode monographique », inventée par le réformateur social LePlay, qui, à partir de 1829, rassembla des centaines de « monographies » détaillées sur le budget et le mode de vie des familles ouvrières (Lazarsfeld 1961). Dans une étude monographique d'une population, on obtient une description quantitative et qualitative extrêmement détaillée d'un assez petit nombre d'unités. Les unités enquêtées sont censées être soigneusement sélectionnées par des experts de manière à ce que chaque « type » d'unité de la population soit représenté dans l'échantillon par une unité, ou quelques unités, « typiques » de ce type (d'où le terme alternatif « échantillonnage typologique »). Comme l'ont souligné les critiques de la monographie, il n'y avait aucun moyen de vérifier le jugement de l'échantillonneur concernant la typicité. De plus, la plupart des populations ne sont pas constituées de quelques « types » homogènes connus et un échantillon monographique, de par sa nature même, ne peut refléter l'hétérogénéité au sein des types.

Dans les années 1890, Kiaer, le directeur du nouveau Bureau des statistiques de Norvège, a développé et utilisé une nouvelle forme de gaule qu'il a appelée "la méthode représentative". La méthode de Kiaer a été imitée par Wright, le directeur du National Bureau of Labor des États-Unis. La méthode était, selon les mots de Kiaer :

une enquête partielle dans laquelle les unités observées sont réparties de telle sorte que leur totalité forme une miniature de tout le pays, une photographie qui reproduit les détails de l'original dans ses vraies proportions relatives.

Pour atteindre cet objectif, Kiaer a utilisé des plans d'échantillonnage complexes à plusieurs degrés incorporant une stratification intensive et des éléments de sélection systématique (par exemple : sélectionner des hommes âgés de 17, 22, 27 ans avec des noms commençant par A, B, C, L, M et N). Les proportions des strates ont été déterminées à partir des résultats des recensements précédents, qui ont également servi à évaluer la représentativité de l'échantillon. La principale différence entre de tels échantillons "choisis" ou "équilibrés" et les plans d'échantillonnage modernes à plusieurs degrés est l'absence de sélection aléatoire au sein des strates.

La théorie des probabilités a d'abord été appliquée systématiquement à l'échantillonnage en Occident par Bowley, qui a introduit la théorie de base de l'échantillonnage aléatoire simple en 1906.[9] Le grand avantage de l'échantillonnage aléatoire est que, en contrôlant les probabilités d'inclusion des unités de population dans l'échantillon,[10] il permet d'estimer au moyen de la théorie des probabilités la précision des estimations de l'échantillon sous forme d'erreurs-types ou de limites de confiance. . La première enquête sociale utilisant un échantillonnage probabiliste a été menée par Bowley à Reading en 1912 (Maunder 1977). La théorie de l'échantillonnage probabiliste a été étendue à l'échantillonnage aléatoire stratifié par Neyman et Pearson en 1934.

Dans les années 1930, des expérimentations pratiques à grande échelle avec l'échantillonnage probabiliste ont été entreprises par des agences américaines telles que le Bureau of the Census et par le nouveau Indian Statistical Institute. Dans certains pays, comme la Suède, l'échantillonnage des enquêtes avant la guerre continuait de reposer sur « la méthode représentative » (Medin 1983). L'échantillonnage probabiliste a remplacé les anciennes formes d'échantillonnage dans les statistiques d'État après la guerre. Dans les études de marché et les sondages d'opinion, cependant, l'échantillonnage équilibré reste toujours utilisé sous le nom de "quota sampling". De plus, les théoriciens de l'échantillonnage dans les années 1970 ont repris l'intérêt pour la possibilité de mettre l'échantillonnage équilibré sur une base solide.[11]

L'émergence relativement tardive de la théorie de l'échantillonnage est peut-être la manifestation la plus frappante de l'ancien isolement des statistiques socio-économiques et mathématiques. Le besoin pratique d'un échantillonnage solide et l'appareil mathématique pour son développement existaient déjà au XIXe siècle, mais l'interaction nécessaire entre les fournisseurs potentiels et les consommateurs potentiels de la théorie de l'échantillonnage faisait défaut.

5 Le développement historique de la théorie de l'échantillonnage en Russie tsariste et en URSS

Comme en Occident, les statistiques d'État dans la Russie du XIXe siècle reposaient principalement sur des recensements complets. Cependant, diverses formes d'échantillonnage non probabiliste ont été utilisées vers la fin du siècle.

La plupart des études sur les budgets des ménages paysans que les statisticiens de plusieurs zemstva entreprennent à partir des années 1870 sont des enquêtes monographiques, fondées sur la sélection par une méthode ou une autre de ménages prétendument « typiques » de différentes régions (Wheatcroft 1980).

Apparemment particulière à la Russie était la forme de dénombrement incomplet connue sous le nom de « méthode du recensement » (tsenzovoi metod). Le "recensement" (tsenz) était ici un registre de toutes les unités de population considérées comme suffisamment importantes pour être incluses dans les statistiques. Des données ont été recueillies sur toutes ces unités et uniquement sur elles. Ainsi, le ministère tsariste des Finances a tenu à la fin du XIXe siècle une liste de « gares de recensement » pour chaque type de fret, ces listes ont été utilisées pour compiler des statistiques de transport ferroviaire (Poplavskii 1927). L'« industrie de recensement » se composait d'entreprises avec une taille minimale de main-d'œuvre, en fonction du niveau de mécanisation (Wheatcroft 1981). La logique de la méthode de recensement était d'utiliser des ressources limitées pour couvrir l'essentiel du phénomène d'intérêt. Il n'y avait aucun moyen d'extrapoler les résultats à l'ensemble de la population, car le nombre relativement peu élevé de grandes unités couvertes était très loin d'être représentatif des nombreuses petites unités négligées.

Il semble que, inconnue de l'Occident à l'époque, la théorie de l'échantillonnage probabiliste ait été développée indépendamment en Russie plusieurs années avant les travaux occidentaux correspondants. L'application de la théorie des probabilités à l'échantillonnage a été proposée pour la première fois dans un article que Chuprov a présenté à un congrès de chercheurs scientifiques dès 1894. La théorie de la répartition optimale dans l'échantillonnage aléatoire stratifié, généralement attribuée à un article de Neyman de 1934, avait déjà été énoncé dans un livre sur la théorie de l'échantillonnage de Kovalskii, publié à Saratov en 1924 (Zarkovic 1956, 1962).[13]

Dans les années 1920, TsSU a ressenti un grand besoin de développer des méthodes d'échantillonnage, l'expérimentation pratique ayant souvent lieu avant la théorie.[14] L'État avait besoin d'informations statistiques pour réguler l'économie, mais la couverture de toutes les unités économiques n'était pas nécessaire aux moyens de régulation économique utilisés pendant la Nouvelle Politique Économique. Il n'était pas non plus possible de procéder à un dénombrement complet étant donné la nature dispersée de l'économie de la NEP. De telles conditions étaient très favorables au développement de l'échantillonnage.

Cependant, bien que la théorie de l'échantillonnage probabiliste ait été élaborée par certains statisticiens dans les années 1920, l'échantillonnage probabiliste n'a pas complètement remplacé les formes d'échantillonnage antérieures. La méthode du recensement, en particulier, est restée assez largement utilisée - par exemple, dans les statistiques du transport ferroviaire et maritime de marchandises (Poplavskii 1927) et dans l'étude de la productivité du travail dans l'industrie (Akinshina 1966).

L'attaque contre l'application des statistiques mathématiques dans les statistiques socio-économiques à la fin des années 1920 a eu un effet particulièrement délétère sur la pratique et la théorie de l'échantillonnage, dont le développement semble avoir été « gelé ». L'application de la théorie de l'échantillonnage a été en général négligée pendant la période stalinienne (Nemchinov 1955). La méthode du recensement - désormais rebaptisée "méthode de la masse de base" (metod osnovnogo massiva) - a continué à être utilisée dans des domaines tels que les statistiques du transport ferroviaire (Kochetov 1966), et a également été appliquée dans la nouvelle enquête sur les marchés des fermes collectives, qui ne couvraient que les plus grands centres urbains (Belyaevskii 1962). Comme nous le verrons au chapitre A4, la méthode est encore utilisée aujourd'hui.

L'administration de l'économie dirigée mise en place dans les années 1930 exigeait la collecte de nombreuses informations statistiques sur la base d'un dénombrement complet des unités économiques. Le concept de « statistique » a été remplacé par celui de « comptabilité économique nationale »[15], dans laquelle l'échantillonnage n'avait naturellement pas sa place. Mais, comme nous le montrerons dans le chapitre suivant lorsque nous examinerons la position de l'échantillonnage dans la période post-stalinienne, même au sein d'une économie dirigée, l'échantillonnage pouvait très souvent se substituer à un rapport statistique complet, et il a été négligé à grands frais.

L'interaction des statistiques socio-économiques et mathématiques a suivi des voies très différentes en Occident d'une part et en Russie et en URSS d'autre part.

En Occident, le quasi-isolement des deux domaines l'un par rapport à l'autre qui prévalait au XIXe siècle s'est rompu dans la première moitié du XXe. L'échantillonnage probabiliste en particulier est devenu un outil central des statistiques d'État et a dans l'ensemble remplacé les anciennes formes d'échantillonnage non probabilistes.

En Russie, une tradition statistique indépendante s'est développée dans les quelques décennies avant 1917, qui s'est avérée capable d'intégrer les statistiques socio-économiques aux statistiques mathématiques et qui a atteint son apogée dans les années 1920 soviétiques. Jusque-là, les statistiques russes et soviétiques étaient quelque peu en avance sur l'Occident dans le domaine de la théorie et de la pratique de l'échantillonnage.

Cependant, les progrès ont été gelés au début de la période stalinienne, lorsque l'application des statistiques mathématiques aux statistiques socio-économiques a été fortement attaquée. Un isolement des statistiques mathématiques et socio-économiques s'imposait, semblable à celui qui était en train de disparaître en Occident. L'échantillonnage a été négligé et les premières formes d'échantillonnage non probabilistes sont restées largement utilisées. Depuis Staline, cet héritage n'a été surmonté que dans une mesure limitée.

[1] Les méthodes de collecte, de présentation, d'analyse, d'interprétation et d'utilisation des statistiques socio-économiques peuvent être utilement classées en trois catégories :

(a) les méthodes basées sur des mathématiques relativement simples que les statisticiens mathématiques appellent « statistiques descriptives »

(b) les méthodes de statistiques mathématiques, basées sur la théorie des probabilités et

(c) méthodes mathématiques relativement complexes non fondées sur la théorie des probabilités (par exemple, analyse d'indices ou programmation non stochastique).

[2] En 1906, le professeur Bowley s'adressa à la British Association for the Advancement of Science comme suit :

"Les illustrations d'Edgeworth en 1885 de l'importance des méthodes mathématiques pour tester la vérité des déductions pratiques ont jusqu'à présent porté singulièrement peu de fruits. Il est temps que la statistique mathématique s'appuie sur la critique et l'analyse des statistiques industrielles existantes. La plupart de nos statistiques n'ont pas été testés et leur signification n'a pas été analysée » (Maunder 1977).

[3] Les zemstva, institutions de gouvernement local créées en 1861 par le tsar Alexandre II, jouissaient d'une certaine indépendance vis-à-vis du gouvernement central et étaient ouvertes aux influences intellectuelles et politiques extérieures.

[4] Par exemple, V. S. Nemchinov s'est tourné vers la conception et l'analyse d'expériences agricoles à la station expérimentale de Bezenchukskaya, développant un système de calcul basé sur les polynômes de Chebychev (Nemchinov 1946).

[5] Les réformateurs de la période post-stalinienne ont insisté pour que les méthodes de la "théorie générale" soient combinées avec les méthodes de la statistique mathématique. Par exemple, Yuzbashev (1967) reproche à la méthode du « groupement analytique » d'ignorer l'effet confusionnel des variables non contrôlées dans la comparaison des groupes d'unités, et suggère de la combiner avec l'analyse de la variance.

[6] Pour un compte rendu d'une de ces conférences, la Conférence scientifique et technique de l'ensemble de l'Union sur l'application de l'analyse statistique multivariée en économie et sur le contrôle de la qualité de la production, tenue à Tartu (Estonie) en 1977, voir Aivazyan et al. (1978).

[7] Le professeur P. P. Maslov était un statisticien soviétique chevronné, prolifique dans un certain nombre de branches de la statistique d'État. Selon sa nécrologie, il était « l'un des plus grands statisticiens contemporains » (Ryabushkin et Sinokov 1975).

[8] Pour des discussions sur l'histoire des débuts de l'échantillonnage, voir Stephan (1948), You (1951) et O'Muircheartaigh et Wong (1981), dont le dernier est le plus perspicace.

[9] En fait, c'est Bortkiewicz qui fut en 1901 le premier en Occident à proposer d'appliquer la théorie des probabilités aux problèmes d'échantillonnage. Il a recommandé l'utilisation de la formule de Poisson pour déterminer si les différences entre les proportions de contrôle du recensement et les proportions de l'échantillon pouvaient être dues au hasard.

[10] L'échantillonnage aléatoire simple prévoit des probabilités d'inclusion égales, ce qui a d'abord été considéré comme un principe essentiel. L'échantillonnage aléatoire en général fournit des probabilités d'inclusion connues, mais pas nécessairement égales.

[11] C'est Royall (1970) qui a ressuscité l'échantillonnage équilibré dans le cadre d'une approche de superpopulation non bayésienne. Pour une discussion sur la question, voir O'Muircheartaigh et Wong (1981 pp. 12-14), qui sont sceptiques quant à savoir si les gains possibles d'un échantillonnage équilibré dans l'augmentation de la représentativité sont susceptibles de l'emporter sur les risques de renoncer à la capacité d'estimer la précision . De plus, l'échantillonnage équilibré n'a été justifié que sous certaines conditions.

[12] La méthode du recensement est parfois appelée « échantillonnage concentré ».

[13] Il est symptomatique du sort ultérieur de l'échantillonnage en URSS que les auteurs soviétiques ne fassent pas référence aux travaux de Kovalskii lorsqu'ils discutent des origines de l'échantillonnage. C'est le statisticien yougoslave Zarkovic qui a redécouvert le livre de Kovalskii à la bibliothèque Lénine de Moscou.

[14] Des conférences de statisticiens ont chargé la section méthodologique de TsSU de développer la théorie des méthodes jugées nécessaires dans la pratique, telles que l'échantillonnage en grappes (Zarkovic 1956). Pour un compte rendu des méthodes d'échantillonnage utilisées dans la sociologie soviétique dans les années 1920, voir Sheregi (1978).

[15] Cela se reflète dans le sort de TsSU lui-même. En 1930, l'Administration centrale de la statistique a cessé d'exister sous ce nom. Son personnel a été intégré à l'Agence nationale de planification (Gosplan) en tant que secteur économique et statistique, rebaptisé en 1931 Secteur de la comptabilité économique nationale. En 1941, TsSU retrouve son nom d'origine mais reste subordonné au Gosplan. Ce n'est qu'en 1948 que TsSU a retrouvé le statut qu'il avait dans les années 1920.


Histoire numérique : un guide pour recueillir, préserver et présenter le passé sur le Web

Introduction

Dans ce chapitre, vous découvrirez :

  • Les avantages et les inconvénients de la numérisation
  • Les différentes façons dont le texte peut être numérisé
  • Les avantages et les coûts du balisage de texte
  • Comment rendre le texte lisible par machine
  • Les moyens de rendre les images numériques
  • Comment numériser le son et les images animées
  • Si vous devez faire tout ce travail vous-même

il passé était analogique. L'avenir est numérique. Les historiens de demain se glorifieront d'un dossier historique largement numérique, qui transformera la façon dont ils recherchent, présentent et même préservent le passé. Mais que peuvent faire les historiens d'aujourd'hui avec les archives historiques analogiques massives des millénaires passés ? Ce chapitre fournit quelques réponses, offrant des conseils sur la façon de transformer le passé sous forme d'enregistrements écrits, de photographies, de bandes d'histoire orale, de films, de culture matérielle ou d'autres documents et artefacts analogiques en fichiers numériques. Ce faisant, nous pouvons permettre à ces ressources de bénéficier des avantages significatifs que nous avons décrits dans l'introduction, tels que l'accessibilité, la flexibilité et la maniabilité.

Une quantité étonnante d'enregistrements historiques analogiques est déjà devenue numérique au cours de la dernière décennie. Comme nous l'avons mentionné au chapitre 1, le projet American Memory de la Library of Congress présente plus de 8 millions de documents historiques. ProQuest’s Historical Newspapers propose le texte intégral de cinq grands journaux, y compris des éditions complètes du New York Times et du Los Angeles Times. Les collections en ligne du XVIIIe siècle de 33 millions de pages de Thomson Corporation contiennent tous les titres importants en anglais et en langue étrangère imprimés en Grande-Bretagne à cette époque. Plus dramatique encore, le géant du moteur de recherche Google a annoncé son intention de numériser au moins 15 millions de livres. 1 Des centaines de millions de dollars fédéraux, de fondations et d'entreprises ont été consacrés à la numérisation d'une proportion étonnamment importante de notre patrimoine culturel

Ce trésor de l'histoire numérique présente une aubaine incroyable pour les historiens, offrant des possibilités de recherche et d'enseignement en ligne qui auraient été inimaginables il y a quelques années à peine. Pour l'historien du numérique en herbe, cela confère également un autre avantage : l'expérience de la première génération de numériseurs fournit un ensemble de références et d'approches qui vous aideront à convertir des documents historiques pour votre propre site avec une plus grande efficacité, de meilleures reproductions et, nous l'espérons , un coût inférieur à celui des pionniers. Mais, comme les historiens le savent trop bien, les leçons du passé ne sont jamais simples et directes. “Il n'y a pas de règles absolues,” observe un rapport du Digital Library Forum.« Chaque projet est unique ». Vos propres objectifs et votre budget pour organiser une exposition pour votre société historique locale ou publier des documents pour vos étudiants peuvent être beaucoup plus modestes.

Ce chapitre ne fera pas de vous un expert des résolutions de numérisation pour les photographies ou des procédures d'échantillonnage pour l'audio, nous voulons plutôt vous donner suffisamment d'informations pour planifier intelligemment et superviser un projet d'histoire numérique. Pour ce faire, nous vous proposons un aperçu des principaux pourquoi, quoi, comment et qui de la numérisation : pourquoi est-ce utile ? fait, et qui devrait le faire (vous, votre organisation si vous en avez une, ou une autre personne ou entreprise).


Chiffres clés

Les chiffres-clés les plus importants vous fournissent un résumé compact du thème "Etats-Unis" et vous amènent directement aux statistiques correspondantes.

Économie

Produit intérieur brut (PIB) des États-Unis 2026

Taux de croissance du produit intérieur brut (PIB) aux États-Unis 2026

Taux de chômage aux États-Unis 2020

Taux d'inflation aux États-Unis 1990-2020

Revenu médian des ménages aux États-Unis 1990-2019

Made-In Country Index : perception des produits fabriqués aux États-Unis, par pays 2017

Indice de mondialisation - 50 premiers pays 2020

Classement mondial des pays par qualité des infrastructures 2019

Finances de l'État

Dette nationale des États-Unis 2026

Solde budgétaire aux États-Unis 2026

Ratio des dépenses publiques au produit intérieur brut (PIB) aux États-Unis

Militaire

Dépenses militaires américaines de 2000 à 2019

Gouvernement américain - dépenses de défense par habitant 1995-2020


1,1 million de documents ont été numérisés par FamilySearch.org en partenariat avec les Archives de l'État de l'Alaska pour mettre les dossiers à la disposition du public. Ces enregistrements comprennent les enregistrements de naissance, de mariage, de décès et d'homologation remontant au milieu des années 1800, une ressource importante pour la recherche généalogique en Alaska. Un index des noms liés aux actes de naissance, de mariage et de décès est disponible ci-dessous, qui renvoie à des documents en ligne.

Records détenus par la NARA (Seattle)


Une très courte histoire de la science des données

L'histoire de la façon dont les scientifiques des données sont devenus sexy est principalement l'histoire du couplage de la discipline mature des statistiques avec une très jeune – l'informatique. Le terme « Data Science » n'est apparu que récemment pour désigner spécifiquement une nouvelle profession qui devrait donner un sens aux vastes réserves de big data. Mais donner un sens aux données a une longue histoire et a été discuté par des scientifiques, des statisticiens, des bibliothécaires, des informaticiens et d'autres pendant des années. La chronologie suivante retrace l'évolution du terme « Data Science » et son utilisation, les tentatives de définition et les termes associés.

1962 John W. Tukey écrit dans « The Future of Data Analysis » : « Pendant longtemps, j'ai pensé que j'étais un statisticien, intéressé par les inférences allant du particulier au général. Mais en voyant évoluer les statistiques mathématiques, j'ai eu des raisons de m'interroger et de douter… J'en suis venu à sentir que mon intérêt central est dans l'analyse des données… L'analyse des données, et les parties des statistiques qui y adhèrent, doivent… revêtir les caractéristiques de la science plutôt que celles des mathématiques… l'analyse des données est intrinsèquement une science empirique… Combien vitale et combien importante… est l'essor du programme stocké ordinateur électronique? Dans de nombreux cas, la réponse peut surprendre beaucoup en étant « importante mais pas vitale », bien que dans d'autres, il n'y a aucun doute sur ce que l'ordinateur a été « vital ». son article de 1948 « Une théorie mathématique des communications ». En 1977, Tukey publie L'analyse exploratoire des données, arguant qu'il fallait mettre davantage l'accent sur l'utilisation des données pour suggérer des hypothèses à tester et que l'analyse exploratoire des données et l'analyse des données confirmatoires "peuvent et doivent procéder côte à côte".

1974 Peter Naur publie Enquête concise sur les méthodes informatiques en Suède et aux États-Unis. Le livre est une enquête sur les méthodes contemporaines de traitement des données qui sont utilisées dans un large éventail d'applications. Il est organisé autour de la notion de données telle que définie dans le IFIP Guide des concepts et termes du traitement des données: « [Les données sont] une représentation de faits ou d'idées d'une manière formalisée pouvant être communiquée ou manipulée par un processus. » La préface du livre indique au lecteur qu'un plan de cours a été présenté au congrès de l'IFIP en 1968, intitulé « La datalogie, la science des données et des processus de données et sa place dans l'éducation », et que dans le texte du livre, « le terme « science des données » a été utilisé librement ». Naur propose la définition suivante de la science des données : « La science du traitement des données, une fois qu'elles ont été établies, tandis que la relation des données à ce qu'elles représentent est déléguée à d'autres domaines et sciences.

1977 L'Association internationale d'informatique statistique (IASC) est établie en tant que section de l'ISI. "C'est la mission de l'IASC de lier la méthodologie statistique traditionnelle, la technologie informatique moderne et les connaissances des experts du domaine afin de convertir les données en informations et connaissances."

1989 Gregory Piatetsky-Shapiro organise et préside le premier atelier de découverte des connaissances dans les bases de données (KDD). En 1995, il est devenu la conférence annuelle ACM SIGKDD sur la découverte des connaissances et l'exploration de données (KDD).

Septembre 1994 Semaine d'affaires publie un article de couverture sur « Marketing de base de données » : « Les entreprises collectent des montagnes d'informations sur vous, les analysent pour prédire la probabilité que vous achetiez un produit et utilisent ces connaissances pour élaborer un message marketing précisément calibré pour vous y inciter … Un début d'enthousiasme suscité par la propagation des scanners de caisse dans les années 1980 s'est soldé par une déception généralisée : de nombreuses entreprises étaient trop submergées par la quantité de données pour faire quoi que ce soit d'utile avec les informations… Pourtant, de nombreuses entreprises pensent qu'elles n'ont d'autre choix que braver la frontière du marketing de base de données.

1996 Membres de Fédération internationale des sociétés de classification (IFCS) se réunissent à Kobe, au Japon, pour leur conférence biennale. Pour la première fois, le terme « science des données » est inclus dans le titre de la conférence (« Science des données, classification et méthodes associées »). L'IFCS a été fondée en 1985 par six sociétés de classification par pays et par langue, dont l'une, La société de classification, a été fondée en 1964. Les sociétés de classification ont diversement utilisé les termes analyse de données, exploration de données et science des données dans leurs publications.

1996 Usama Fayyad, Gregory Piatetsky-Shapiro et Padhraic Smyth publient « From Data Mining to Knowledge Discovery in Databases ». Ils écrivent : « Historiquement, la notion de trouver des modèles utiles dans les données a reçu une variété de noms, y compris l'exploration de données, l'extraction de connaissances, la découverte d'informations, la récolte d'informations, l'archéologie des données et le traitement des modèles de données… À notre avis, KDD [Connaissance Discovery in Databases] fait référence au processus global de découverte de connaissances utiles à partir de données, et l'exploration de données fait référence à une étape particulière de ce processus. Exploration de données est l'application d'algorithmes spécifiques pour extraire des modèles de données… les étapes supplémentaires du processus KDD, telles que la préparation des données, la sélection des données, le nettoyage des données, l'incorporation des connaissances préalables appropriées et l'interprétation correcte des résultats de l'extraction, sont essentielles pour garantir que des connaissances utiles découlent des données. L'application aveugle de méthodes d'exploration de données (critiquées à juste titre comme le dragage de données dans la littérature statistique) peut être une activité dangereuse, conduisant facilement à la découverte de modèles dénués de sens et invalides.

1997 Dans sa conférence inaugurale de la chaire H. C. Carver en statistique de l'Université du Michigan, le professeur C. F. Jeff Wu (actuellement au Georgia Institute of Technology), demande que les statistiques soient renommées science des données et que les statisticiens soient renommés scientifiques des données.

1997 La revue Data Mining and Knowledge Discovery est lancée l'inversion de l'ordre des deux termes dans son titre reflétant l'essor du « data mining » comme moyen le plus populaire de désigner « extraire des informations de grandes bases de données ».

décembre 1999 Jacob Zahavi est cité dans « Mining Data for Nuggets of Knowledge » dans [email protected] : « Les méthodes statistiques conventionnelles fonctionnent bien avec de petits ensembles de données. Les bases de données d'aujourd'hui, cependant, peuvent impliquer des millions de lignes et des dizaines de colonnes de données… L'évolutivité est un énorme problème dans l'exploration de données. Un autre défi technique consiste à développer des modèles qui peuvent mieux analyser les données, détecter les relations non linéaires et les interactions entre les éléments… Des outils spéciaux d'exploration de données peuvent devoir être développés pour prendre en charge les décisions du site Web. "

2001 William S. Cleveland publie "Data Science: An Action Plan for Expand the Technical Areas of the Field of Statistics." Il s'agit d'un plan « pour élargir les principaux domaines de travail technique du domaine des statistiques. Parce que le plan est ambitieux et implique des changements substantiels, le domaine modifié sera appelé « science des données ». » Cleveland place la nouvelle discipline proposée dans le contexte de l'informatique et des travaux contemporains sur l'exploration de données : « … l'avantage pour l'analyste de données a été limitée, car les connaissances des informaticiens sur la façon de penser et d'aborder l'analyse des données sont limitées, tout comme la connaissance des environnements informatiques par les statisticiens est limitée. Une fusion des bases de connaissances produirait une puissante force d'innovation. suggère que les statisticiens devraient se tourner vers l'informatique pour la connaissance aujourd'hui, tout comme la science des données se tournait vers les mathématiques dans le passé. … les départements de science des données devraient contenir des membres du corps professoral qui consacrent leur carrière aux progrès de l'informatique avec des données et qui forment des partenariats avec des informaticiens. »

2001 Leo Breiman publie « Modélisation statistique : les deux cultures » (PDF) : « Il existe deux cultures dans l'utilisation de la modélisation statistique pour tirer des conclusions à partir de données. On suppose que les données sont générées par un modèle de données stochastique donné. L'autre utilise des modèles algorithmiques et traite le mécanisme des données comme inconnu. La communauté statistique s'est engagée à utiliser presque exclusivement des modèles de données. Cet engagement a conduit à une théorie non pertinente, à des conclusions discutables et a empêché les statisticiens de travailler sur un large éventail de problèmes actuels intéressants. La modélisation algorithmique, à la fois en théorie et en pratique, s'est développée rapidement dans des domaines autres que les statistiques. Il peut être utilisé à la fois sur de grands ensembles de données complexes et comme une alternative plus précise et informative à la modélisation de données sur des ensembles de données plus petits. Si notre objectif en tant que domaine est d'utiliser des données pour résoudre des problèmes, alors nous devons nous éloigner de la dépendance exclusive aux modèles de données et adopter un ensemble d'outils plus diversifié.

avril 2002 Lancement de Journal de science des données, publiant des articles sur « la gestion des données et des bases de données en science et technologie. Le champ d'application du Journal comprend les descriptions des systèmes de données, leur publication sur Internet, les applications et les questions juridiques. La revue est publiée par le Comité des données pour la science et la technologie (CODATA) du Conseil international pour la science (ICSU).

janvier 2003 Lancement de Journal de la science des données: « Par « Data Science », nous entendons presque tout ce qui a quelque chose à voir avec les données : Collecter, analyser, modéliser. pourtant la partie la plus importante est ses applications--toutes sortes d'applications. Cette revue est consacrée aux applications des méthodes statistiques au sens large…. Les Journal de la science des données fournira une plate-forme à tous les travailleurs des données pour présenter leurs points de vue et échanger des idées. »

mai 2005 Thomas H. Davenport, Don Cohen et Al Jacobson publient « Competing on Analytics », un rapport du Babson College Working Knowledge Research Center, décrivant « l'émergence d'une nouvelle forme de concurrence basée sur l'utilisation intensive de l'analyse, des données et des faits. prise de décision fondée. Au lieu de rivaliser sur des facteurs traditionnels, les entreprises commencent à utiliser l'analyse statistique et quantitative et la modélisation prédictive comme principaux éléments de la concurrence. » La recherche est ensuite publiée par Davenport dans le revue de Harvard business (janvier 2006) et est développé (avec Jeanne G. Harris) dans le livre Concurrence sur l'analyse: La nouvelle science de la victoire (mars 2007).

Septembre 2005 Le National Science Board publie « Long-lived Digital Data Collections: Enabling Research and Education in the 21st Century ». L'une des recommandations du rapport se lit comme suit : « La NSF, travaillant en partenariat avec les gestionnaires de collections et la communauté dans son ensemble, devrait agir pour développer et faire évoluer le cheminement de carrière des scientifiques des données et s'assurer que l'entreprise de recherche comprend un nombre suffisant de personnes de haut niveau. -des scientifiques de données de qualité. Le rapport définit les data scientists comme « les informaticiens et informaticiens, les ingénieurs et programmeurs de bases de données et de logiciels, les experts disciplinaires, les conservateurs et les annotateurs experts, les bibliothécaires, les archivistes et autres, qui sont essentiels à la gestion réussie d’une collecte de données numériques ».

2007 Le Centre de recherche pour la dataologie et la science des données est établi à l'Université de Fudan, à Shanghai, en Chine. En 2009, deux des chercheurs du centre, Yangyong Zhu et Yun Xiong, publient "Introduction to Dataology and Data Science", dans lequel ils déclarent "Différent des sciences naturelles et des sciences sociales, Dataology and Data Science prend les données dans le cyberespace comme objet de recherche . C'est une nouvelle science. Le centre organise des colloques annuels sur la dataologie et la science des données.

juillet 2008 Le JISC publie le rapport final d'une étude qu'il a commandée pour « examiner et faire des recommandations sur le rôle et le développement de carrière des scientifiques des données et l'offre associée de compétences spécialisées en curation de données à la communauté des chercheurs. " Le rapport final de l'étude, " The Skills, Role & Career Structure of Data Scientists & Curators: Assessment of Current Practice & Future Needs ", définit les data scientists comme " les personnes qui travaillent là où la recherche est effectuée - ou, dans le cas du personnel du centre de données, en étroite collaboration avec les créateurs des données - et peut être impliqué dans des recherches et des analyses créatives, permettant à d'autres de travailler avec des données numériques et des développements dans la technologie des bases de données.

janvier 2009 Exploiter la puissance des données numériques pour la science et la société est publié. Ce rapport du Groupe de travail interagences sur les données numériques au Comité sur la science du Conseil national pour la science et la technologie indique que « La nation doit identifier et promouvoir l'émergence de nouvelles disciplines et de spécialistes experts pour relever les défis complexes et dynamiques de la préservation numérique. , accès soutenu, réutilisation et réaffectation des données. De nombreuses disciplines voient l'émergence d'un nouveau type d'expert en science et gestion des données, accompli dans les domaines de l'informatique, de l'information et des sciences des données et dans un autre domaine scientifique. Ces personnes sont essentielles au succès actuel et futur de l'entreprise scientifique. Cependant, ces personnes reçoivent souvent peu de reconnaissance pour leurs contributions et ont des cheminements de carrière limités. »

janvier 2009 Hal Varian, économiste en chef de Google, a déclaré au McKinsey Trimestriel: « Je n'arrête pas de dire que le métier sexy dans les dix prochaines années sera celui de statisticien. Les gens pensent que je plaisante, mais qui aurait deviné que les ingénieurs informaticiens auraient été le travail sexy des années 90 ? La capacité de prendre des données, de pouvoir les comprendre, de les traiter, d'en extraire de la valeur, de les visualiser, de les communiquer, ce sera une compétence extrêmement importante dans les prochaines décennies… Parce que maintenant nous avons vraiment des données essentiellement gratuites et omniprésentes. Donc, le facteur de rareté complémentaire est la capacité de comprendre ces données et d'en tirer de la valeur… Je pense que ces compétences – pouvoir accéder, comprendre et communiquer les informations que vous obtenez de l'analyse des données – vont être extrêmement importantes. Les gestionnaires doivent être en mesure d'accéder et de comprendre les données eux-mêmes.

Mars 2009 Kirk D. Borne et d'autres astrophysiciens soumettent à l'enquête décennale Astro2010 un article intitulé « La révolution dans l'enseignement de l'astronomie : la science des données pour les masses » (PDF) : « Il est nécessaire de former la prochaine génération à l'art de dériver une compréhension intelligente des données. pour le succès des sciences, des communautés, des projets, des agences, des entreprises et des économies. Ceci est vrai aussi bien pour les spécialistes (scientifiques) que pour les non-spécialistes (tous les autres : public, éducateurs et étudiants, main-d'œuvre). Les spécialistes doivent apprendre et appliquer de nouvelles techniques de recherche en science des données afin de faire progresser notre compréhension de l'Univers. Les non-spécialistes ont besoin de compétences en maîtrise de l'information en tant que membres productifs de la main-d'œuvre du 21e siècle, intégrant les compétences fondamentales pour l'apprentissage tout au long de la vie dans un monde de plus en plus dominé par les données.

Mai 2009 Mike Driscoll écrit dans « Les trois compétences sexy des data Geeks » : « ... [Driscoll fera un suivi avec The Seven Secrets of Successful Data Scientists en août 2010]

juin 2009 Nathan Yau écrit dans « Rise of the Data Scientist » : « Comme nous l'avons tous lu maintenant, l'économiste en chef de Google, Hal Varian, a déclaré en janvier que le prochain emploi sexy au cours des 10 prochaines années serait celui de statisticien. Evidemment, je suis entièrement d'accord. Bon sang, j'irais un peu plus loin et je dirais qu'elles sont sexy maintenant, mentalement et physiquement.Cependant, si vous lisiez le reste de l'interview de Varian, vous sauriez que par statisticiens, il l'entendait en fait comme un titre général pour quelqu'un qui est capable d'extraire des informations à partir de grands ensembles de données et de présenter ensuite quelque chose d'utile à des non-initiés. experts en données… [Ben] Fry… plaide pour un domaine entièrement nouveau qui combine les compétences et les talents de domaines d'expertise souvent disjoints… [informatique, mathématiques, statistiques et data mining infovis design graphique et interaction homme-machine]. Et après deux ans de mise en évidence de la visualisation sur FlowingData, il semble que les collaborations entre les domaines soient de plus en plus courantes, mais plus important encore, la conception de l'information informatique se rapproche de la réalité. nous voyons scientifiques des données— des gens qui peuvent tout faire — émergent du reste de la meute.

juin 2009 Troy Sadkowsky crée le groupe de scientifiques des données sur LinkedIn en tant que compagnon de son site Web, datasceintists.com (devenu plus tard datascientists.net).

Février 2010 Kenneth Cukier écrit dans L'économiste Dossier spécial « Data, Data Everywhere » : « ... un nouveau type de professionnel a émergé, le data scientist, qui combine les compétences de programmeur de logiciels, de statisticien et de conteur/artiste pour extraire les pépites d'or cachées sous des montagnes de données. »

juin 2010 Mike Loukides écrit dans « What is Data Science? Ils sont intrinsèquement interdisciplinaires. Ils peuvent s'attaquer à tous les aspects d'un problème, de la collecte et du conditionnement des données initiales à la conclusion. Ils peuvent sortir des sentiers battus pour trouver de nouvelles façons de voir le problème ou pour travailler avec des problèmes définis de manière très large : « voici beaucoup de données, que pouvez-vous en tirer ? »"

septembre 2010 Hilary Mason et Chris Wiggins écrivent dans « A Taxonomy of Data Science » : « … nous avons pensé qu'il serait utile de proposer une taxonomie possible… interpréter…. La science des données est clairement un mélange de l'art des hackers… des statistiques et de l'apprentissage automatique… et de l'expertise en mathématiques et du domaine des données pour que l'analyse soit interprétable… Cela nécessite des décisions créatives et une ouverture d'esprit dans un contexte scientifique.

septembre 2010 Drew Conway écrit dans « The Data Science Venn Diagram » : « ... on a besoin d'apprendre beaucoup car ils aspirent à devenir un data scientist pleinement compétent. Malheureusement, le simple fait d'énumérer des textes et des tutoriels ne dénoue pas les nœuds. Par conséquent, dans le but de simplifier la discussion et d'ajouter mes propres réflexions à ce qui est déjà un marché d'idées encombré, je présente le diagramme de Venn de la science des données… des compétences en piratage, des connaissances en mathématiques et en statistiques et une expertise substantielle.

mai 2011 Pete Warden écrit dans « Pourquoi le terme « science des données » est imparfait mais utile » : « Il n'y a pas de limite largement acceptée pour ce qui est à l'intérieur et à l'extérieur de la portée de la science des données. Est-ce juste un rebranding à la mode des statistiques? Je ne pense pas, mais je n'ai pas non plus de définition complète. Je crois que l'abondance récente de données a déclenché quelque chose de nouveau dans le monde, et quand je regarde autour de moi, je vois des personnes avec des caractéristiques communes qui ne rentrent pas dans les catégories traditionnelles. Ces personnes ont tendance à travailler au-delà des spécialités étroites qui dominent le monde des entreprises et des institutions, s'occupant de tout, de la recherche des données, leur traitement à grande échelle, leur visualisation et leur rédaction sous forme d'histoire. Ils semblent également commencer par regarder ce que les données peuvent leur dire, puis choisir des fils de discussion intéressants à suivre, plutôt que l'approche traditionnelle du scientifique consistant à choisir d'abord le problème, puis à trouver des données pour le mettre en lumière.

mai 2011 David Smith écrit dans "'Data Science': What's in a name?": "Les termes 'Data Science' et 'Data Scientist' ne sont d'usage courant que depuis un peu plus d'un an, mais ils ont vraiment à l'époque : de nombreuses entreprises embauchent maintenant des « scientifiques des données » et des conférences entières sont organisées sous le nom de « science des données ». Mais malgré l'adoption généralisée, certaines ont résisté au changement des termes plus traditionnels comme « statisticien » ou « quantité » ' ou 'data analyst'… Je pense que 'Data Science' décrit mieux ce que nous faisons réellement : une combinaison de piratage informatique, d'analyse de données et de résolution de problèmes.

juin 2011 Matthew J. Graham parle à l'atelier Astrostatistics and Data Mining in Large Astronomical Databases sur « L'art de la science des données » (PDF). Il déclare : « Pour s'épanouir dans le nouvel environnement à forte intensité de données de la science du 21e siècle, nous devons développer de nouvelles compétences… Nous devons comprendre à quelles règles [les données] obéissent, comment elles sont symbolisées et communiquées et quelle est leur relation avec l'espace physique et le temps est."

Septembre 2011 Harlan Harris écrit dans « Data Science, Moore’s Law, and Moneyball » : « La « Data Science » est définie comme ce que font les « Data Scientists ». Ce que font les scientifiques des données a été très bien couvert et couvre toute la gamme de la collecte et de l'analyse des données, en passant par l'application des statistiques et de l'apprentissage automatique et des techniques connexes, à l'interprétation, la communication et la visualisation des résultats. Qui sont les Data Scientists est peut-être la question la plus fondamentale… J'ai tendance à aimer l'idée que la Data Science est définie par ses praticiens, qu'il s'agit d'un cheminement de carrière plutôt que d'une catégorie d'activités. Dans mes conversations avec les gens, il semble que les personnes qui se considèrent comme des scientifiques des données ont généralement des cheminements de carrière éclectiques, ce qui peut, à certains égards, sembler peu logique. »

Septembre 2011 D.J. Patil écrit dans « Building Data Science Teams » : « À partir de 2008, Jeff Hammerbacher (@hackingdata) et moi nous sommes assis pour partager nos expériences en matière de création de groupes de données et d'analyse sur Facebook et LinkedIn. À bien des égards, cette réunion a marqué le début de la science des données en tant que spécialisation professionnelle distincte. nous avons réalisé qu'au fur et à mesure que nos organisations grandissaient, nous devions tous les deux trouver comment appeler les membres de nos équipes. « Analyste d'affaires » semblait trop restrictif. « Analyste de données » était un candidat, mais nous avons estimé que ce titre pourrait limiter ce que les gens pouvaient faire. Après tout, bon nombre des membres de nos équipes possédaient une expertise approfondie en ingénierie. « Scientifique de recherche » était un titre de poste raisonnable utilisé par des entreprises comme Sun, HP, Xerox, Yahoo et IBM. Cependant, nous avons estimé que la plupart des chercheurs travaillaient sur des projets futuristes et abstraits, et que le travail était effectué dans des laboratoires isolés des équipes de développement de produits. Il faudra peut-être des années pour que la recherche en laboratoire affecte les produits clés, si jamais cela s'est produit. Au lieu de cela, l'objectif de nos équipes était de travailler sur des applications de données qui auraient un impact immédiat et massif sur l'entreprise. Le terme qui semblait le mieux convenir était data scientist : ceux qui utilisent à la fois les données et la science pour créer quelque chose de nouveau. "

Septembre 2012 Tom Davenport et D.J. Patil publie "Data Scientist: The Sexiest Job of the 21st Century" dans le revue de Harvard business.

Une version antérieure de cette chronologie a été publiée dans WhatsTheBigData.com

Suivez-moi sur Twitter @GilPress ou Facebook ou Google+


Chiffres clés

Les chiffres-clés les plus importants vous offrent un aperçu concis du thème "Russie" et vous amènent directement aux statistiques correspondantes.

Économie

Produit intérieur brut (PIB) en Russie 2026

Produit intérieur brut (PIB) par habitant en Russie 2026

Taux d'inflation en Russie 2026

Taux de chômage en Russie 2020

Importation de marchandises en Russie 2019

Exportation de marchandises de Russie 2019

Balance commerciale des marchandises en Russie 2019

Principaux partenaires à l'export pour la Russie 2019

Principaux partenaires d'importation pour la Russie 2019

Made-In Country Index : perception des produits fabriqués en Russie, par pays 2017

Perception des produits fabriqués dans des pays sélectionnés en Russie 2017

Finances nationales

Dette nationale par rapport au produit intérieur brut (PIB) en Russie 2026

Solde budgétaire en Russie par rapport au produit intérieur brut (PIB) 2026

Dépenses publiques par rapport au produit intérieur brut (PIB) en Russie 2026


Adoption du dossier de santé électronique dans les hôpitaux américains : l'émergence d'une fracture numérique « usage avancé »

Objectif: Alors que la plupart des hôpitaux ont adopté les dossiers de santé électroniques (DSE), nous savons peu de choses sur la question de savoir si les hôpitaux utilisent les DSE de manière avancée qui sont essentielles pour améliorer les résultats, et si les hôpitaux disposant de moins de ressources - petits, ruraux, filet de sécurité - suivent le rythme.

Matériaux et méthodes: À l'aide des données de l'enquête sur les technologies de l'information de l'American Hospital Association 2008-2015, nous avons mesuré l'adoption du DSE « de base » et « globale » parmi les hôpitaux afin de fournir les derniers chiffres nationaux. Nous avons ensuite utilisé de nouvelles questions supplémentaires pour évaluer l'utilisation avancée des DSE et des données de DSE pour la mesure des performances et les fonctions d'engagement des patients. Pour évaluer une fracture numérique « utilisation avancée », nous avons exécuté des modèles de régression logistique pour identifier les caractéristiques des hôpitaux associées à une forte adoption dans chaque domaine d'utilisation avancée.

Résultats: Nous avons constaté que 80,5 % des hôpitaux ont adopté au moins un système de DSE de base, une augmentation de 5,3 points de pourcentage par rapport à 2014. Seuls 37,5 % des hôpitaux ont adopté au moins 8 (sur 10) données de DSE pour les fonctions de mesure de la performance, et 41,7 % des hôpitaux ont adopté à au moins 8 (sur 10) fonctions d'engagement des patients. Les hôpitaux à accès critique étaient moins susceptibles d'avoir adopté au moins 8 fonctions de mesure de la performance (rapport de cotes [OR] = 0,58 P < 0,001) et au moins 8 fonctions d'engagement des patients (OR = 0,68 P = 0,02).

Discussion: Alors que la loi sur les technologies de l'information sur la santé pour la santé économique et clinique a entraîné une adoption généralisée du DSE dans les hôpitaux, l'utilisation des fonctions avancées du DSE est à la traîne et une fracture numérique semble émerger, les hôpitaux à accès critique en particulier étant à la traîne. C'est préoccupant, car la mesure de la performance basée sur le DSE et l'engagement des patients sont des contributeurs clés à l'amélioration de la performance des hôpitaux.

Conclusion: L'adoption du DSE par les hôpitaux est généralisée et de nombreux hôpitaux utilisent les DSE pour soutenir la mesure des performances et l'engagement des patients. Cependant, cela ne se produit pas dans tous les hôpitaux.


Voir la vidéo: Desireless - Voyage, voyage 1987