mercredi 29 octobre 2008

pour dessiner une pyramide des âges dans Excel (1)

.

Commençons par la situation la plus simple : celle où toutes les classes d'âge ont la même amplitude. La situation où toutes les modalités ne sont pas de même amplitude sera examinée dans une deuxième note.


Excel ne propose pas d'outil pyramides des âges. Faute de mieux on utilisera l'outil graphique barre qui organise les données de la manière la plus proche de celle requise pour la pyramide. Voici le résultat brut de l'application de l'outil barre à la sélection du tableau. Les axes sont bien organisés comme doivent l'être ceux d'une pyramide des âges. Mais dans une pyramide la figure est partagée en deux zones : conventionnellement, la partir masculine de la population dans la partie gauche, la partie féminine de la population à droite de la figure, alors qu'ici les populations masculine et féminine sont superposées. Dans cette figure les deux séries des effectifs hommes et femmes sont repérées sur le même axe horizontal, alors que dans la pyramide des âges il y a deux axes, le masculin orienté croissant vers la gauche, le féminin orienté vers la droite.
La suite va montrer par quelles voies parvenir à la pyramide normalement consituée à partir de ce point de départ. Cela se fait en deux étapes : d'abord la réorganisation de la figure de telle sorte que les effectifs masculins apparaissent à gauche de la figure, valeurs croissantes dans la direction opposée à celle des femmes. Puis des modifications de format (des séries, de l'axe orienté à gauche), l'adjonction de titres (graphique, axes), la suppression de la légende.

On souhaite que les effectifs masculins apparaissent à gauche, selon un axe de valeurs croissantes vers la gauche. L'idée est de construire un tableau spécialement configuré de telle manière que son traitement par l'outil barre produise une pyramide. Cet outil barre visualise les valeurs négatives sur la partie gauche de l'axe, il suffit pour obtenir le résultat désiré de faire travailler l'outil barre sur une série de valeurs masculines négatives. Cette stratégie produit une figure correctement organisée, mais il reste à réaliser quelques aménagements.
Pour former une surface continue pour chaque sous population il faut modifier le paramétrage de deux OPTIONS de FORMAT des SÉRIES DE DONNÉES. L'option SUPERPOSITION doit prendre la valeur 100 % et l'option LARGEUR DE L'INTERVALLE doit prendre la valeur 0%

L'ajout de titres
pour le graphique et les axes est un problème trivial, comme la suppression de la légende.

Le travail s'achève par une petite fourberie. Il s'agit de déguiser l'axe des abscisses en apparence de deux axes de directions opposées. Il suffit d'afficher positives les valeurs négatives. Cela paraît étrange au premier abord, mais c'est très possible.

Excel offre une grande latitude de modification du format d'affichage des valeurs numériques sur lesquelles il opère.

Il est, en particulier, possible de définir un FORMAT d'affichage PERSONNALISÉ des NOMBRES sur l'AXE horizontal tel que sur l'image ci-contre, qui produit le résultat souhaité. Les valeurs à partir desquelles l'outil barre opère sont bien des valeurs négatives, elles sont seulement affichées positives. C'est comme si elles portaient un masque.
Le tour est joué.



lien utile :
vers la deuxième partie : quand les amplitudes diffèrent.

mardi 28 octobre 2008

mdem20e . corrigé 5 (2) . piège pour amateur


piège 2 : PRENDRE A LA LEGERE LA DESIGNATION DES MODALITES PEUT AVOIR DE FÂCHEUSES CONSEQUENCES.







La première partie du corrigé (*) a montré toute l'attention qu'il fallait donner à la signification des intitulés de colonnes. Ayant surmonté la première difficulté de lecture du tableau et constitué la distribution la plus détaillée possible à partir de l'information de ce tableau, il reste à déjouer le second piège qui serait de confondre étiquettes d'intervalles et valeurs limites.

La confusion entre étiquettes d'intervalles et valeurs limites aurait en effet des conséquences très fâcheuses : elle entacherait d'erreur les calculs d'amplitude et de centre de classe, et donc la valeur de la moyenne, et la détermination de la classe modale. Le dessin de l'histogramme ou de la pyramide seront faux, le portrait ne sera pas ressemblant. En voici une illustration.
Ci-contre deux pyramides construites à partir de la distribution en six modalités. Celle du haut est vraie, elle a été construite en interprétant correctement les énoncés de modalité. L'autre, en bas, est fausse, elle a été construite en calculant les amplitudes de classes directement à partir des valeurs d'âge en années révolues. La différence est nette, le volume total et le poids relatif des classes d'âges diffèrent sensiblement entre les deux pyramides. Un lien vers une superposition de la vraie et de la fausse pyramides est disposé en bas de cette note (**) pour ceux des lecteurs qui souhaiteraient mieux percevoir la différence.

La correspondance entre énoncés en années révolues et limites d'intervalle est montrée sur le schéma ci-contre. en haut les énoncés de modalités tels qu'ils apparaissent dans le tableau de données, en regard la suite des intervalles dessinés sur l'axe des âges.

Le tableau montre la manière de procéder correctement :
la détermination de l'amplitude des modalités doit se faire exclusivement à partir des valeurs des limites représentées sur l'axe des valeurs d'âge. Les deux dernières lignes sont destinées à la construction de la pyramide en effectifs.




liens utiles :
vers l'énoncé de Pratique 5 .
vers des extraits de réponses d'étudiants : Solutions 5
(*) vers la première partie du corrigé : Corrigé 5 (1)
(**) vers une superposition des pyramides vraie et fausse.

.[mise à jour : mercredi 29 octobre 2008]
.

lundi 27 octobre 2008

du nouveau dans le blog

Le catalogue des enregistrements de cours est mis à jour après chaque cours dans les meilleurs délais. Pour en faciliter l'accès j'ai installé dans la zone des accès directs ... une rubrique ... aux enregistrements (mp3)

dimanche 26 octobre 2008

mdem20e . corrigé 5 (1) . piège pour amateur


piège 1 : LE TABLEAU SEMBLE PRESENTER LA DISTRIBUTION DE LA POPULATION SELON LE SEXE ET L'AGE ... IL N'EN EST RIEN.



La suite des modalités en-têtes de colonnes n'est pas une liste exhaustive de modalités incompatibles. Les modalités moins de 15 ans et 75 ans et plus sont totalement incluses dans les modalités moins de 20 ans et 60 ans et plus, respectivement. La colonne total n'est pas une marge du tableau (le contenu d'une case total n'est pas la somme des contenus de cases de la ligne).
La schématisation fait apparaître les chevauchements de modalités, qui peuvent passer inaperçus à première vue du tableau.
La visualisation permet aussi de repérer la suite des intervalles d'âge qu'il est possible de constituer à partir des informations disponibles. On observe d'abord une première liste de trois modalités : (moins de 20 ans, 20 à 59 ans, 60 ans et plus) qui permet de construire une distribution correcte de la Population au 1er janvier selon l'âge en utilisant les trois grandes classes d'âge classiques). Mais on peut obtenir d'autres listes exhaustives de modalités incompatibles, plus longues. La suite des figures ci-dessous va montrer comment .
On remarque d'abord aisément qu'il est possible de calculer, par soustraction, les compléments des modalités moins de 15 ans et 75 ans et plus dans leur modalité englobante : moins de 20 ans et 60 ans et plus. On dispose alors de deux nouvelles modalités : 15-19 ans et 60-74 ans.
On peut ainsi constituer une liste exhaustive de 5 modalités incompatibles. Par rapport à la description en trois modalités (jeunesse, maturité, vieillesse) elle offre l'avantage d'individualiser les âges de transition .
> 15-19 ans : sortie de la classe d'âge des jeunes, entrée dans l'âge adulte. C'est la classe dâge du passage à la majorité légale.
> 60-74 ans : entrée dans la vieillesse. Classe d'âge des seniors de la transition de l'inactivité sans incapacité vers le grand âge.
Le passage de trois à cinq modalités n'est pas un résultat négligeable, mais n'est-il pas possible de construire une plus longue liste ? Le schéma montre que la série la plus longue de modalités incompatibles qu'on puisse espérer construire à partir des modalités disponibles dans le tableau est la suite des intervalles déterminés par les limites de modalités disponibles : 0-14 ; 15-19 ; 20-49 ; 50-59 ; 60-74 ; 75 et plus. Pour compléter cette liste il faut encore construire deux modalités : 20-49 et 50-59 ans.
La séquence de modalités disponibles individualise la classe 15-49 ans, qui correspond à l'intervalle d'âge de la fertilité femmes (période reproductive, de la puberté à la ménopause). Le schéma montre comment on peut obtenir la modalité 20-49 ans par soustraction.
Ceci fait on dispose de cinq des six modalités cherchées. La liste est incomplète. La dernière modalité 50-59 ans sera obtenue par référence au total, comme on le voit sur le schéma.
Avec cette liste exhaustive de six modalités incompatibles, on peut construire le tableau de la distribution de la population de la France métropolitaine au premier janvier 2000 selon le sexe et l'âge en 6 modalités .
Ci-contre le tableau de contingence résultant.


liens utiles :
vers l'énoncé de Pratique 5 .
vers des extraits de réponses d'étudiants : Solutions 5
vers la suite (et fin) de la correction : Corrigé 5 (2).

[mise à jour : mardi 28 octobre 2008]
.

mdem20e . corrigé 2 . base INED : "conjoncture démographique de l'Europe", trouver le chemin.

.

rappel du sujet :
> Voici un texte extrait du site de l'INED :
"Les données sur l'Europe et les pays développés sont (....) accessibles sur une base de données qui permet de constituer des tableaux spécifiques en choisissant les indicateurs, les pays et les années."
> Trouver cette base de données sur le site de l'INED.

A partir de la page d'Accueil cliquer successivement sur
Population en chiffres > Europe et pays développés et > Base de données.

vendredi 24 octobre 2008

de quoi s'agit-il ? (1)

à votre avis que représente ce dessin ? que signifient les nombres inscrits ? à quelle époque a-t-il été fait ? qui en est l'auteur ?

envoyez vos propositions de réponse, suppositions, hypothèses via les commentaires . Il s'agit de deviner, les savants, les érudits, sont tout naturellement exclus du jeu .

jeudi 23 octobre 2008

mdem21e . semaine 5. séance 3. je. 23 oct. 2008.

Présentation, lecture et commentaire de deux textes extraits de la correspondance échangée par Louis et Christian Huygens d'août à novembre 1669.
I. LE CALCUL DES AAGES DE LODEWIJK HUYGENS . 30 octobre 1669 . édition M. Nijhoff . n° 1771 . montage d'extraits - n° 1772 . in extenso .


II. CHRISTIAAN HUYGENS DESSINE AFIN DE NE S'EMBARRASSER D'AUCUN CALCUL . 21 novembre 1669 . édition M. Nijhoff . n°. 1778 . montage d'extraits & planche hors texte .

orthographe originale
Sur la ligne droite d'embas ſont marquez les aages des perſonnes et ſur les 6 il y a une perpendiculaire de 64 parties parce que de 100 perſonnes ſelon la table angloiſe il en reſte 64 à l'aage de 6 ans. Sur les 16 il y a une perpendiculaire de 40 parties parce qu'a l'aage de 16 ans il reſte 40 perſonnes des 100 qui eſtoient conçues, et ainſi du reſte. Et par tous les points ou bouts de ces perpendiculaires j'ai mené la ligne courbe 64, 40, 25 &c. Si je veux ſcavoir maintenant combien il reſte de perſonnes après les 20 années de 100 enfans conçus, Je prens sur la ligne d'embas l'aage de 20 ans au point A d'ou ayant erigè une perpendiculaire qui rencontre la courbe en B, je dis que AB, qui pris ſur l'échelle d'enbas fait preſque 33 parties eſt le nombre de perſonnes qui de 100 conçus atteignent l'aage de 20 ans. Que ſi je veux ſcavoir en ſuite combien il reſte raiſonnablement à vivre à une perſonne de 20 ans par exemple, je prens la moitié de BA et l'ajuste en DC entre la courbe et la droite en ſorte qu'elle ſoit perpendiculaire à la dernière. Et j'ay AC pour les annees qui reſtent à vivre à la dite perſonne, qui ſont pres de 16 ans, comme il paroit par les diviſions dont chacune eſt une année. La raiſon eſt que la perpendiculaire DC eſtant la moitié de BA que marquoit le nombre d'hommes qui reſtent des 100, 20 ans apres la conception, a ſcavoir 33, cette DC tombant ſur 36 de la droite marquera qu'il reſte la moitie de 33 c'eſt a dire 16 1/2 hommes apres la 36. annee. Donc puis que des 33 perſonnes de 20 ans la moitié meurt d'ordinaire dans les prochaines 16 ans, on peut gager avec égal avantage qu'une perſonne de 20 ans vivra encore 16 ans. On trouvera de meſme que la vie d'un enfant conceu doit eſtre taxée à 11 ans au lieu que mon frère contoit 18 et 2 mois.


orthographe modernisée
Sur la ligne droite d'en bas sont marqués les âges des personnes et sur les 6 il y a une perpendiculaire de 64 parties parce que de 100 personnes selon la table anglaise il en reste 64 à l'âge de 6 ans. Sur les 16 il y a une perpendiculaire de 40 parties parce qu'a l'âge de 16 ans il reste 40 personnes des 100 qui étaient conçues, et ainsi du reste. Et par tous les points ou bouts de ces perpendiculaires j'ai mené la ligne courbe 64, 40, 25 etc. Si je veux savoir maintenant combien il reste de personnes après les 20 années de 100 enfants conçus, je prends sur la ligne d'en bas l'auge de 20 ans au point A d'où ayant érigé une perpendiculaire qui rencontre la courbe en B, je dis que AB, qui pris sur l'échelle d'en bas fait presque 33 parties est le nombre de personnes qui de 100 conçus atteignent l'âge de 20 ans. Que si je veux savoir ensuite combien il reste raisonnablement à vivre à une personne de 20 ans par exemple, je prends la moitié de BA et l'ajuste en DC entre la courbe et la droite en sorte qu'elle soit perpendiculaire à la dernière. Et j'ai AC pour les années qui restent à vivre à la dite personne, qui font près de 16 ans, comme il parait par les divisions dont chacune est une année. La raison est que la perpendiculaire DC étant la moitié de BA que marquait le nombre d'hommes qui restent des 100, 20 ans après la conception, à savoir 33, cette DC tombant sur 36 de la droite marquera qu'il reste la moitié de 33 c'est à dire 16 1/2 hommes après la 36 année. Donc puis que des 33 personnes de 20 ans la moitié meurt d'ordinaire dans les prochaines 16 ans, on peut gager avec égal avantage qu'une personne de 20 ans vivra encore 16 ans. On trouvera de même que la vie d'un enfant conçu doit être taxée a 11 ans au lieu que mon frère comptait 18 et 2 mois.

la figure :



TRAVAIL A FAIRE :

> S'exercer à lire les lettres dans l'orthographe originale.
> Vérifier si la dernière proposition du texte du 21 novembre est exacte :
"On trouvera de même que la vie d'un enfant conçu doit être taxée a 11 ans au lieu que mon frère comptait 18 et 2 mois" .


liens utiles :
vers l'enregistrement du cours : première partie . deuxième partie (documents mp3, le temps de chargement peut être long, soyez patients).
voir les textes cités dans Gallica2 : le n° 1771 . / le n° 1772 . / fin du n° 1775 et n° 1776 . / la figure Hors Texte . / le n° 1778 .
vers la biographie de Christian Huygens . site Huygens . université d'Utrecht . en anglais .
vers la page de présentation de l'article de Jean-Marc ROHRBASSER : "Qui a peur de l'arithmétique ?" . > pour télécharger l'article cliquer ici .
vers l'article de Jean-Marc ROHRBASSER et Jacques VÉRON : "Lodewijk et Christiaan Huygens : la distinction entre vie moyenne et vie probable". Math. & Sci. hum., (38e année, n° 149, 2000, p. 7-21)

mercredi 22 octobre 2008

mdem20e . pratique 10 . pyramides décalées

(si vous avez déjà fait l'exercice 9, sauter les étapes 1 à 3 . )
1. importer
le classeur excel contenant les données nécessaires à la réalisation de la visualisation ci-contre. (source La situation démographique en 2005 . site INSEE).

2. créer un nouveau classeur pyramides_fm_1975_2000 qui comportera au départ les deux feuilles des données 1975 et 2000 copiées à partir du classeur source. ( Indiquer sur chaque feuille de données les références de la source (nom du fichier, identificaiton du site, URL de la page à partir de laquelle on peut télécharger le classeur).

remarques d'organisation du travail :
* dans ce classeur
pyramides .. — comme dans tous vos classeurs XL de travail sur données importées – vous conserverez intactes les feuilles de données sources importées, tous les réaménagements et traitements de ces données, tant visuels que numériques, doivent être faits sur d'autres feuilles, chacune consacrée à une étape du travail.
** tous les traitements et réaménagements de données doivent être faits par appel (direct ou indirect) des contenus des cellules des feuilles de données importées. Ne re-saisissez jamais au clavier des données ou résultats déjà obtenus. N'entrez jamais à la main de références de cellules. C'est Excel qui doit réaliser tous les calculs, à partir des données importées ou de fonctions qui opèrent sur ces données.
*** Travaillez de préférence en utilisant le style de références L1C1.

> Dans la suite je ne donnerai plus de consignes détaillées de gestion de votre travail dans Excel. Vous suivrez les consignes générales, en les appliquant au mieux à chaque cas particulier.


3. dans les données dont vous disposez les âges au 1 janvier sont donnés en années révolues . à quelles générations correspondent ces classes d'âge : au 1/1/1975 ? au 1/1/2000 ? Quelles sont les générations qui sont présentes dans les deux observations ? Faites un tableau unique comportant les informations disponibles sur ce groupe de générations.

4. On veut superposer les deux pyramides en les décalant de 25 ans (cf. l'image ci-dessus) . Vous paraît-il pertinent de faire figurer les valeurs d'âge en ordonnées ? Pourquoi ? Faire figurer les années de naissance vous paraîtrait-il un meilleur choix ? pourquoi ?

5. réalisez la superposition des deux pyramides des âges ainsi décalées en identifiant les ordonnées e la manière qui vous semble la plus pertinente.

6. calculez pour chaque sexe et pour chaque génération la variation de son effectif entre le 1/1/1975 et le 1/1/2000.

7. pour chaque sexe séparément visualisez les variations des effectifs de chaque génération entre le 1/1/1975 et le 1/1/2000.

8. Calculez pour chaque sexe et pour chaque génération le rapport de son effectif le 1/1/2000 à ce qu'était son effectif au 1/1/1975.

9. Pour chaque sexe séparément, visualisez les rapports calculés en 8.

10. synthétisez les constats que les questions 5 à 9 vous permettent de faire ? interprétez.


liens utiles :
vers l'énonce de l'exercice : pratique 9
vers la note : interprétation d'une visualisation . les pyramides décalées .
.

mdem20e . pratique 9 . superposition de pyramides


1. importer le classeur excel contenant les données nécessaires à la réalisation de la visualisation ci-contre. (source La situation démographique en 2005 . site INSEE).

2. créer un nouveau classeur pyramides_fm_1975_2000 qui comportera au départ les deux feuilles des données 1975 et 2000 copiées à partir du classeur source. ( Indiquer sur chaque feuille de données les références de la source (nom du fichier, identificaiton du site, URL de la page à partir de laquelle on peut télécharger le classeur).

remarques d'organisation du travail :
* dans ce classeur
pyramides .. — comme dans tous vos classeurs XL de travail sur données importées – vous conserverez intactes les feuilles de données sources importées, tous les réaménagements et traitements de ces données, tant visuels que numériques, doivent être faits sur d'autres feuilles, chacune consacrée à une étape du travail.
** tous les traitements et réaménagements de données doivent être faits par appel (direct ou indirect) des contenus des cellules des feuilles de données importées. Ne re-saisissez jamais au clavier des données ou résultats déjà obtenus. N'entrez jamais à la main de références de cellules. C'est Excel qui doit réaliser tous les calculs, à partir des données importées ou de fonctions qui opèrent sur ces données.
*** Travaillez de préférence en utilisant le style de référnces L1C1.

> Dans la suite je ne donnerai plus de consignes détaillées de gestion de votre travail dans Excel. Vous suivrez les consignes générales, en les appliquant au mieux à chaque cas particulier.


3. dans les données dont vous disposez les âges au 1 janvier sont donnés en années révolues . à quelles générations correspondent ces classes d'âge : au 1/1/1975 ? au 1/1/2000 ? Quelles sont les générations qui sont présentes dans les deux observations ? Faites un tableau unique comportant les informations disponibles sur ce groupe de générations.

4. On veut superposer les deux pyramides, pour mettre en lumière la variation entre 1975 et 2000 des effectifs de chaque classe d'âge. Vous pouvez voir un exemple d'une telle superposition dans le document superposer pour comparer . Vous paraît-il pertinent de faire figurer les valeurs d'âge en ordonnées ? Pourquoi ? pourquoi pas les années de naissance ?

5. réalisez la superposition des deux pyramides des âges (en effectifs) : au 1/1/1975 et au 1/1200, telle qu'elle apparait dans le document superposer pour comparer. (voir le document technique "coup de pouce : superposition dans Xl" - à propos d'un problème d'importation dans Word de superpositions réalisées dans XL).

6. Que constatez-vous ? (n'interprétez pas !).

7. Calculez pour chaque sexe et pour chaque classe d'âge la variation de l'effectif de la classe d'âge entre le 1/1/1975 et le 1/1/2000. Quelle est la variation de l'effectif total de la population ? La variation de l'effectif de la population masculine ? de la population féminine ?

8. Pour chaque sexe séparément visualisez les variations des effectifs de chaque classe d'âge.

9. Que constatez-vous ? (n'interprétez pas !).


liens utiles :
vers le document : superposer pour comparer (pdf)
vers le document : coup de pouce technique : superposition dans Xl (pdf)

mdem20e . semaine 5. séance 8. me. 22 oct. 2008.


.
I. DU NOUVEAU DANS LE BLOG

a) le point sur la publication des enregistrements de cours :
Pourquoi pas l'ent ? avantages et inconvénients de la publication des enregistrements "en l'état". bons usages. dangers. à propos des licences creative commons . Principe : Toujours citer .
b) convention de dénomination des documents de travail.
> texte des exercices : Pratique n ou Travail n.
> propositions de solutions ou de réponse faites par des étudiants : > Solutions n
> ma correction : > Corrigé n
II. BREF RETOUR SUR LA NOTION DE TABLEAU DISJONCTIF
à propos de l'exercice proposé au dernier cours : transfert en disjonctif du fichier des résultats d'observation de E selon C illustrant la présentation schématique de la logique de description statistique. présentation de la note tableau disjonctif (à propos de) qui traite de la définition de ce qu'est un TD, la notion de codage logique, de diagonalisation, et détaille un exemple de construction d'un tel tableau.
III. CARACTERISATION DES DONNEES DEMOGRAPHIQUES — compléments
a. la typologie schématique des données démographique.
b. Exemples d'application directe des notions déjà présentées en cours.
Corrigé 8 : identification de la nature des données démographiques annoncées par l'intitulé d'un tableau. Le vocabulaire à utiliser est celui présenté dans les deux notes sur : la schématisation de la description statistique, et la typologie des données démographiques.
IV. D'UN ETAT DE POPULATION A L'AUTRE : MISE EN EVIDENCE DU MOUVEMENT
Le problème a été posé la semaine dernière de trouver la signification des écarts qui apparaissent quand on superpose deux pyramides avec un décalage qui correspond au laps de temps qui les sépare. On présente aujourd'hui la réponse à cette question (commentaire de la note : interprétation d'une visualisation : les pyramides décalées.)
V. TRAVAIL INDIVIDUEL EN SEANCE : (terminer à la maison).
> pratique 9
> pratique 10


liens utiles :
vers la note catalogue des enregistrements des cours
vers la note mdem230e . tableau disjonctif (à propos de ..)
vers la note sur la typologie des données démographiques.
vers la note sur la description statistique
vers la note mdem20e . corrigé 8 . identification de données
vers la note interprétation d'une visualisation : les pyramides décalées.
vers pratique 9
vers pratique 10


.

mardi 21 octobre 2008

interprétation d'une visualisation : les pyramides décalées.



Le mode de construction de la visualisation présentée ci-contre est tout simple : on a superposé à la pyramide des âges de la population de la France au 1/1/2000 la pyramide de la population de la France au 1/1/1975 décalée de 25 ans.

Idée simple, mais inhabituelle. Il est en effet banal de superposer des pyramides pour mettre en évidence les modifications intervenues dans la composition par sexe et âge de la population entre deux dates. Il est moins ordinaire de procéder comme pour la figure ci-contre. Quelle est l'idée sous-jacente ? quelle est l'intérêt d'une telle figure ? comment interpréter le résultat de cette superposition décalée ?

On découvre l'intention sous-jacente à cette construction : en remarquant que le décalage de 25 ans correspond exactement à la durée écoulée entre les deux observations (du 1/1/1975 au 1/1/2000), et en associant aux modalités d'âge en années révolues au premier janvier d'une année les modalités d'année de naissance (génération).

On comprend que le décalage de la pyramide du 1/1/ 1975 – de 25 ans vers le haut – permet de mettre en regard pour chaque génération présente au 1/1/1975 l'état de son effectif au 1/1/1975 et l'état de son effectif vingt cinq ans après, le 1/1/2000.

L'interprétation des écarts qui apparaissent entre les deux profils de pyramide devient alors très simple : ils représentent la différence entre ces deux effectifs, la variation de l'effectif de chaque génération entre les deux dates.

Les écarts sont donc la visualisation, pour chaque sexe, du solde des mouvements intervenus au cours de la période de 25 ans : 1975-1999, au sein de chaque génération née avant 1975.

Les processus qui interviennent ici sont la mortalité et les migrations. Chaque écart est pour la génération concernée la visualisation directe du solde net des mouvements qui la concernent au cours de la période 1975-1999 :
écart entre les deux profils = décès 1975-1999 + immigrations 1975-1999 + émigrations 1975-1999.
Remarquez que la natalité n'intervient pas du tout dans l'interprétation des écarts.
Il n'y a en effet superposition des pyramides que pour les générations nées avant 1975. Pour les générations 1975 et postérieures nous ne voyons (partie grisée) que leur état au 1/1/2000, nous ne possédons aucune indication de mouvement les concernant.

.

mdem20e . corrigé 8 . identification de données


Rappel de l'énoncé :

Voici des titres de tableaux statistiques relevés dans divers recueils d’information statistique relatifs à une population. Indiquez pour chacun des tableaux :
> à quelle classe de données démographiques appartiennent les informations qu’il contient,
> et sur quels critères s’appuie votre jugement.
> Pour les distributions identifiez l’ensemble et le caractère.



intitulé du tableau type de données démographiques critères d'identification du type de données s'agit-il d'une distribution? ensemble décrit dimension du caractère énoncé du caractère
Tableau A : Naissances en 1970 selon l’âge de la mère à la naissance et la légitimité Observation mouvement
événements,
flux,
période
OUI Naissances survenues au sein de la population au cours de l'année 1970 2 âge de la mère x légitimité
Tableau B : Mariages en 1970, selon l’état matrimonial antérieur des époux. Observation mouvement
événements,
flux,
période
OUI Mariages survenus au sein de la population au cours de l'année 1970 2 état matrimonial antérieur de l'époux x état matrimonial antérieur de l'épouse
Tableau C : Décés en 1970 selon le sexe et l’âge au moment du décès Observation mouvement
événements,
flux,
période
OUI Décès survenus au sein de la population au cours de l'année 1970 2 sexe x âge au moment du décès

Tableau D : Population féminine au premier janvier 1970 selon la génération et le niveau d’études
Observation état
individus,
stock,
instant
OUI Individus appartenant à la population le 1/1/1970/0 h. 2 année de naissance x niveau d'études
Tableau E : Taux brut de mortalité (décès pour 1000 habitants). Période 1950-1999 Indicateurs


NON



Tableau F : Mortalité masculine en 1970 : Taux de mortalité par âge (décès pour 100.000 à chaque âge)
Indicateurs


NON



Tableau G : Population recensée le 15 mars 1970. Répartition selon le sexe, l’année de naissance et l’état matrimonial.
Observation état
individus,
stock,
instant
OUI Individus appartenant à la population le 15/3/1970/0 h. 3 sexe x année de naissance x état matrimonial


.

mdem20e . Tableau disjonctif (à propos de ...)

.

Le tableau disjonctif est une manière de présenter les résultats d'une description statistique d'un ensemble - données élémentaires (individuelles). Il diffère de la forme traditionnelle du "tableau Individus x Caractères" (Tableau IxC) . Voici les caractéristiques d'un tableau disjonctif présentant les résultats de la description d'un ensemble E selon un caractère C :
> une ligne par élément, autant de lignes que d'éléments dans l'ensemble décrit : n
> une colonne par modalité du caractère, autant de colonnes que de modalités du caractère : k
> contenu de case , selon les règles du codage logique :
0 quand la modalité/colonne ne décrit pas l'élément (individu) /ligne,
1 quand la modalité/colonne qui décrit l'élément/ligne.
> le tableau comporte n . k cases .
> La marge horizontale (somme des contenus des cases de chaque colonne) contient la suite des valeurs ni de la distribution de E selon C.
> La marge verticale est pleine de 1.
> Le contenu de la case total (somme des contenus de cases, somme de chaque marge) est n.

Exemple : la situation utilisée pour la présentation schématique, en cours. Fig. 3 – ci-contre. Le tableau comportera :
> une ligne par élément, autant de lignes que d'éléments dans l'ensemble décrit : 19
> une colonne par modalité du caractère, autant de colonnes que de modalités du caractère : 5
> contenu de case selon les règles du codage logique.
> le tableau comporte 19 x 5 = 95 cases .
> La marge horizontale (somme des contenus des cases de chaque colonne) contient la suite des valeurs ni de la distribution de E selon C : n1 = 3 ; n2 = 8 ; n3 = 4 ; n4 = 4 ; n5 = 0 ;
> Le contenu de la case total (somme des contenus de cases, somme de chaque marge) est 19.
m1m2m3m4m5
01000
10000
00010
01000
01000
10000
01000
01000
01000
00010
00100
00100
01000
01000
00100
00010
00010
10000
00100
38440


Te tableau de distribution est composé de la suite des intitulés de colonnes associée à la marge horizontale :

m1m2m3m4m5
38440




Après tri des observations selon les modalités du caractère (Fig. 4, ci-contre) apparaît dans le tableau disjonctif une configuration diagonale caractéristique.


Remarquez que la présentation des observations élémentaires sous forme de tableau disjonctif diagonalisé constitue une visualisation de la distribution.

m1m2m3m4m5
10000
10000
10000
01000
01000
01000
01000
01000
01000
01000
01000
00100
00100
00100
00100
00010
00010
00010
00010
38440


.

jeudi 16 octobre 2008

mdem20e . travail 2 . premier énoncé

Thème : Nombres d'hommes, nombres de femmes.

Beaucoup d'entre vous ont remarqué — dans le Travail 1 : comparaison des structures par sexe et âge de la population de la France en 1975 et 2000la disparité des effectifs d'hommes et de femmes. Vous avez pu remarquer qu'il y a une disparité globale (les parties masculines et féminines de la population n'ont pas le même effectif) et que cette disparité n'est pas la même à tous les âges.

Le Travail 2 va porter sur cette question, et plus précisément sur les diverses manières de mettre en lumière cet état de choses : à chaque moment (en 1975 et en 2000) , et les changements intervenus en vingt-cinq ans.

Il ne s'agit pas encore d'interpréter l'état des choses que vous allez mettre en lumière, de dire à quoi tiennent les particularités de la situation observée, quels en sont les facteurs explicatifs. Cela viendra plus tard, quand les quelques notions et moyens de visualisation indispensables auront été présentées et assimilées.

Pour l'instant il s'agit seulement de trouver des moyens de décrire (numériquement et visuellement) la disparité entre hommes et femmes dans la pyramide des âges (en 2000 et vingt cinq ans auparavant).

Dans un premier temps je ne vous donne pas d'indications ou de consignes plus précises. Voyons si vous pouvez trouver ou inventer des manières de faire. Je mettrai en ligne la semaine prochaine des indications plus précises, pour vous guider.

D'ici là, à vous de jouer, adressez moi le résultat de vos travaux avant la prochaine séance de Travaux dirigés.


lien utile :
vers la page d'accès au classeur Excel d'où vous extrairez les données nécessaires (INSEE, la situation démographique en 2005 - publication 2007).

mdem20e . semaine 4. séance 7. je. 16 oct. 2008.

(mise à jour vendredi 17 oct. 2008 : les points du programme qui n'ont pas été traités en cours sont en gris clair)

I. BREF RETOUR SUR LA NOTION DE TABLEAU DISJONCTIF

à propos de l'exercice proposé au dernier cours : transfert en disjonctif du fichier des résultats d'observation de E selon C illustrant la présentation schématique de la logique de description statistique.
II. PRECISIONS SUR LA NOTION D'EVENEMENT DEMOGRAPHIQUE :
1. fait et événement . principe : toujours associer événement & individu dont l'état est modifié par l'événement.
2. entrée sortie
3. changement d'état individuel
4. qui arrive à tout le monde ou pas
5. qui n'arrive qu'une fois dans la vie ou peut se renouveller
6. perte irrémédiable ou pas.
III. CARACTERISATION DES DONNEES DEMOGRAPHIQUES — compléments
a. la typologie schématique des données démographique.
b. Exemples d'application directe des notions déjà présentées en cours : identification de la nature des données démographiques annoncées par l'intitulé d'un tableau.
Le vocabulaire à utiliser est celui présenté dans les deux notes sur : la schématisation de la description statistique, et la typologie des données démographiques.

IV : LES TYPES DE GROUPES D'INDIVIDUS ETUDIES EN ANALYSE DEMOGRAPHIQUE .
a) individus appartenant à la population à un moment donné
b) cohortes : promotions et générations
c) deux perspectives d'étude d'une population.
V . LA NOTION D'ANCIENNETE
a) définition de la notion
b) importance de la notion pour l'analyse des processus
c) cas particulier de l'âge
VI. LES DIFFERENTES MESURES DE L'ÂGE.
a) âge exact
b) âge en années révolues
c) âge atteint = âge en différence de millésimes.
d) comparaison des différentes mesures.
TRAVAIL A FAIRE LA MAISON :
> routine du travail sur les notes de cours.
> lire crayon en main les extraits du chapitre 1. du Preston : notion de population, bilan démographique, notion de taux.
> complément au travail 1 : a) comment interprétez vous l'écart entre les deux représentations de la figure que vous verrez en cliquant ici ? b) sur cette même figure, que représente la partie qui n'est "que grise" ?
> Travail 2 . (voir la note mdem20e . Travail 2 . premier énoncé . )


liens utiles :

vers la note sur la typologie des données démographiques.
vers la note sur la description statistique
vers la note donnant l'énoncé du travail 2 .
[mise à jour du mardi 21 octobre :]
vers la traduction des extraits du chapitre 1 du manuel de Preston (pdf) : version normale & version avec notes de traduction)
vers la note : tableau disjonctif (à propos de ...)
vers la note : corrigé 8 . identification des données .

mercredi 15 octobre 2008

mdem20e . travail 1 . quelques travaux d'étudiants .

Pour faire le point sur le travail 1 , voici quelques documents réalisés par des étudiants
[mise à jour du jeudi 16 oct. 2008 >] et, pour finir : une visualisation réalisée par démographiste.
A commenter & évaluer.


Documents pdf :
> document étudiant A
> document étudiant B
Documents Excel (.xls)
> classeur étudiant A
> classeur étudiant B
> classeur étudiant C
.

mdem20e . solutions 5 . piège pour amateur .

voici quelques propositions de réponses : évaluez, critiquez.
A.

B.





mdem20e . solutions 7 . limites et intervalles

voici quelques propositions de réponses , évaluez, critiquez.
A . B. C . D . E.




mdem20e . comparaisons de pyramides . une proposition .

mdem20e . histogrammes . qu'est-ce qui ne va pas ?

 
Creative Commons License Cette création est mise à disposition sous un contrat Creative Commons



.