Nouvelle source - Fichier des naissances - juillet 2023
Vous souhaitez proposer une une nouvelle source et ses caractéristiques, afin que les administrateurs l'intègrent au package ?
Inclure a minima l'url sur insee.fr à partir de laquelle on peut télécharger le fichier correspondant.
Par exemple : https://www.insee.fr/fr/statistiques/2115011
Autres informations
Les informations suivantes étant également nécessaires, compléter la liste suivante faciletera la tâche des administrateurs du package (remplacer les valeurs exemples par les valeurs de la nouvelle source).
"date_ref": "2023-09-07",
"lien": "https://www.insee.fr/fr/statistiques/fichier/7665393/naissances_juil_2023.xlsx",
"zip": false,
"type": "xlsx",
"fichier_donnees": "naissances_juil_2023.xlsx",
"fichier_meta": ""
Signification des champs :
-
date_ref: la date (éventuelle) de référence des données -
lien: l'URL pour le téléchargement des données -
zip: les données sont-elles zippées ou non (trueoufalse) -
type: le format des données (csv, xls, xlsx), à l'intérieur de l'archive si"zip": true -
fichier_donnees: le nom du fichier de données, dans un éventuel zip -
fichier_meta: le nom du fichier descriptif des données, dans un éventuel zip
Je regarde cette demande, le fichier n'est pas à proprement parler un fichier détail mais une série chronologique. Il me semble qu'on trouve la même série dans la BDM : https://www.insee.fr/fr/statistiques/serie/001641601
De sorte que le code suivant permet de récupérer la donnée sans passer par doremifasol :
url_nais <- "https://bdm.insee.fr/series/sdmx/data/SERIES_BDM/001641601"
data_nais <- rsdmx::readSDMX(url_nais)
nais <- as.data.frame(data_nais) %>%
arrange(TIME_PERIOD)
Bonjour Pierre,
On peut effectivement récupérer des données de naissances de cette façon. Cependant, elles n'ont pas le même format, ce qui est un peu embêtant pour la fluidité de la séquence de formation que nous écrivons.
Quitte à télécharger les données via une url, on peut utiliser le fichier initialement souhaité de cette façon :
url_nais <- "https://www.insee.fr/fr/statistiques/fichier/7665393/naissances_juil_2023.xlsx"
data_nais <- openxlsx::read.xlsx(url_nais)
Est-ce que cela conviendrait pour la formation R Consolidation ?
Aussi, pour que l'on comprenne bien ; doremifasol n'a pas pour vocation de donner accès à n'importe quelles données sur le site de l'Insee mais seulement certains types de données ?