Présentation et organisation de la formation

Introduction

Dans le contexte actuel de science ouverte, le développement des plateformes de diffusion de données (telle que Quetelet Progedo-Diffusion) permet l’accès gratuit de la communauté scientifique à un nombre croissant de bases de données et de grandes enquêtes quantitatives. Ce type de données est également fréquent dans les associations, les collectivités, les entreprises ou encore les organismes de sondage qui ont très souvent recours au questionnaire afin de collecter des informations sur différentes thématiques.

L’obectif de cette formation est triple.
1. Présenter les potentialités pour la recherche en SHS des bases de données et des données des grandes enquêtes diffusées par PROGEDO en prenant l’exemple de l’enquête européenne “Étude des relation familiales et intergénérationelles (Érfi)” réalisée par l’INED et par l’INSEE en 2005. Cette démonstration vise à promouvoir l’utilisation des données issues du nouveau cycle d’enquête Erfi 2 lancée en 2023 dont la disponibilité prochaine via l’application Quetelet Progedo-Diffusion offre de nombreuses perspectives d’analyse sur les comportements familiaux pour la communauté scientifique en SHS.
2. Sensibiliser les participants à l’exploitation de données d’enquêtes réelles et à ses particularités à travers la réplication des premiers résultats obtenus à partir des données de l’enquête Erfi 1 publiés dans un article écrit par Arnaud Régnier-Loilier en 2006 dans la revue Population et Sociétés: “À quelle fréquence voit-on ses parents ?”. A travers cet exemple d’exploitation, il s’agira notamment d’aborder les pondérations et leur usage, le traitement des non réponses et des valeurs manquantes, le recodage et la transformation de variables, le calcul de statistiques descriptives de base, la réalisation de tableaux croisés et de représentations graphiques simples, …
3. Initier les participants à l’utilisation du langage R et de son interface R-Studio pour le traitement statistique de données d’enquêtes. L’idée général est de présenter les bases de ce langage très puissant et relativement simple afin d’en dédramatiser l’usage et de fournir des éléments pour progresser de façon autonome dans son apprentissage.

Déroulé de la formation

Documents de la formation

L’enquête Etude des relations familiales intergénérationnelles

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.