Dans le contexte actuel de science ouverte, le développement des plateformes de diffusion de données (telle que Quetelet Progedo-Diffusion) permet l’accès gratuit de la communauté scientifique à un nombre croissant de bases de données et de grandes enquêtes quantitatives. Ce type de données est également fréquent dans les associations, les collectivités, les entreprises ou encore les organismes de sondage qui ont très souvent recours au questionnaire afin de collecter des informations sur différentes thématiques.
L’obectif de cette formation est triple.
1. Présenter les potentialités pour la recherche en SHS des bases de
données et des données des grandes enquêtes diffusées par PROGEDO en
prenant l’exemple de l’enquête européenne “Étude des relation
familiales et intergénérationelles (Érfi)” réalisée par l’INED et par
l’INSEE en 2005. Cette démonstration vise à promouvoir
l’utilisation des données issues du nouveau cycle d’enquête Erfi 2 lancée en 2023 dont la
disponibilité prochaine via l’application Quetelet Progedo-Diffusion offre de
nombreuses perspectives d’analyse sur les comportements familiaux pour
la communauté scientifique en SHS.
2. Sensibiliser les participants à l’exploitation de données d’enquêtes
réelles et à ses particularités à travers la réplication des premiers
résultats obtenus à partir des données de l’enquête Erfi 1 publiés dans
un article écrit par Arnaud Régnier-Loilier en 2006 dans la revue
Population et Sociétés: “À
quelle fréquence voit-on ses parents ?”. A travers cet exemple
d’exploitation, il s’agira notamment d’aborder les pondérations et leur
usage, le traitement des non réponses et des valeurs manquantes, le
recodage et la transformation de variables, le calcul de statistiques
descriptives de base, la réalisation de tableaux croisés et de
représentations graphiques simples, …
3. Initier les participants à l’utilisation du langage R et de son
interface R-Studio pour le traitement statistique de données d’enquêtes.
L’idée général est de présenter les bases de ce langage très puissant et
relativement simple afin d’en dédramatiser l’usage et de fournir des
éléments pour progresser de façon autonome dans son apprentissage.
This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.