jeudi 12 janvier 2023

vendredi 6 avril 2018

Utilisation des données de l’Enquête emploi

Ce billet traite de l’utilisation de données d’enquête. Il s’agit ici de l’Enquête emploi en continu réalisée à l’Insee. 

Nous allons utiliser un exemple concret pour entrer dans le sujet.

Première étape, récupérer les données. 

Pour cela, il faut se rendre sur le site internet de l’Insee, puis dans le moteur de recherche taper « Enquête Emploi en Continu » et on dans les bases de données les fichiers détails de l’année 2013. 

Il n’y a pas de plus récent en ligne dans les fichiers détails, c’est celui-ci que l’on choisit de télécharger au format dbase. 

La page est plutôt bien faite, on a trois onglets 
  • Téléchargement 
  • Documentation 
  • Dictionnaire des variables 
Une fois téléchargé le on trouve trois fichiers qui sont décrits dans l’onglet documentation. 

Celui qui contient les données s’appelle eec13.dbf.

On l’importe dans R via la fonction read.dbf du package foreign

On se retrouve ainsi avec une base contenant 394294 obs et 122 variables. 

On va maintenant charger les deux autres fichiers qui s’appellent respectivement varlist.dbf et varmod.dbf.

Le premier fichier varlist.dbf contient les liste des variables et le libellé associé. 

Ainsi la variable ACTIF correspond a Actif au sens du BIT. 

Le fichier contient 122 lignes et 2 variables.

Premier constat, une fois importé dans R on a des problèmes d’accent. 

Second constat, les variables correspondent sauf pour EXTRIAN qui s’appelle EXTRIAN14 dans le fichier des données, ne me demandez par pourquoi mais c’est ainsi. 

On décide de renommer la variable en EXTRIAN14 dans le fichier varlist. 

A quoi peut bien servir ce fichier ? A nous donner des labels sur les variables. 

Voilà ce que l’on va faire, intégrer cette information comme label pour les variables de la table. 




mercredi 8 février 2017

Apprendre en s'amusant

Nous allons commencer par un petit programme amusant qui testera si une phrase est un palindrome.

Un palindrome est une phrase qui peut se lire dans les deux sens comme la célèbre "Élu par cette crapule".

Plus exactement un palindrome respecte l'ordre des lettres sans tenir compte ni de la casse, ni des accents. Enfin espaces ne comptent pas.

Il s'agit d'écrire une fonction qui teste cela en R.

Elle renverra TRUE si la phrase est un palindrome et FALSE sinon.



- Posted using BlogPress from my iPhone


Mes débuts en programmation avec R

Qu'est-ce que programmer ?

Un programme est une liste d'instructions que l'ordinateur peut exécuter. Programmer c'est écrire ces instructions et les rassembler dans un programme.

On ne rentrera pas dans les subtilités entre interprétation et compilation.

On se contentera de rappeler qu'on appelle script un programme en R.





dimanche 5 décembre 2010

Bientôt du code Sas

Patience...

En attendant vous pouvez vous rendre sur mon autre blog SAS PERSO!