Programmer en R/Importer un fichier TSV

Un livre de Wikilivres.
Sauter à la navigation Sauter à la recherche

Wikipedia-logo-v2.svg

Wikipédia propose un article sur : « Tabulation-separated values ».

Comme les fichiers CSV, les fichiers TSV sont des fichiers textes dans lesquelles les valeurs sont séparées par des tabulations.

La fonction read_tsv() dans la librairie readr permet de les importer de manière efficace.

Par exemple, la liste des départements publiées sur le site de l'Insee est disponible au format TSV[1]. Après avoir converti le fichier en encodage UTF-8 (voir le chapitre Résoudre les problèmes d'encodage des caractères), on peut importer le fichier dans R avec la commande suivante :

> table_departements <- read_tsv(file = "data/depts2016_utf8.txt") 
> table_departements %>% glimpse()
Observations: 101
Variables: 6
$ REGION   <chr> "84", "32", "84", "93", "93", "93", "84", "44", "76", "44", "76", "76", "93", ...
$ DEP      <chr> "01", "02", "03", "04", "05", "06", "07", "08", "09", "10", "11", "12", "13", ...
$ CHEFLIEU <chr> "01053", "02408", "03190", "04070", "05061", "06088", "07186", "08105", "09122...
$ TNCC     <int> 5, 5, 5, 4, 4, 4, 5, 4, 5, 5, 5, 5, 4, 2, 2, 3, 3, 2, 3, 3, 3, 3, 4, 3, 3, 2, ...
$ NCC      <chr> "AIN", "AISNE", "ALLIER", "ALPES-DE-HAUTE-PROVENCE", "HAUTES-ALPES", "ALPES-MA...
$ NCCENR   <chr> "Ain", "Aisne", "Allier", "Alpes-de-Haute-Provence", "Hautes-Alpes", "Alpes-Ma...table_

Notes et références[modifier | modifier le wikicode]

  1. http://www.insee.fr/fr/methodes/nomenclatures/cog/telechargement/2016/txt/depts2016.txt