Come trattare le interruzioni di riga in file CSV
Rimuovere fastidiosi ritorni a capo di un file CSV
A cura di
Dennis Angemi
| issue
#202
| guida/e
Andrea Borruso
Quando si lavora con file CSV
(magari convertiti da altri formati e.g. xlsx
) non è difficile imbattersi in “problemi” di questo tipo
Titolo,Autore
"Divina
Commedia","Dante
Alighieri"
"Il fu
Mattia Pascal","Luigi
Pirandello"
in cui i contenuti di quelle che in un foglio di calcolo sarebbero delle celle presentano dei fastidiosi ritorni a capo.
Per ottenere in output un file come:
Titolo,Autore
Divina Commedia,Dante Alighieri
Il fu Mattia Pascal,Luigi Pirandello
è possibile utilizzare la utility miller lanciando
mlr --csv -S put 'for (k in $*) {$[k] = gsub($[k], "\n", " ")}' then clean-whitespace file.csv
Questo comando è in grado di cercare il carattere speciale \n
newline
e di sostituirlo con " “. In seguito clean-whitespace
rimuoverà eventuali doppi spazi.
Riferimenti
- Miller : https://github.com/johnkerl/miller
Ultima modifica 22/02/2022: Update trattare_interruzioni_di_riga.md (2b760a9)