- Wiki Home
- OpenRefine
- Petites recettes
Petites recettes
- Echantillonner ses données
- Calculer des longueurs de chaînes
- Compter les mots d'une chaîne
- Inverser l'ordre des mots d'une chaîne
- Supprimer les espaces superflus d'une chaîne
- Trier alphabétiquement les mots d'une chaîne
- Supprimer les espaces en début et fin de chaîne
- Transformer des caractères spéciaux HTML (ex: é
- Modifier la casse d'une chaîne
- Savoir si une cellule contient la valeur d'une autre cellule
- Rechercher si une chaîne contient 3 fois de suite le même caractère
- GREL
- Aligner ses données sur le thésaurus Agrovoc
Echantillonner ses données
A partir d'une colonne contenant des valeurs numériques, créer des facettes personnalisées avec la formule value % 10. Cela a pour effet de créer 10 paquets de lignes à peu près égaux. Si on veut 100 paquets, on fait value % 100
Calculer des longueurs de chaînes
value.length() ou length(value)
Pour ne voir que les lignes pour lesquelles la longueur de la cellule en question est supérieure à 40 caractères, on crée un facette personnalisée avec value.length() > 40
Compter les mots d'une chaîne
value.split(/\b/).length()
On construit le tableau des mots en séparant sur les caractères séparateurs de mots (espace, virgule, point, début et fin de chaîne, cf. ensemble prédéfini Java) puis on calcule la longueur du tableau.
Inverser l'ordre des mots d'une chaîne
value.split(' ').reverse()
Supprimer les espaces superflus d'une chaîne
value.trim()
Edit cells > Common transform > Collapse consecutive whitespaces
Trier alphabétiquement les mots d'une chaîne
value.split(' ').sort()
Supprimer les espaces en début et fin de chaîne
Edit cells > Common transform > Trim leading and trailing whitespaces
Transformer des caractères spéciaux HTML (ex: é)
Edit cells > Common transform > Unescape HTML entities
Modifier la casse d'une chaîne
Edit cells > Common transform > To titlecase : la première lettre de chaque mot en majuscule, les autres en minuscule
Edit cells > Common transform > To lowercase : toutes les lettres en minuscule
Edit cells > Common transform > To uppercase : toutes les lettres en majuscule
Savoir si une cellule contient la valeur d'une autre cellule
Ajouter une colonne avec comme expression value.contains(cells["autre_cellule"].value)
Rechercher si une chaîne contient 3 fois de suite le même caractère
Appliquer l'expression régulière /(.)\1\1/
Les parenthèses créent un groupe et \1 cherche si ce groupe est répété
GREL
- il n'y a pas de différence entre simple quote ' et double quote ".
Aligner ses données sur le thésaurus Agrovoc
Voir le tutoriel