- Impression
- SombreClair
- PDF
Extraction de données sur base d'un masque dynamique
Objet de l'article
Quand il s'agit d'extraire les données d'une chaîne de caractère (p.ex. le nom d'un fichier), le masque dynamique est particulièrement utile. Cependant, une telle extraction nécessite d'appliquer des contraintes pour permettre une extraction robuste et pertinente.
L'expression régulière
La simple utilisation d'un masque dynamique ne garantit pas l'exactitude de l'extraction des informations. Ainsi par exemple dans le code STATION-FT-EL-001 il est nécessaire d'indiquer à l'application que ce code
- Doit commencer par la chaîne STATION-
- Qu'elle est ensuite suivie de 2 caractères alphanumériques, suivis d'un tiret
- Ensuite de nouveau 2 caractères alphanumériques, suivis d'un tiret
- Et enfin une combinaison de 3 chiffres
L'expression régulière prend dès lors tout son sens. Celle-ci permet d'appliquer des contraintes sur le code.
Ainsi la syntaxe d'extraction de ce code sera notée comme suit : STATION-(?<demo_en_type>[a-zA-Z]{2,2})-(?<demo_en_package>[a-zA-Z]{2,2})-(?<demo_en_number>[0-9]{3,3})
Extraire les données vers Cooperlink ou effectuer un contrôle
L'intérêt de l'expression régulière est de permettre d'utiliser une chaîne de caractère (p.ex. le nom de fichier) pour encoder automatiquement les métadonnées dans Cooperlink (on parle alors d'extraction) ou pour effectuer un contrôle (p.ex. vérifier s'il s'agit d'un nouveau document ou d'un document existant portant le même code).
Pour relier un groupe de l'expression régulière à une métadonnée Cooperlink, il suffit d'utiliser la notation suivante: (?<metadata_label>[constraint])
- Les parenthèses identifient le groupe
- Cooperlink associe la donnée lue avec la métadonnée ayant le nom entre les signes < >
- La contrainte permet de définir le procédé de lecture et de validation de la donnée.
Toutes les méthodes de l'expression regulière sont disponibles sans restriction.
Lorsqu'il s'agit d'une métadonnée de type Liste de valeur, Cooperlink effectue un contrôle supplémentaire, à savoir il vérifie si la valeur lue est une valeur disponible dans la liste.
Exemple d'expression régulière utilisée pour l'extraction du nom de fichier (encodage des métadonnées et détection automatique des révisions):
Exemple lors du dépôt de documents
Dans cet exemple, lors du dépôt de document, Cooperlink analyse le nom de fichier pour extraire les valeurs essentielles, détecter s'il s'agit d'un nouveau document ou d'une révision, et il détecte également l'indice de révision lorsque celui-ci est précisé dans le nom du document.
L'utilisateur est directement informé lorsque le système d'extraction a opéré avec succès où si une non-conformité a été détectée (colonne code-barre).