Extraction de données sur base d'un masque dynamique
  • 12 Nov 2022
  • 1 Minute à lire
  • Contributeurs
  • Sombre
    Clair
  • PDF

Extraction de données sur base d'un masque dynamique

  • Sombre
    Clair
  • PDF

Résumé de l’article

Objet de l'article

Quand il s'agit d'extraire les données d'une chaîne de caractère (p.ex. le nom d'un fichier), le masque dynamique est particulièrement utile. Cependant, une telle extraction nécessite d'appliquer des contraintes pour permettre une extraction robuste et pertinente.

L'expression régulière

La simple utilisation d'un masque dynamique ne garantit pas l'exactitude de l'extraction des informations. Ainsi par exemple dans le code STATION-FT-EL-001 il est nécessaire d'indiquer à l'application que ce code

  • Doit commencer par la chaîne STATION-
  • Qu'elle est ensuite suivie de 2 caractères alphanumériques, suivis d'un tiret
  • Ensuite de nouveau 2 caractères alphanumériques, suivis d'un tiret
  • Et enfin une combinaison de 3 chiffres

L'expression régulière prend dès lors tout son sens. Celle-ci permet d'appliquer des contraintes sur le code.

Ainsi la syntaxe d'extraction de ce code sera notée comme suit : STATION-(?<demo_en_type>[a-zA-Z]{2,2})-(?<demo_en_package>[a-zA-Z]{2,2})-(?<demo_en_number>[0-9]{3,3})

Apprendre les RegEx
Consultez l'article Expressions régulières - Bases et syntaxes fréquentes pour de plus amples informations.

L'intérêt de l'expression régulière est de permettre d'utiliser une chaîne de caractère (p.ex. le nom de fichier) pour encoder automatiquement les métadonnées dans Cooperlink (on parle alors d'extraction) ou pour effectuer un contrôle (p.ex. vérifier s'il s'agit d'un nouveau document ou d'un document existant portant le même code).

Pour relier un groupe de l'expression régulière à une métadonnée Cooperlink, il suffit d'utiliser la notation suivante: (?<metadata_label>[constraint])

  • Les parenthèses identifient le groupe
  • Cooperlink associe la donnée lue avec la métadonnée ayant le nom entre les signes < >
  • La contrainte permet de définir le procédé de lecture et de validation de la donnée.

Toutes les méthodes de l'expression regulière sont disponibles sans restriction.

Lorsqu'il s'agit d'une métadonnée de type Liste de valeur, Cooperlink effectue un contrôle supplémentaire, à savoir il vérifie si la valeur lue est une valeur disponible dans la liste.

Exemple d'expression régulière utilisée pour l'extraction du nom de fichier (encodage des métadonnées et détection automatique des révisions):

Exemple lors du dépôt de documents

Dans cet exemple, lors du dépôt de document, Cooperlink analyse le nom de fichier pour extraire les valeurs essentielles, détecter s'il s'agit d'un nouveau document ou d'une révision, et il détecte également l'indice de révision lorsque celui-ci est précisé dans le nom du document.

L'utilisateur est directement informé lorsque le système d'extraction a opéré avec succès où si une non-conformité a été détectée (colonne code-barre).


Cet article vous a-t-il été utile ?