Applications dans ce flux de travail

Comment ça marche

Construis ton extracteur automatique de pdf en texte en une minute ! Solution parfaite pour ceux qui traitent de grandes quantités de CV entrants ou d'autres documents ! Extrait les données des documents à l'aide d'un flux de travail à distance sur Latenode.com !


Dans cet article, tu verras comment créer un flux de travail automatisé sans code qui extraira les données des fichiers PDF de ton Google Drive à l'aide de l'API et du Chat GPT, et qui remplira le formulaire de Google Sheet avec les données.

De plus, tu peux obtenir le modèle de ce scénario que tu peux copier et utiliser pour toi-même gratuitement ! 

Tu peux améliorer ce modèle ou l'utiliser non seulement pour l'extraction de texte en pdf.

Aperçu du scénario

Examinons d'abord l'ensemble du scénario du scraper pdf, puis décomposons chaque étape.

Illustration de l'aperçu du scénario sur Latenode

Comment fonctionne ce scénario d'extraction de pdf ? Une fois par heure, il prend tous les CV au format pdf sur le Google Drive, les convertit en fichiers txt à l'aide de HTTP-request, puis l'assistant chatGPT extrait les données nécessaires et remplit la feuille de calcul Google.

Principales étapes du scénario :

  1. Déclencheur de calendrier. Active le scénario à une période de temps définie.
  2. Google Drive. Ici, nous avons deux nœuds : Trouver un fichier et Télécharger un fichier.
  3. Javascript. Nous utiliserons des nœuds Javascript avec AI copilot pour le formatage des fichiers tout au long du scénario. Tout d'abord, j'ai demandé à AI de me donner du code qui convertit les fichiers de Google Drive au format base64.
  4. Demande HTTP. Utilise l'API pour extraire le texte d'un fichier PDF en utilisant les documents de l'API des services essayés.
  5. ChatGPT. L'assistant ChatGPT extrait les données du texte.
  6. Google Sheets. Remplis la feuille avec ces informations,

Répartition des scénarios

Et voici une instruction étape par étape pour ceux qui veulent apprendre le processus. N'oublie pas les modèles gratuits et prêts à l'emploi à la fin de l'article.

Préparatifs

Pour ce scénario, tu devras avoir la possibilité d'utiliser les assistants Open AI et n'importe quel convertisseur d'API.

Assistant OpenAI

C'est très simple. Connecte-toi à ton compte OpenAI, puis rends-toi sur assistantset clique sur le bouton "créer" dans le coin supérieur droit. Tu verras apparaître le panneau de configuration de l'assistant.

Illustration des bons réglages de l'assistant d'IA

Ici, tu dois :

  1. Donne un nom à ton assistant
  2. Donne-lui des instructions sur la façon dont tu veux qu'il réponde, et un peu de contexte. Nous te recommandons de lui demander d'utiliser des fichiers joints, car sinon, il peut oublier de le faire.
  3. Choisis un modèle
  4. Sélectionne les outils disponibles et ajoute les fichiers que l'assistant peut utiliser. N'oublie pas d'activer la récupération pour que l'ajout de fichiers soit possible.

Copie l'identifiant de l'assistant (tu le vois sous la colonne Nom), puis va dans la rubrique Clés APIpour en créer une et la sauvegarder.

Convertisseur de PDF en TXT

Utilise celui que tu veux. J'ai choisi ConvertAPI parce qu'il offre un essai gratuit et qu'il fournit beaucoup d'informations.

Illustration de l'application ConvertAPI pour créer un convertisseur automatique de pdf en texte

Créer un scénario

Nous passons maintenant à Latenode.com. Ici, nous devons créer le scénario de conversion pdf en texte : (Tu n'as pas besoin de le créer à partir de zéro, il suffit de copier le modèle à la fin de l'article).

Déclencheur d'horaire

Illustration du déclenchement de l'horaire

Clique sur "Ajouter un nœud" dans l'onglet scénario, choisis "Calendrier" dans la liste. Clique sur le nœud pour le configurer. Spécifie l'intervalle et le fuseau horaire, enregistre les modifications. J'ai également ajouté un déclencheur sur Exécuter une fois, juste pour plus de commodité.

Nœuds de Google Drive

Illustration des nœuds de Google Drive

Clique sur "Add node", recherche le dossier Google drive dans l'onglet actions, et choisis le nœud "Find file".
Pour que cela fonctionne, tu dois te connecter au compte gmail pour obtenir un jeton d'accès, choisir le lecteur et le nom de la recherche. Dans ce cas, je veux extraire les données des fichiers dont le nom contient CV.

Ajoute ensuite "Télécharger un fichier" à partir du même dossier d'action de Google drive.

Illustration comment télécharger le fichier dont tu as besoin pour créer un convertisseur AI pdf-texte.

Utilise l'id des résultats du nœud précédent, puis clique sur exécuter le nœud une fois pour enregistrer les modifications et faire circuler les données dans le scénario. Tu obtiendras le fichier en sortie.

Javascript #1 : Convertir en base64

Illustration du code JS dont tu as besoin pour extraire le texte

C'est le code que l'IA m'a donné. Tu peux le reprendre ici(#1). Remplace const fileContentPath par ton objet du nœud précédent.

Demande HTTP

Trouve la requête HTTP dans la liste des actions. Pour comprendre comment la créer, consulte la documentation de ConvertAPI. Tu y trouveras des informations sur la configuration de la requête.

Voici à quoi ressemble ma demande de conversion de pdf en txt.

Illustration de la bonne configuration des requêtes HTTP

J'utilise un objet du nœud Find file Google Drive pour spécifier le nom du fichier téléchargé, et le contenu du fichier en base64 à partir du nœud Javascript. Et j'ajoute la paire Content-Type=application/json dans les en-têtes.

Illustration de la bonne configuration des requêtes HTTP

Exécute node une fois pour obtenir le fichier à partir de la requête HTTP.

Javascript #2

Illustration du code JS dont tu as besoin pour extraire le texte

Un autre nœud de code, #2 ici.

Cette fois, j'ai demandé à AI d'extraire du texte du fichier txt.

Nœuds ChatGPT

Nous aurons à faire face à 3 nœuds GPT ici :

  • Créer un fil
  • Créer un message
  • Créer une course

 Chaque nœud effectue une action avec OpenAI.

Tout d'abord, nous créons un fil de discussion ou une conversation avec l'assistant GPT.

Illustration de la création de nœuds ChatGPT et de l'utilisation de la clé AP

Insère ta clé API Open AI, c'est tout ! Exécute node une fois et obtiens l'id du thread créé en sortie.

Créer un message :

illustration comment créer le bon massage pour l'assistance à l'IA Assistent.

Ici, tu as de nouveau besoin d'une clé API. Dans le champ de l'ID du fil, mets le résultat du nœud précédent. Tu le verras dans la fenêtre d'aide après avoir cliqué sur le champ de saisie.

Dans "Contenu du message", donne quelques instructions supplémentaires si tu le souhaites et mets le contenu du fichier du dernier nœud Javascript. L'extracteur de pdf automatisé est un peu plus proche !

Créer une course

Illustration Comment créer ton parcours pour observer le résultat.

Ce nœud reçoit la réponse du scraper pdf.

Spécifie le nœud comme ton assistant OpenAI et utilise l'ID de l'assistant GPT.

Javascript #3

Illustration du code JS dont tu as besoin pour extraire le texte

Ici, nous utilisons le nœud JS pour la dernière fois, afin de créer 3 objets json distincts à partir de la réponse de l'assistant.

Voici l'exemple, il suffit de mettre tes données dans le contenu const.

Google Sheets

Mettons ces données quelque part, Google Sheets est une bonne option pour ce scénario d'extraction de données pdf sur latenode.com.

Illustration des paramètres de Google Sheets dont tu as besoin

Connecte-toi une nouvelle fois à ton compte gmail pour obtenir un jeton d'accès, choisis le lecteur et la feuille, et mets des jsons dans les champs, enregistre le scénario et clique sur run once pour exécuter ou déployer le scénario afin d'activer le déclencheur d'horaire.

Résultats

Les résultats des travaux que nous avons effectués

Après une exécution réussie du scénario, ce flux de travail extraira le texte du fichier pdf sur ton Google Drive et le mettra dans ta feuille de calcul Google.

Voilà comment créer un extracteur de pdf sans code sur latenode.

Comme je te l'avais promis, voici le modèle de ce flux de travail. Il te suffit de le copier et de suivre cet article-guide pour le mettre en place.

Il y a une vidéo à ce sujet, pas la peine de lire !

Si tu veux que quelqu'un t'aide, consulte notre canal Discord, nous y avons quelques développeurs prêts à t'aider !

Catégories

AI
Informatique et développement
Publicité et marketing

FAQ

Puis-je utiliser Latenode si je ne connais pas la programmation ?

Oui, Latenode est conçu pour les utilisateurs de tous niveaux. Il offre des fonctionnalités avancées pour ceux qui maîtrisent JavaScript et des outils visuels intuitifs ainsi qu'une assistance IA pour les débutants. Que tu sois un développeur expérimenté ou un novice, Latenode offre une expérience conviviale adaptée à ton niveau de compétence.‍‍

Latenode peut-il s'intégrer à des services et API tiers ?

Oui, Latenode prend en charge l'intégration avec un large éventail de services et d'API tiers. Tu peux connecter Latenode à diverses plateformes en ligne, bases de données et systèmes logiciels pour automatiser les transferts de données, déclencher des actions et rationaliser les flux de travail. Latenode fournit également des outils et des ressources pour faciliter le processus d'intégration.

Existe-t-il une version gratuite de Latenode ?

Oui, Latenode propose une version gratuite qui te permet d'explorer ses capacités. Cette version comprend un sous-ensemble des fonctions de Latenode, ce qui te permet de commencer avec l'automatisation et d'en découvrir les avantages. Tu peux ensuite décider de passer à une version payante pour bénéficier de fonctionnalités et de ressources supplémentaires.

Qu'est-ce que Latenode?

Latenode est un outil d'automatisation visible et intuitif conçu pour permettre aux clients de rationaliser leurs flux de travail grâce à l'automatisation. Il permet aux clients de créer des stratégies informatisées en connectant diverses offres Internet et des gadgets, ce qui leur permet d'automatiser les obligations et de décorer la productivité avec succès.

Comment Latenode aide-t-il à maximiser les opportunités ?

En intégrant tous tes outils de marketing en un seul endroit grâce à l'intégration des données, Latenode t'aide à avoir une vue d'ensemble de tes opérations. Cela te permet d'identifier plus facilement les opportunités potentielles et de prendre des décisions éclairées basées sur des données précises.