PRIX
PRODUIT
SOLUTIONS
par cas d'utilisation
en savoir plus
BlogModèlesVidéosYoutubeRESSOURCES
COMMUNAUTÉS ET MÉDIAS SOCIAUX
PARTENAIRES
En utilisant notre produit, les utilisateurs peuvent rationaliser leur flux de travail et extraire efficacement le texte des PDF en quelques minutes. Notre système automatisé élimine le besoin de saisie manuelle des données, ce qui réduit le risque d'erreurs et augmente la productivité globale. En quelques clics, les utilisateurs peuvent extraire du texte de plusieurs fichiers PDF simultanément, ce qui en fait un outil précieux pour les entreprises comme pour les particuliers.
Construis ton extracteur automatique de pdf en texte en une minute ! Solution parfaite pour ceux qui traitent de grandes quantités de CV entrants ou d'autres documents ! Extrait les données des documents à l'aide d'un flux de travail à distance sur Latenode.com !
Dans cet article, tu verras comment créer un flux de travail automatisé sans code qui extraira les données des fichiers PDF de ton Google Drive à l'aide de l'API et du Chat GPT, et qui remplira le formulaire de Google Sheet avec les données.
De plus, tu peux obtenir le modèle de ce scénario que tu peux copier et utiliser pour toi-même gratuitement !
Tu peux améliorer ce modèle ou l'utiliser non seulement pour l'extraction de texte en pdf.
Examinons d'abord l'ensemble du scénario du scraper pdf, puis décomposons chaque étape.
Comment fonctionne ce scénario d'extraction de pdf ? Une fois par heure, il prend tous les CV au format pdf sur le Google Drive, les convertit en fichiers txt à l'aide de HTTP-request, puis l'assistant chatGPT extrait les données nécessaires et remplit la feuille de calcul Google.
Et voici une instruction étape par étape pour ceux qui veulent apprendre le processus. N'oublie pas les modèles gratuits et prêts à l'emploi à la fin de l'article.
Pour ce scénario, tu devras avoir la possibilité d'utiliser les assistants Open AI et n'importe quel convertisseur d'API.
C'est très simple. Connecte-toi à ton compte OpenAI, puis rends-toi sur assistantset clique sur le bouton "créer" dans le coin supérieur droit. Tu verras apparaître le panneau de configuration de l'assistant.
Ici, tu dois :
Copie l'identifiant de l'assistant (tu le vois sous la colonne Nom), puis va dans la rubrique Clés APIpour en créer une et la sauvegarder.
Utilise celui que tu veux. J'ai choisi ConvertAPI parce qu'il offre un essai gratuit et qu'il fournit beaucoup d'informations.
Nous passons maintenant à Latenode.com. Ici, nous devons créer le scénario de conversion pdf en texte : (Tu n'as pas besoin de le créer à partir de zéro, il suffit de copier le modèle à la fin de l'article).
Clique sur "Ajouter un nœud" dans l'onglet scénario, choisis "Calendrier" dans la liste. Clique sur le nœud pour le configurer. Spécifie l'intervalle et le fuseau horaire, enregistre les modifications. J'ai également ajouté un déclencheur sur Exécuter une fois, juste pour plus de commodité.
Clique sur "Add node", recherche le dossier Google drive dans l'onglet actions, et choisis le nœud "Find file".
Pour que cela fonctionne, tu dois te connecter au compte gmail pour obtenir un jeton d'accès, choisir le lecteur et le nom de la recherche. Dans ce cas, je veux extraire les données des fichiers dont le nom contient CV.
Ajoute ensuite "Télécharger un fichier" à partir du même dossier d'action de Google drive.
Utilise l'id des résultats du nœud précédent, puis clique sur exécuter le nœud une fois pour enregistrer les modifications et faire circuler les données dans le scénario. Tu obtiendras le fichier en sortie.
C'est le code que l'IA m'a donné. Tu peux le reprendre ici(#1). Remplace const fileContentPath par ton objet du nœud précédent.
Trouve la requête HTTP dans la liste des actions. Pour comprendre comment la créer, consulte la documentation de ConvertAPI. Tu y trouveras des informations sur la configuration de la requête.
Voici à quoi ressemble ma demande de conversion de pdf en txt.
J'utilise un objet du nœud Find file Google Drive pour spécifier le nom du fichier téléchargé, et le contenu du fichier en base64 à partir du nœud Javascript. Et j'ajoute la paire Content-Type=application/json dans les en-têtes.
Exécute node une fois pour obtenir le fichier à partir de la requête HTTP.
Un autre nœud de code, #2 ici.
Cette fois, j'ai demandé à AI d'extraire du texte du fichier txt.
Nous aurons à faire face à 3 nœuds GPT ici :
Chaque nœud effectue une action avec OpenAI.
Tout d'abord, nous créons un fil de discussion ou une conversation avec l'assistant GPT.
Insère ta clé API Open AI, c'est tout ! Exécute node une fois et obtiens l'id du thread créé en sortie.
Ici, tu as de nouveau besoin d'une clé API. Dans le champ de l'ID du fil, mets le résultat du nœud précédent. Tu le verras dans la fenêtre d'aide après avoir cliqué sur le champ de saisie.
Dans "Contenu du message", donne quelques instructions supplémentaires si tu le souhaites et mets le contenu du fichier du dernier nœud Javascript. L'extracteur de pdf automatisé est un peu plus proche !
Ce nœud reçoit la réponse du scraper pdf.
Spécifie le nœud comme ton assistant OpenAI et utilise l'ID de l'assistant GPT.
Ici, nous utilisons le nœud JS pour la dernière fois, afin de créer 3 objets json distincts à partir de la réponse de l'assistant.
Voici l'exemple, il suffit de mettre tes données dans le contenu const.
Mettons ces données quelque part, Google Sheets est une bonne option pour ce scénario d'extraction de données pdf sur latenode.com.
Connecte-toi une nouvelle fois à ton compte gmail pour obtenir un jeton d'accès, choisis le lecteur et la feuille, et mets des jsons dans les champs, enregistre le scénario et clique sur run once pour exécuter ou déployer le scénario afin d'activer le déclencheur d'horaire.
Après une exécution réussie du scénario, ce flux de travail extraira le texte du fichier pdf sur ton Google Drive et le mettra dans ta feuille de calcul Google.
Voilà comment créer un extracteur de pdf sans code sur latenode.
Comme je te l'avais promis, voici le modèle de ce flux de travail. Il te suffit de le copier et de suivre cet article-guide pour le mettre en place.
Il y a une vidéo à ce sujet, pas la peine de lire !
Si tu veux que quelqu'un t'aide, consulte notre canal Discord, nous y avons quelques développeurs prêts à t'aider !
Oui, Latenode est conçu pour les utilisateurs de tous niveaux. Il offre des fonctionnalités avancées pour ceux qui maîtrisent JavaScript et des outils visuels intuitifs ainsi qu'une assistance IA pour les débutants. Que tu sois un développeur expérimenté ou un novice, Latenode offre une expérience conviviale adaptée à ton niveau de compétence.
Oui, Latenode prend en charge l'intégration avec un large éventail de services et d'API tiers. Tu peux connecter Latenode à diverses plateformes en ligne, bases de données et systèmes logiciels pour automatiser les transferts de données, déclencher des actions et rationaliser les flux de travail. Latenode fournit également des outils et des ressources pour faciliter le processus d'intégration.
Oui, Latenode propose une version gratuite qui te permet d'explorer ses capacités. Cette version comprend un sous-ensemble des fonctions de Latenode, ce qui te permet de commencer avec l'automatisation et d'en découvrir les avantages. Tu peux ensuite décider de passer à une version payante pour bénéficier de fonctionnalités et de ressources supplémentaires.
Latenode est un outil d'automatisation visible et intuitif conçu pour permettre aux clients de rationaliser leurs flux de travail grâce à l'automatisation. Il permet aux clients de créer des stratégies informatisées en connectant diverses offres Internet et des gadgets, ce qui leur permet d'automatiser les obligations et de décorer la productivité avec succès.
En intégrant tous tes outils de marketing en un seul endroit grâce à l'intégration des données, Latenode t'aide à avoir une vue d'ensemble de tes opérations. Cela te permet d'identifier plus facilement les opportunités potentielles et de prendre des décisions éclairées basées sur des données précises.