Contexte & enjeux métier
Les flux documentaires dans le secteur de la santé reposent sur un afflux constant de fichiers entrants, rapports, formulaires et dossiers rédigés en plusieurs langues, chacun devant être trié, nommé et classé avec soin avant d'être exploitable. À mesure que les volumes augmentent, ce processus devient un goulot d'étranglement : chronophage, source d'erreurs, et difficile à faire évoluer à l'échelle des équipes. Agatha a identifié ce problème comme structurel. L'enjeu ne se limitait pas à réduire les tâches manuelles, il s'agissait de construire un système sur lequel les équipes pourraient s'appuyer au quotidien, apportant de la cohérence dès l'arrivée d'un document, sans complexifier les flux de travail existants.
High volume of incoming documents in multiple languages and formatsManual sorting and filing process becoming a bottleneck at scaleNeed for a reliable, low-friction solution that fits daily team workflows
Moteur de classification multilingue
Le système identifie automatiquement les types de documents, quelle que soit la langue ou le format. Chaque fichier entrant est catégorisé, nommé et orienté dans le bon flux, réduisant le besoin d'interprétation manuelle à la réception.
Architecture légère et robuste
Plutôt que de recourir à des modèles lourds, nous avons choisi une approche ancrée dans les données réelles et les décisions concrètes des utilisateurs. Le résultat est un système robuste, maintenable et aligné avec la réalité du travail documentaire.
Pipeline de fine-tuning continu
À mesure que de nouveaux types de documents apparaissent, le modèle s'adapte. Un processus de fine-tuning structuré intègre les nouveaux exemples sans perturber les performances acquises.
Résultats opérationnels
- Average workload reduction of 55%, reaching 80% in high-volume cases
- Classification accuracy consistently above 95%
- Reliable date extraction across all document types
- Teams reported stronger confidence and less friction in daily documentation work