Mistral a mis en ligne le 23 juin 2026 OCR 4, un modèle qui transforme des documents en données exploitables. Son argument : tout peut tourner sur les serveurs de l'entreprise, sans envoyer le moindre fichier sensible dans un cloud extérieur. De quoi viser les secteurs réglementés, de la banque à la santé.
Ce que fait OCR 4
OCR 4 lit des documents (factures, contrats, formulaires, rapports) et en extrait le contenu de façon structurée, prêt à être réutilisé par d'autres logiciels. Le modèle gère 170 langues et renvoie, en plus du texte, la position exacte de chaque élément sur la page. Mistral le décrit comme un outil de compréhension de documents, pas un simple lecteur de caractères.
Côté performance, l'éditeur français affirme que des annotateurs indépendants ont préféré OCR 4 à tous les systèmes concurrents testés, avec un taux de préférence moyen d'environ 72 pour cent.
L'argument qui fait mouche : vos données restent chez vous
Le vrai pari de Mistral est ailleurs. OCR 4 se déploie comme un conteneur unique que l'entreprise installe sur sa propre infrastructure. Concrètement, une banque, un hôpital ou un cabinet d'avocats peut analyser des documents confidentiels sans jamais les transmettre à une API externe.
C'est un atout de poids en Europe, où la souveraineté des données et la conformité pèsent lourd. Le modèle s'intègre aux usages modernes de l'IA, comme la recherche augmentée (RAG) ou les agents, sans forcer à déporter l'information vers le cloud d'un tiers.
Ces capacités visent des cas concrets : numériser des années d'archives, alimenter un moteur de recherche interne, ou nourrir un assistant capable de répondre en citant la source exacte dans un document.
Pourquoi ça compte
La lecture automatique de documents est l'un des chantiers les plus concrets de l'IA en entreprise. Factures, bons de commande, dossiers clients, comptes rendus : des montagnes de papier et de PDF attendent d'être transformées en données utilisables. Un modèle qui fait ce travail vite, bien et sans exposer les fichiers répond à un besoin quotidien, loin des démonstrations spectaculaires mais éloignées du terrain.
Combien ça coûte
Mistral annonce un tarif de 4 dollars pour 1 000 pages traitées, qui tombe à 2 dollars via son option de traitement par lots. Un positionnement agressif face aux services équivalents des grands acteurs américains.
Ce que ça veut dire
La sortie s'inscrit dans une offensive plus large de Mistral, qui multiplie les annonces autour de l'IA pour l'industrie et investit dans ses propres capacités de calcul en France. Pour les entreprises, OCR 4 illustre une tendance de fond : rapatrier l'IA au plus près des données, plutôt que d'envoyer ses fichiers les plus sensibles à l'autre bout du monde. Pour Mistral, c'est une carte de plus dans sa stratégie de champion européen, capable d'opposer la confidentialité et le contrôle aux offres dominantes du secteur.
