{% extends "base.html" %} {% block title %}Upload Document{% endblock %} {% block content %}

📄 Parser PDF/Markdown

Uploadez un fichier PDF ou Markdown pour l'analyser et structurer son contenu

{% if error %}
Erreur : {{ error }}
{% endif %}

📋 Pipeline de traitement

1. OCR Mistral — Extraction du texte et des images via l'API Mistral

2. Markdown — Construction du document Markdown avec images

3. Hiérarchie — Analyse des titres pour créer une structure arborescente

4. LLM (optionnel) — Amélioration de la structure via Ollama

📁 Fichiers générés

  • document.md Texte Markdown OCR
  • document_chunks.json Chunks hiérarchiques
  • document_structured.json Structure LLM
  • document_ocr.json Réponse OCR brute
  • images/ Images extraites
Voir les documents traités
{% endblock %}