Tecnologia

Uno stack RAG self-hosted progettato per carichi europei regolamentati.

I3K RAG Enterprise è una piattaforma RAG production-grade che gira 100% locale dentro il tuo perimetro. FastAPI, React, Qdrant, Ollama e un orchestratore di retrieval in-house — nessuna dipendenza esterna, nessun cloud statunitense.

Lo stack

Ogni componente è open-source, gira in locale ed è auditabile end to end. Nessuna black box, nessuna chiamata di rete nascosta.

Backend FastAPI

API REST su :8000. Auth JWT, gestione utenti, orchestrazione query.

Frontend React + Vite

UI moderna su :3000 con update in tempo reale e document management.

Vector store Qdrant

Su :6333. Filtering RBAC applicato a livello di storage.

LLM server Ollama

Su :11434. Inferenza locale per Qwen3:14b-q4_K_M e Mistral 7B Q4.

User DB SQLite

Account, ruoli, sessioni. Singolo file, facile da backuppare.

Apache Tika + Tesseract

Estrazione testo e OCR per 10+ formati documentali.

La pipeline RAG

Quattro step, end to end. L'orchestratore di retrieval è scritto in-house da I3K — nessun agent framework di terzi, nessun middleware statunitense nel request path.

  1. 01

    Ingest

    Upload via web UI o API. Apache Tika + Tesseract estraggono testo da PDF, DOCX, PPTX, XLSX, ODT, RTF, HTML, XML e documenti scansionati (OCR).

    Tika · OCR

  2. 02

    Embed & store

    I documenti vengono chunkati ed embeddati con BAAI/bge-m3 (29 lingue). I vettori vengono salvati in Qdrant con metadata per il filtering RBAC.

    bge-m3 · Qdrant

  3. 03

    Retrieve

    Il nostro retrieval orchestrator interno esegue il retrieval semantico da Qdrant. Threshold di rilevanza e top-K configurabili. Filtering per ruolo applicato a livello di retrieval.

    I3K orchestrator

  4. 04

    Generate

    I chunk recuperati vengono passati a EuLLM (default) o a un LLM compatibile per generare una risposta grounded. Modelli di default: Qwen3:14b-q4_K_M, Mistral 7B Q4. 100% locale, zero chiamate esterne.

    EuLLM · Mistral 7B

Powered by EuLLM

I3K RAG Enterprise integra EuLLM come backend di generazione raccomandato. Inference engine LLM open-source costruito in UE. Nessuna dipendenza cloud statunitense nel tuo stack AI — e trasparenza completa su pesi, training e governance.

EuLLM

Default inference engine — EU-trained foundation models

www.eullm.eu

Modelli supportati

Default che funzionano out of the box. Cambia qualsiasi modello dal flusso di setup.

RuoloDefaultNote
Embedding modelBAAI/bge-m329 lingue out of the box. Niente fine-tuning per lingua.
Generation LLM (raccomandato)EuLLMInference engine sovrano europeo. eullm.eu
Generation LLM (alternativo)Qwen3:14b-q4_K_MModello Ollama di default. Capacità generali forti, 8–16 GB VRAM.
Generation LLM (più leggero)Mistral 7B (Q4)Footprint più piccolo, VRAM minore. Adatto a valutazione o setup CPU-only.

Formati documentali

Apache Tika e Tesseract estraggono testo strutturato da tutto ciò che hai, compresi PDF scansionati e documenti basati su immagini.

  • PDF (con OCR)
  • DOCX / DOC
  • PPTX / PPT
  • XLSX / XLS
  • TXT
  • MD
  • ODT
  • RTF
  • HTML
  • XML

Estrazione strutturata

Solo Pro e Cloud

Oltre al retrieval, le edizioni Pro e Cloud includono un engine di estrazione strutturata: dato uno schema target (JSON, colonne di tabella, campi nominati), l'engine estrae valori tipizzati da documenti non strutturati con provenienza fino al chunk sorgente. Utile per contract analytics, pipeline KYC e reporting regolatorio.

  • JSON-Schema come contratto fra richiesta di estrazione e risultato
  • Citazione al chunk sorgente per ogni campo estratto
  • Confidence score e soglie di rifiuto regolabili per campo
  • Modalità batch e streaming

Backup & restore (integrati)

Backup completo del sistema con rclone — 70+ provider cloud e tradizionali supportati. Cron scheduling, retention policy, zero-downtime. Nessun add-on, nessuna licenza separata.

Cloud

  • S3 / MinIO
  • MEGA
  • Google Drive
  • OneDrive
  • Dropbox
  • Backblaze B2
  • pCloud

Tradizionali

  • WebDAV / Nextcloud
  • FTP
  • SFTP

Topologie di deployment

Installazione con un comando su Ubuntu 20.04+. Scala su multi-server oppure gira air-gapped su bare metal.

Host singolo

Raccomandato per la maggior parte dei team. Setup script ~1 ora. Production-ready per 10.000+ documenti.

Air-gapped

Installazione offline da pacchetti pre-staged. Per Difesa, sanità, infrastrutture critiche.

Multi-server

Qdrant e Ollama su nodi GPU dedicati, backend FastAPI separato. Wiring manuale post-install.

Installazione con un comando

installbash
git clone https://github.com/I3K-IT/RAG-Enterprise.git
cd RAG-Enterprise
./install.sh

Compliance e sicurezza

GDPR ed EU AI Act sono requisiti di engineering di prima classe, non checkbox di marketing. Sorgente AGPL-3.0: tutto è auditabile.

  • Autenticazione JWT con ruoli (User, Super User, Admin)
  • Controlli GDPR Art. 32: TLS in front, password hashing (bcrypt), expiration delle session
  • Audit trail a livello applicativo
  • Diritto all'oblio: cancellazione per documento e per utente
  • Data residency enforced: nessuna chiamata in uscita nel request path
  • Sorgente AGPL-3.0 — trasparenza completa, auditabilità completa

Pronto a far girare RAG sulla tua infrastruttura?

Parti dall'edizione Community open-source, oppure parla con noi di Pro con estrazione strutturata, SSO, audit log e SLA.

Tecnologia — I3K RAG Enterprise