Tecnologia
Uno stack RAG self-hosted progettato per carichi europei regolamentati.
I3K RAG Enterprise è una piattaforma RAG production-grade che gira 100% locale dentro il tuo perimetro. FastAPI, React, Qdrant, Ollama e un orchestratore di retrieval in-house — nessuna dipendenza esterna, nessun cloud statunitense.
Lo stack
Ogni componente è open-source, gira in locale ed è auditabile end to end. Nessuna black box, nessuna chiamata di rete nascosta.
Backend FastAPI
API REST su :8000. Auth JWT, gestione utenti, orchestrazione query.
Frontend React + Vite
UI moderna su :3000 con update in tempo reale e document management.
Vector store Qdrant
Su :6333. Filtering RBAC applicato a livello di storage.
LLM server Ollama
Su :11434. Inferenza locale per Qwen3:14b-q4_K_M e Mistral 7B Q4.
User DB SQLite
Account, ruoli, sessioni. Singolo file, facile da backuppare.
Apache Tika + Tesseract
Estrazione testo e OCR per 10+ formati documentali.
La pipeline RAG
Quattro step, end to end. L'orchestratore di retrieval è scritto in-house da I3K — nessun agent framework di terzi, nessun middleware statunitense nel request path.
- 01
Ingest
Upload via web UI o API. Apache Tika + Tesseract estraggono testo da PDF, DOCX, PPTX, XLSX, ODT, RTF, HTML, XML e documenti scansionati (OCR).
Tika · OCR
- 02
Embed & store
I documenti vengono chunkati ed embeddati con BAAI/bge-m3 (29 lingue). I vettori vengono salvati in Qdrant con metadata per il filtering RBAC.
bge-m3 · Qdrant
- 03
Retrieve
Il nostro retrieval orchestrator interno esegue il retrieval semantico da Qdrant. Threshold di rilevanza e top-K configurabili. Filtering per ruolo applicato a livello di retrieval.
I3K orchestrator
- 04
Generate
I chunk recuperati vengono passati a EuLLM (default) o a un LLM compatibile per generare una risposta grounded. Modelli di default: Qwen3:14b-q4_K_M, Mistral 7B Q4. 100% locale, zero chiamate esterne.
EuLLM · Mistral 7B
Powered by EuLLM
I3K RAG Enterprise integra EuLLM come backend di generazione raccomandato. Inference engine LLM open-source costruito in UE. Nessuna dipendenza cloud statunitense nel tuo stack AI — e trasparenza completa su pesi, training e governance.
EuLLM
Default inference engine — EU-trained foundation models
www.eullm.eu
Modelli supportati
Default che funzionano out of the box. Cambia qualsiasi modello dal flusso di setup.
| Ruolo | Default | Note |
|---|---|---|
| Embedding model | BAAI/bge-m3 | 29 lingue out of the box. Niente fine-tuning per lingua. |
| Generation LLM (raccomandato) | EuLLM | Inference engine sovrano europeo. eullm.eu |
| Generation LLM (alternativo) | Qwen3:14b-q4_K_M | Modello Ollama di default. Capacità generali forti, 8–16 GB VRAM. |
| Generation LLM (più leggero) | Mistral 7B (Q4) | Footprint più piccolo, VRAM minore. Adatto a valutazione o setup CPU-only. |
Formati documentali
Apache Tika e Tesseract estraggono testo strutturato da tutto ciò che hai, compresi PDF scansionati e documenti basati su immagini.
- PDF (con OCR)
- DOCX / DOC
- PPTX / PPT
- XLSX / XLS
- TXT
- MD
- ODT
- RTF
- HTML
- XML
Estrazione strutturata
Solo Pro e CloudOltre al retrieval, le edizioni Pro e Cloud includono un engine di estrazione strutturata: dato uno schema target (JSON, colonne di tabella, campi nominati), l'engine estrae valori tipizzati da documenti non strutturati con provenienza fino al chunk sorgente. Utile per contract analytics, pipeline KYC e reporting regolatorio.
- JSON-Schema come contratto fra richiesta di estrazione e risultato
- Citazione al chunk sorgente per ogni campo estratto
- Confidence score e soglie di rifiuto regolabili per campo
- Modalità batch e streaming
Backup & restore (integrati)
Backup completo del sistema con rclone — 70+ provider cloud e tradizionali supportati. Cron scheduling, retention policy, zero-downtime. Nessun add-on, nessuna licenza separata.
Cloud
- S3 / MinIO
- MEGA
- Google Drive
- OneDrive
- Dropbox
- Backblaze B2
- pCloud
Tradizionali
- WebDAV / Nextcloud
- FTP
- SFTP
Topologie di deployment
Installazione con un comando su Ubuntu 20.04+. Scala su multi-server oppure gira air-gapped su bare metal.
Host singolo
Raccomandato per la maggior parte dei team. Setup script ~1 ora. Production-ready per 10.000+ documenti.
Air-gapped
Installazione offline da pacchetti pre-staged. Per Difesa, sanità, infrastrutture critiche.
Multi-server
Qdrant e Ollama su nodi GPU dedicati, backend FastAPI separato. Wiring manuale post-install.
Installazione con un comando
git clone https://github.com/I3K-IT/RAG-Enterprise.git
cd RAG-Enterprise
./install.shCompliance e sicurezza
GDPR ed EU AI Act sono requisiti di engineering di prima classe, non checkbox di marketing. Sorgente AGPL-3.0: tutto è auditabile.
- Autenticazione JWT con ruoli (User, Super User, Admin)
- Controlli GDPR Art. 32: TLS in front, password hashing (bcrypt), expiration delle session
- Audit trail a livello applicativo
- Diritto all'oblio: cancellazione per documento e per utente
- Data residency enforced: nessuna chiamata in uscita nel request path
- Sorgente AGPL-3.0 — trasparenza completa, auditabilità completa
Pronto a far girare RAG sulla tua infrastruttura?
Parti dall'edizione Community open-source, oppure parla con noi di Pro con estrazione strutturata, SSO, audit log e SLA.