Tecnologia

Uno stack RAG self-hosted progettato per carichi europei regolamentati.

I3K RAG Enterprise è una piattaforma RAG production-grade che gira 100% locale dentro il tuo perimetro. FastAPI, React, Qdrant, Ollama e un orchestratore di retrieval in-house — nessuna dipendenza esterna, nessun cloud statunitense.

Lo stack

Ogni componente è open-source, gira in locale ed è auditabile end to end. Nessuna black box, nessuna chiamata di rete nascosta.

Backend FastAPI

API REST su :8000. Auth JWT, gestione utenti, orchestrazione query.

Frontend React + Vite

UI moderna su :3000 con update in tempo reale e document management.

Vector store Qdrant

Su :6333. Filtering RBAC applicato a livello di storage.

LLM server Ollama

Su :11434. Inferenza locale per Qwen3:14b-q4_K_M e Mistral 7B Q4.

User DB SQLite

Account, ruoli, sessioni. Singolo file, facile da backuppare.

Apache Tika + Tesseract

Estrazione testo e OCR per 10+ formati documentali.

La pipeline RAG

Quattro step, end to end. L'orchestratore di retrieval è scritto in-house da I3K — nessun agent framework di terzi, nessun middleware statunitense nel request path.

01
Ingest
Upload via web UI o API. Apache Tika + Tesseract estraggono testo da PDF, DOCX, PPTX, XLSX, ODT, RTF, HTML, XML e documenti scansionati (OCR).
Tika · OCR
02
Embed & store
I documenti vengono chunkati ed embeddati con BAAI/bge-m3 (29 lingue). I vettori vengono salvati in Qdrant con metadata per il filtering RBAC.
bge-m3 · Qdrant
03
Retrieve
Il nostro retrieval orchestrator interno esegue il retrieval semantico da Qdrant. Threshold di rilevanza e top-K configurabili. Filtering per ruolo applicato a livello di retrieval.
I3K orchestrator
04
Generate
I chunk recuperati vengono passati a EuLLM (default) o a un LLM compatibile per generare una risposta grounded. Modelli di default: Qwen3:14b-q4_K_M, Mistral 7B Q4. 100% locale, zero chiamate esterne.
EuLLM · Mistral 7B

Powered by EuLLM

I3K RAG Enterprise integra EuLLM come backend di generazione raccomandato. Inference engine LLM open-source costruito in UE. Nessuna dipendenza cloud statunitense nel tuo stack AI — e trasparenza completa su pesi, training e governance.

Vai su eullm.eu Vedi su GitHub

EuLLM

Default inference engine — EU-trained foundation models

www.eullm.eu

Modelli supportati

Default che funzionano out of the box. Cambia qualsiasi modello dal flusso di setup.

Ruolo	Default	Note
Embedding model	BAAI/bge-m3	29 lingue out of the box. Niente fine-tuning per lingua.
Generation LLM (raccomandato)	EuLLM	Inference engine sovrano europeo. eullm.eu
Generation LLM (alternativo)	Qwen3:14b-q4_K_M	Modello Ollama di default. Capacità generali forti, 8–16 GB VRAM.
Generation LLM (più leggero)	Mistral 7B (Q4)	Footprint più piccolo, VRAM minore. Adatto a valutazione o setup CPU-only.

Formati documentali

Apache Tika e Tesseract estraggono testo strutturato da tutto ciò che hai, compresi PDF scansionati e documenti basati su immagini.

PDF (con OCR)
DOCX / DOC
PPTX / PPT
XLSX / XLS
TXT
MD
ODT
RTF
HTML
XML

Estrazione strutturata

Solo Pro e Cloud

Oltre al retrieval, le edizioni Pro e Cloud includono un engine di estrazione strutturata: dato uno schema target (JSON, colonne di tabella, campi nominati), l'engine estrae valori tipizzati da documenti non strutturati con provenienza fino al chunk sorgente. Utile per contract analytics, pipeline KYC e reporting regolatorio.

JSON-Schema come contratto fra richiesta di estrazione e risultato
Citazione al chunk sorgente per ogni campo estratto
Confidence score e soglie di rifiuto regolabili per campo
Modalità batch e streaming

Backup & restore (integrati)

Backup completo del sistema con rclone — 70+ provider cloud e tradizionali supportati. Cron scheduling, retention policy, zero-downtime. Nessun add-on, nessuna licenza separata.

Cloud

S3 / MinIO
MEGA
Google Drive
OneDrive
Dropbox
Backblaze B2
pCloud

Tradizionali

WebDAV / Nextcloud
FTP
SFTP

Topologie di deployment

Installazione con un comando su Ubuntu 20.04+. Scala su multi-server oppure gira air-gapped su bare metal.

Host singolo

Raccomandato per la maggior parte dei team. Setup script ~1 ora. Production-ready per 10.000+ documenti.

Air-gapped

Installazione offline da pacchetti pre-staged. Per Difesa, sanità, infrastrutture critiche.

Multi-server

Qdrant e Ollama su nodi GPU dedicati, backend FastAPI separato. Wiring manuale post-install.

Installazione con un comando

installbash

git clone https://github.com/I3K-IT/RAG-Enterprise.git
cd RAG-Enterprise
./install.sh

Compliance e sicurezza

GDPR ed EU AI Act sono requisiti di engineering di prima classe, non checkbox di marketing. Sorgente AGPL-3.0: tutto è auditabile.

Autenticazione JWT con ruoli (User, Super User, Admin)
Controlli GDPR Art. 32: TLS in front, password hashing (bcrypt), expiration delle session
Audit trail a livello applicativo
Diritto all'oblio: cancellazione per documento e per utente
Data residency enforced: nessuna chiamata in uscita nel request path
Sorgente AGPL-3.0 — trasparenza completa, auditabilità completa

Pronto a far girare RAG sulla tua infrastruttura?

Parti dall'edizione Community open-source, oppure parla con noi di Pro con estrazione strutturata, SSO, audit log e SLA.

Metti una star su GitHub Prenota una call