Demo anfragen
On-Premise AI Appliance · EU · Made for KMU

KI.
Lokal.
Sicher.

Einstecken. Anmelden. Fertig.
KI-Modelle laufen vollständig auf eurer Hardware — keine Cloud, keine Token-Kosten, keine Datenweitergabe.

< 10 Min.
Setup-Zeit
100%
Daten on-premise
0 €
Token-Kosten
DSGVO
konform by design
blackb0x AI appliance
Keine Daten verlassen euer Haus
OpenAI-kompatibler Endpoint
Gemma 4 — Text, Bild, Video
AI-Agent per E-Mail & Chat
WireGuard VPN vorinstalliert
LDAP / Active Directory ready

Drei Schritte.
Keine IT-Abteilung.

So einfach wie einen Mac einrichten — aber mit der Rechenleistung eines Rechenzentrums.

01
Einstecken

Strom und LAN anschließen. Die Box bootet automatisch und meldet sich im Netzwerk. Kein Techniker nötig.

02
Browser öffnen

blackb0x.local aufrufen — der Setup-Wizard führt durch Sprache, Admin-Passwort und optionale LDAP-Anbindung.

03
Modell wählen

Gemma 4, Llama, Mistral — per Klick. Der OpenAI-kompatible Endpoint ist sofort aktiv.

04
Optional: VPN

QR-Code scannen, WireGuard-App öffnen — sicherer Remote-Zugriff von überall.

Enterprise-Power.
Ohne Enterprise-Komplexität.

Vollständig off-grid

Kein einziges Byte verlässt euer Netzwerk. Kein Telemetrie, keine externen Server. Air-Gap-fähig.

Security by design

TLS intern, WireGuard VPN vorinstalliert, kein SSH by default. LDAP/SSO für bestehende AD-Umgebungen.

OpenAI-kompatibler Endpoint

blackb0x.local/v1 als API-URL eintragen — kein Code-Change in bestehenden Integrationen nötig.

Multimodal — Bild, Video, Audio

Gemma 4 versteht Bilder, Videos (60 Sek.) und Dokumente direkt. PDFs analysieren, Fotos beschreiben, Verträge scannen — alles on-premise.

AI-Agent per E-Mail

Eigene Mailbox auf der Box. Aufgabe schicken, Ergebnis zurückbekommen. Zusammenfassungen, Übersetzungen, Dokument-Analyse — komplett privat.

Chat-Integration & App

Rocket.Chat on-premise mit @ai-Bot. iOS + Android Apps vorhanden. Dateien hochladen, Antwort direkt im Chat. Eigene App optional.

Monitoring eingebaut

Grafana + Prometheus vorinstalliert. GPU-Temperatur, RAM-Auslastung, Anfragen/Sek. — alles im Browser überwachbar. OLED-Display am Frontpanel.

Modular & upgradebar

Neue GPU-Generation erscheint? Upgrade-Kit bestellen, in 30 Minuten einbauen. Kein Neuaufsetzen. Modelle per Klick wechseln.

Abwärme nutzbar

Optional: Wärmetauscher leitet GPU-Abwärme (~400–800 W) in den Heizkreislauf. Amortisiert sich in 1–2 Heizsaisonen.

Euer KI-Assistent.
Immer erreichbar.

Per E-Mail oder Chat Aufgaben geben — das Modell erledigt sie on-premise. Nichts verlässt euer Haus.

@
E-Mail Agent

Eigene Mailbox auf der Box: ai@firma.local. Mail schicken mit Betreff "Zusammenfassung:" oder "Übersetze:" — Ergebnis kommt als Antwort zurück. PDFs, Bilder, Word-Dokumente im Anhang werden direkt verarbeitet.

#
Chat-Bot

Rocket.Chat läuft on-premise auf der Box. @ai im Channel mentionen — der Bot antwortet sofort. iOS + Android Apps vorhanden. Dateien hochladen, Ergebnis im Chat, Kontext über mehrere Nachrichten.

Vision & Dokumente

Foto von einem Bauteil, Bauplan, Rechnung oder handschriftlichen Notizen — Gemma 4 analysiert direkt. OCR, Objekterkennung, Bildbeschreibung. Kein Cloud-Upload, keine externen APIs.

Tägliches Briefing

Jeden Morgen automatisch eine personalisierte Mail: Kalender des Tages, offene Aufgaben, ggf. aktuelle Infos. Kein Input nötig — der Assistent kommt zu euch.

// Beispiele — was der Agent kann
E-MAIL · BETREFF: Zusammenfassung:
80-seitigen Vertrag in 5 Punkte zusammenfassen, kritische Klauseln markieren.
CHAT · @ai + Bild
Foto von Maschinenteil hochladen — Defekt erkennen und Bericht erstellen.
E-MAIL · BETREFF: Übersetze: DE → EN
Angebot oder Kundenmail professionell übersetzen.
CHAT · @ai täglich 7:00
Automatisches Briefing: Kalender, offene Tasks, wichtige Updates.

Gemma 4 & mehr.
State-of-the-Art.

Alle Modelle laufen lokal, alle sind Open Source, alle ohne Cloud-Abhängigkeit.

SPEED · MoE
Gemma 4 26B MoE
Platz #6 weltweit · 3.8B aktiv · sehr schnell
Text ✓Bilder ✓1× GPU reicht
BEWÄHRT
Llama 3.3 70B
Meta · bestes reines Text-Modell · 128K Kontext
Text ✓2× GPU nötig
SCHNELL & KLEIN
Mistral 7B / Phi-3.5
Für einfache Tasks · hoher Durchsatz · ~5GB VRAM
Sehr schnellCode ✓

Gebaut für Branchen,
wo Daten zählen.

Überall dort, wo Daten das Unternehmen nicht verlassen dürfen.

Rechtsanwälte & Kanzleien
Steuerberater
Ingenieurbüros
Architekturbüros
Gemeinden & Behörden
Produzierende Industrie
Arztpraxen & Kliniken
Finanzdienstleister
Pharmaunternehmen
Forschungsinstitute
Versicherungen
IT-Systemhäuser

Transparent.
Einmalig. Euer.

Keine Token-Kosten. Einmaliger Hardware-Kauf, optionales Support-Abo.

Starter
1× RTX 4090
6.900 € einmalig
Ideal für 5–20 gleichzeitige Nutzer
  • 24 GB VRAM — Modelle bis 13B
  • 128 GB RAM
  • 2 TB NVMe Storage
  • WireGuard VPN, LDAP ready
  • 12 Monate Hardware-Garantie
  • E-Mail Support
Anfragen
Enterprise
H100 PCIe
55.000 € einmalig
Für 100+ Nutzer, alle Modellgrößen
  • 80 GB HBM3 VRAM
  • 512 GB ECC RAM
  • 8 TB NVMe Storage
  • 2U Rack-Chassis
  • Alle Business-Features
  • Dedicated Account Manager
  • SLA 99,9% Verfügbarkeit
Anfragen
Support-Abo
Monitoring, Security-Patches, neue Modelle automatisch eingespielt.
ab 200 €/Monat
Abwärme-Modul
GPU-Abwärme in den Heizkreislauf einspeisen.
ab 950 € einmalig
RAG-Erweiterung
Eigene Dokumente als Kontext — NVMe + Software.
ab 800 € einmalig
GPU-Upgrade-Kit
Neue GPU in 30 Min. einbauen, kein Neuaufsetzen.
ab 2.000 € je Upgrade
Onboarding-Workshop
Halbtag vor Ort: Modellwahl, Prompt-Engineering, Integration.
990 € einmalig
HA-Zweitsystem
Zweite Box als Hot-Standby — automatisches Failover.
Preis = zweite Box

Bereit für
eure eigene Box?

Demo anfragen — wir melden uns innerhalb von 24 Stunden.

// Keine Weitergabe eurer Daten. Kein Newsletter ohne Zustimmung.