blackb0x.io — KI. Lokal. Sicher.

// Wie es funktioniert

Drei Schritte.
Keine IT-Abteilung.

So einfach wie einen Mac einrichten — aber mit der Rechenleistung eines Rechenzentrums.

Einstecken

Strom und LAN anschließen. Die Box bootet automatisch und meldet sich im Netzwerk. Kein Techniker nötig.

Browser öffnen

blackb0x.local aufrufen — der Setup-Wizard führt durch Sprache, Admin-Passwort und optionale LDAP-Anbindung.

Modell wählen

Gemma 4, Llama, Mistral — per Klick. Der OpenAI-kompatible Endpoint ist sofort aktiv.

Optional: VPN

QR-Code scannen, WireGuard-App öffnen — sicherer Remote-Zugriff von überall.

// Was drin steckt

Enterprise-Power.
Ohne Enterprise-Komplexität.

Vollständig off-grid

Kein einziges Byte verlässt euer Netzwerk. Kein Telemetrie, keine externen Server. Air-Gap-fähig.

Security by design

TLS intern, WireGuard VPN vorinstalliert, kein SSH by default. LDAP/SSO für bestehende AD-Umgebungen.

OpenAI-kompatibler Endpoint

blackb0x.local/v1 als API-URL eintragen — kein Code-Change in bestehenden Integrationen nötig.

Multimodal — Bild, Video, Audio

Gemma 4 versteht Bilder, Videos (60 Sek.) und Dokumente direkt. PDFs analysieren, Fotos beschreiben, Verträge scannen — alles on-premise.

AI-Agent per E-Mail

Eigene Mailbox auf der Box. Aufgabe schicken, Ergebnis zurückbekommen. Zusammenfassungen, Übersetzungen, Dokument-Analyse — komplett privat.

Chat-Integration & App

Rocket.Chat on-premise mit @ai-Bot. iOS + Android Apps vorhanden. Dateien hochladen, Antwort direkt im Chat. Eigene App optional.

Monitoring eingebaut

Grafana + Prometheus vorinstalliert. GPU-Temperatur, RAM-Auslastung, Anfragen/Sek. — alles im Browser überwachbar. OLED-Display am Frontpanel.

Modular & upgradebar

Neue GPU-Generation erscheint? Upgrade-Kit bestellen, in 30 Minuten einbauen. Kein Neuaufsetzen. Modelle per Klick wechseln.

Abwärme nutzbar

Optional: Wärmetauscher leitet GPU-Abwärme (~400–800 W) in den Heizkreislauf. Amortisiert sich in 1–2 Heizsaisonen.

// Persönlicher AI-Assistent

Euer KI-Assistent.
Immer erreichbar.

Per E-Mail oder Chat Aufgaben geben — das Modell erledigt sie on-premise. Nichts verlässt euer Haus.

E-Mail Agent

Eigene Mailbox auf der Box: ai@firma.local. Mail schicken mit Betreff "Zusammenfassung:" oder "Übersetze:" — Ergebnis kommt als Antwort zurück. PDFs, Bilder, Word-Dokumente im Anhang werden direkt verarbeitet.

Chat-Bot

Rocket.Chat läuft on-premise auf der Box. @ai im Channel mentionen — der Bot antwortet sofort. iOS + Android Apps vorhanden. Dateien hochladen, Ergebnis im Chat, Kontext über mehrere Nachrichten.

◉

Vision & Dokumente

Foto von einem Bauteil, Bauplan, Rechnung oder handschriftlichen Notizen — Gemma 4 analysiert direkt. OCR, Objekterkennung, Bildbeschreibung. Kein Cloud-Upload, keine externen APIs.

☀

Tägliches Briefing

Jeden Morgen automatisch eine personalisierte Mail: Kalender des Tages, offene Aufgaben, ggf. aktuelle Infos. Kein Input nötig — der Assistent kommt zu euch.

// Beispiele — was der Agent kann

E-MAIL · BETREFF: Zusammenfassung:

80-seitigen Vertrag in 5 Punkte zusammenfassen, kritische Klauseln markieren.

CHAT · @ai + Bild

Foto von Maschinenteil hochladen — Defekt erkennen und Bericht erstellen.

E-MAIL · BETREFF: Übersetze: DE → EN

Angebot oder Kundenmail professionell übersetzen.

CHAT · @ai täglich 7:00

Automatisches Briefing: Kalender, offene Tasks, wichtige Updates.

// KI-Modelle

Gemma 4 & mehr.
State-of-the-Art.

Alle Modelle laufen lokal, alle sind Open Source, alle ohne Cloud-Abhängigkeit.

★ NEU · April 2026

Gemma 4 31B

Platz #3 weltweit · Text + Bild + Video · 256K Kontext

Text ✓Bilder ✓Video ✓Apache 2.0

SPEED · MoE

Gemma 4 26B MoE

Platz #6 weltweit · 3.8B aktiv · sehr schnell

Text ✓Bilder ✓1× GPU reicht

BEWÄHRT

Llama 3.3 70B

Meta · bestes reines Text-Modell · 128K Kontext

Text ✓2× GPU nötig

SCHNELL & KLEIN

Mistral 7B / Phi-3.5

Für einfache Tasks · hoher Durchsatz · ~5GB VRAM

Sehr schnellCode ✓

// Für wen

Gebaut für Branchen,
wo Daten zählen.

Überall dort, wo Daten das Unternehmen nicht verlassen dürfen.

Rechtsanwälte & Kanzleien

Steuerberater

Ingenieurbüros

Architekturbüros

Gemeinden & Behörden

Produzierende Industrie

Arztpraxen & Kliniken

Finanzdienstleister

Pharmaunternehmen

Forschungsinstitute

Versicherungen

IT-Systemhäuser

// Preise

Transparent.
Einmalig. Euer.

Keine Token-Kosten. Einmaliger Hardware-Kauf, optionales Support-Abo.

Starter

1× RTX 4090

6.900 € einmalig

Ideal für 5–20 gleichzeitige Nutzer

24 GB VRAM — Modelle bis 13B
128 GB RAM
2 TB NVMe Storage
WireGuard VPN, LDAP ready
12 Monate Hardware-Garantie
E-Mail Support

Anfragen

★ Empfohlen

2× RTX 4090

12.900 € einmalig

Für 20–100 Nutzer, größere Modelle

48 GB VRAM — Modelle bis 70B
256 GB RAM
4 TB NVMe RAID
Alle Starter-Features
Onboarding-Workshop inklusive
Priority-Support Telefon + Remote
Abwärme-Modul optional (+950 €)

Demo anfragen

Enterprise

H100 PCIe

55.000 € einmalig

Für 100+ Nutzer, alle Modellgrößen

80 GB HBM3 VRAM
512 GB ECC RAM
8 TB NVMe Storage
2U Rack-Chassis
Alle Business-Features
Dedicated Account Manager
SLA 99,9% Verfügbarkeit

Anfragen

// Add-ons

Support-Abo

Monitoring, Security-Patches, neue Modelle automatisch eingespielt.

ab 200 €/Monat

Abwärme-Modul

GPU-Abwärme in den Heizkreislauf einspeisen.

ab 950 € einmalig

RAG-Erweiterung

Eigene Dokumente als Kontext — NVMe + Software.

ab 800 € einmalig

GPU-Upgrade-Kit

Neue GPU in 30 Min. einbauen, kein Neuaufsetzen.

ab 2.000 € je Upgrade

Onboarding-Workshop

Halbtag vor Ort: Modellwahl, Prompt-Engineering, Integration.

990 € einmalig

HA-Zweitsystem

Zweite Box als Hot-Standby — automatisches Failover.

Preis = zweite Box

KI.Lokal.Sicher.

Drei Schritte.Keine IT-Abteilung.

Enterprise-Power.Ohne Enterprise-Komplexität.

Euer KI-Assistent.Immer erreichbar.

Gemma 4 & mehr.State-of-the-Art.

Gebaut für Branchen,wo Daten zählen.

Transparent.Einmalig. Euer.

Bereit füreure eigene Box?