01 —Die Ursprungsidee: „WhatsApp Relay"
Peter Steinberger saß Ende November 2025 an einem Abend an seinem Rechner und stellte sich eine einfache Frage: „Kann ich meinem Computer eine Aufgabe über WhatsApp schicken – und er erledigt sie, während ich woanders bin?"
Die Antwort war: Technisch ja, aber kein fertiges Tool existierte dafür. Also baute er es selbst. Er nannte es intern „WhatsApp Relay". Die Mechanik war radikal simpel: Eine Nachricht geht an eine WhatsApp-Nummer. Die WhatsApp-API leitet sie weiter. Anthropics Claude-API empfängt sie, denkt darüber nach, gibt eine Anweisung zurück. Die Anweisung wird auf dem lokalen Rechner ausgeführt.
Erste funktionierende Version: eine Stunde.
„Er hatte eine deceptively simple Frage: Kann ein KI-Assistent den Fortschritt seiner Arbeit über eine Chat-App überprüfen? Eines Abends verband er eine Messaging-API mit Claudes API, gab dem System lokalen Systemzugriff – und hatte einen Prototyp in einer Stunde."— emergent.sh, Complete Guide OpenClaw 2026
Steinberger dachte, das sei so offensichtlich, dass OpenAI oder Anthropic in Kürze genau das bauen würden. Also stellte er den Code auf GitHub – nicht als Produkt, sondern als Experiment. Das Projekt hieß Clawdbot, ein Wortspiel auf „Claude" mit einer Hummer-Klaue als Maskottchen. Das Internet antwortete mit einer Begeisterung, die er nicht erwartet hatte.
02 —Was OpenClaw wirklich ist – und was nicht
Vor allem anderen muss eine Sache klar sein: OpenClaw ist kein Chatbot. Es ist auch kein Modell, keine SaaS-Lösung und kein Konkurrenzprodukt zu Claude oder ChatGPT.
OpenClaw ist eine Orchestrierungsschicht – ein Framework, das auf dem eigenen Computer läuft und aus einem beliebigen KI-Modell (Claude, GPT-5, Gemini, DeepSeek, Llama via Ollama) einen handlungsfähigen Agenten macht.
ChatGPT antwortet auf Fragen. OpenClaw erledigt Aufgaben. Es liest E-Mails, bucht Termine, führt Terminal-Befehle aus, scrapt Webseiten, füllt Formulare aus, verwaltet Dateien – und tut das autonom, auf der eigenen Hardware, 24/7. Man nennt es treffend: „Claude with hands."
Der entscheidende Unterschied liegt im Verhältnis von Input zu Output. Bei einem Chatbot gibt man einen Prompt ein und erhält Text zurück. Bei OpenClaw gibt man ein Ziel vor – und der Agent entscheidet selbstständig, welche Schritte nötig sind, führt sie aus, beobachtet das Ergebnis und iteriert, bis die Aufgabe erledigt ist.
Das Projekt ist MIT-lizenziert, kostenfrei und Open Source. Geschrieben in TypeScript und Swift. Läuft lokal auf der eigenen Hardware – Daten verlassen den eigenen Rechner nur dann, wenn man ein externes KI-Modell (Claude API, GPT API) nutzt.
03 —Architektur: Die vier Schichten des Agenten
OpenClaw funktioniert nicht wie ein konventionelles Software-System mit fester Logik. Es ist ein Kompositions-System, das den Agenten bei jedem Start aus einzelnen Bausteinen zusammensetzt – aus dem Dateisystem heraus, in Echtzeit.
Die Architektur besteht aus vier zentralen Schichten:
Der entscheidende Unterschied zu anderen Agenten-Frameworks: Standard-Agenten sind Amnesiasten. Bei jedem Neustart beginnen sie bei null. OpenClaw löst das durch das konsequente Lesen von Konfigurationsdateien beim Start – der Agent „wacht auf" und liest sich buchstäblich selbst in seine Existenz hinein.
Ein tiefes Verständnis des eigenen Systems ist ebenfalls eingebaut: Der Agent kennt seinen eigenen Source Code, seine Konfiguration, welche Modelle er nutzt und welche Optionen verfügbar sind. Daraus entsteht das, was Steinberger „System-Bewusstsein" nannte – nicht im philosophischen Sinn, aber in einem hochpraktischen: Ein Agent, der seine eigene Architektur kennt, kann sich selbst weiterentwickeln und neue Fähigkeiten on demand erzeugen.
04 —SOUL.md – Der „Charakter" des Agenten
Eines der innovativsten Konzepte von OpenClaw ist die SOUL.md-Datei. Sie ist das Fundament jedes OpenClaw-Agenten – eine simple Markdown-Datei, die in natürlicher Sprache beschreibt, wer der Agent ist, wie er kommuniziert, was seine Werte sind und welche Grenzen er einhalten muss.
Typische SOUL.md-Sektionen: Identity (Wer bist du?), Communication Style (Wie kommunizierst du?), Core Values (Wofür stehst du?), Non-Negotiables (Was tust du nie?). Die Datei wird bei jedem Agenten-Start in den System-Prompt injiziert. Kein Datenbankzugriff, keine API – nur Markdown.
Der philosophische Unterschied zu einem gewöhnlichen System-Prompt liegt in der Intention: „You're not a chatbot. You're becoming someone." So beginnt ein vielzitiertes SOUL.md-Beispiel aus der Community. Die erste Zeile eines Standard-Prompts würde lauten: „You are a helpful assistant." Das ist eine Verhaltensanweisung. SOUL.md ist eine Identitätsdefinition.
Zusammen mit IDENTITY.md (spezifische Rolle), MEMORY.md (Wissen) und HEARTBEAT.md (geplante autonome Aktionen) bildet SOUL.md das, was Steinberger das „Harness" nannte – das Gerüst, das sicherstellt, dass der Agent immer läuft, immer erreichbar ist und immer über alle Kanäle hinweg denselben Kontext trägt.
05 —Das Gedächtnis-System: Persistenz ohne Datenbank
Der häufigste Kritikpunkt an KI-Chatbots lautet: „Goldfish Brain." Sobald das Browser-Fenster geschlossen wird, ist alles vergessen. OpenClaw löst das Problem radikal einfach – und genau darin liegt die Eleganz.
Gedächtnis in OpenClaw sind Markdown-Dateien auf der lokalen Festplatte. Der Agent wird angewiesen, nach jeder bedeutsamen Interaktion relevante Fakten in seine Gedächtnisdateien zu schreiben. Beim nächsten Start liest er sie ein. „Mental notes" verschwinden beim Neustart – Dateien nicht.
OpenClaw baut einen Vektor-Index über die Gedächtnisdateien:
Chunking (ca. 400 Tokens, 80-Token-Überlappung) →
Embedding via OpenAI, Gemini oder lokales GGUF-Modell →
SQLite mit optionaler sqlite-vec-Beschleunigung.
Beim Abruf kombiniert es Vektor-Ähnlichkeit (semantischer Match)
mit BM25-Keyword-Relevanz (exakter Token-Match).
Score: vectorWeight × vectorScore + textWeight × textScore.
Das Ergebnis: Ein Agent, der „Mac Studio gateway host" versteht,
auch wenn in der Notiz nur „die Maschine, auf der das Gateway läuft" steht.
06 —Skills: Wie OpenClaw seine Fähigkeiten erweitert
In den meisten Agenten-Frameworks ist ein „Tool" eine JSON-Funktionssignatur. Eine starre Schnittstelle. OpenClaw denkt das radikal anders: Skills sind Markdown-Dateien mit eingebetteten Skripten.
Um OpenClaw eine neue Fähigkeit beizubringen, legt man ein Verzeichnis an, schreibt eine Markdown-Datei, die beschreibt was der Skill tut, fügt das Skript hinzu – und der Agent kann ihn sofort nutzen. Kein Neustart, kein Code-Deploy, keine API-Registrierung.
Der ClawHub Marketplace ist der App Store für OpenClaw-Skills. Tausende Community-entwickelte Skills decken alles ab: von Notion-Integration über Bright-Data-Scraping bis zu Spotify-Steuerung. Der Haken: Die Qualität variiert stark, und vor dem Sicherheits-Hardening 2026 wurden auf ClawHub 341 bösartige Skills mit einer Kontaminationsrate von 12 % gefunden – ein direkter Hinweis darauf, warum Enterprise-Deployments kuratierten, verifizierten Skill-Quellen benötigen.
Die unterstützten Messaging-Plattformen (Stand: April 2026):
Alle Kanäle teilen sich ein einziges, geteiltes Gedächtnis. Ein Befehl über WhatsApp am Morgen ist dem Agenten bekannt, wenn abends über Slack nachgefragt wird.
07 —Produktevolution: Von v0.1 bis NemoClaw
08 —OpenClaw vs. ChatGPT Enterprise vs. n8n – der ehrliche Vergleich
| Kriterium | OpenClaw | ChatGPT Enterprise | n8n / Zapier |
|---|---|---|---|
| Typ | Autonomer Agent + Framework | Chatbot mit eingeschr. Aktionen | Workflow-Automatisierung |
| Handelt autonom | ✓ Ja – mehrstufig, ohne Bestätigung | ⚠ Eingeschränkt – Tools via API | ✗ Nein – regelbasiert, kein KI-Denken |
| Datenhoheit | ✓ Lokal, On-Premise möglich | ✗ OpenAI-US-Cloud | ⚠ Abhängig vom Hosting |
| Gedächtnis | ✓ Persistent, session-übergreifend | ⚠ Memory-Feature, begrenzt | ✗ Kein KI-Gedächtnis |
| Skill-Erweiterung | ✓ Markdown-Dateien, selbstschreibend | ⚠ GPT-Plugins (limitiert) | ✓ Viele Konnektoren |
| Multi-Model | ✓ Claude, GPT, Gemini, DeepSeek, Ollama | ✗ Nur OpenAI | ⚠ Über AI-Nodes |
| Messaging-native | ✓ WhatsApp, Telegram, Slack u.v.m. | ✗ Browser/API only | ⚠ Über Webhook-Konnektoren |
| Open Source | ✓ MIT-Lizenz | ✗ Closed Source | ⚠ n8n: teilweise, Zapier: nein |
| Enterprise-ready (out-of-box) | ⚠ Braucht professionelles Setup | ✓ Sofort einsetzbar | ✓ Für einfache Flows |
| Kosten | € – nur LLM-API-Kosten | €€€ – Abo + API | € bis €€ – Abo-Modell |
Die Kurzversion für Entscheider: n8n und Zapier sind die richtige Wahl für regelbasierte, vorhersehbare Prozesse ohne KI-Denken. ChatGPT Enterprise ist der einfachste Weg in die KI-Nutzung, mit dem Nachteil US-Cloud-Abhängigkeit und keiner echten Agentenlogik. OpenClaw ist das leistungsstärkste Tool für komplexe, autonome Workflows – aber es braucht professionelles Deployment, um Enterprise-Anforderungen zu erfüllen.
09 —Was Unternehmen im DACH-Raum wissen müssen
OpenClaw ist kein Plug-and-Play-Produkt für Unternehmen. Die Sicherheitsforscher von SOCprime fanden kurz nach dem Launch über 1.000 ungesicherte Instanzen im öffentlichen Internet – mit offengelegten API-Keys, Chat-Historien und System-Credentials. Der Grund: Der Agent benötigt Root-Level-Zugriff auf das System, um seine Aufgaben zu erfüllen. Ohne professionelles Sicherheitskonzept ist das eine massive Angriffsfläche.
Was jede Unternehmensinstallation braucht: Sandboxed Execution Environment · Rollenbasierte Zugriffskontrolle (RBAC) · Audit-Logging aller Agent-Aktionen · Verschlüsselung aller Kommunikationskanäle · Kuratierte, verifizierten Skill-Quellen statt ClawHub-Community · AVV-Vertrag für alle API-Aufrufe an externe Modelle · On-Premise-Deployment für DSGVO-kritische Daten
Die gute Nachricht: Die Enterprise-Reife wächst rasant. NVIDIA NemoClaw adressiert GPU-Beschleunigung und Enterprise-Governance. Die OpenClaw-Foundation arbeitet an Team-Management, Compliance-Tools und auditfähigem Logging. Und Projekte wie IronClaw (NEAR AI) fokussieren sich explizit auf sichereres Sandboxing.
Für Unternehmen im DACH-Raum, die heute mit OpenClaw starten wollen, führt kein Weg an einem erfahrenen Implementierungspartner vorbei – jemanden, der die Enterprise-Architektur kennt, DSGVO-konforme Deployments durchgeführt hat und versteht, wo die Grenzen des aktuellen Frameworks liegen.
FAQ: Häufige Fragen zu OpenClaw
Peter Steinberger baute die erste Version in einer Stunde: Er verband die WhatsApp-API mit Anthropics Claude-API und ermöglichte es, dem KI-Modell Aufgaben auf dem lokalen Rechner zu delegieren. Das Projekt wurde im November 2025 auf GitHub veröffentlicht und seitdem von der Community auf 300.000+ Zeilen Code gewachsen.
ChatGPT ist ein Chatbot, der Text generiert. OpenClaw ist ein Ausführungsframework, das autonome Aktionen in der realen Welt durchführt: E-Mails lesen, Terminal-Befehle ausführen, Kalender verwalten, Browser steuern, Dateien verschieben – ohne Bestätigung bei jedem Schritt. Es läuft lokal, ist model-agnostisch und open source.
SOUL.md ist eine Markdown-Datei, die die Persönlichkeit, Werte und Verhaltensregeln eines OpenClaw-Agenten in natürlicher Sprache definiert. Sie wird bei jedem Start des Agenten in den System-Prompt injiziert und sorgt für eine persistente, konsistente Identität über alle Sitzungen und Messaging-Kanäle hinweg.
OpenClaw ist model-agnostisch: Es unterstützt Claude (Anthropic), GPT-5 (OpenAI), Gemini (Google), DeepSeek, KIMI K2.5, Xiaomi MiMo sowie lokal betriebene Modelle via Ollama. Unternehmen können jedes Modell wählen – oder für unterschiedliche Tasks unterschiedliche Modelle kombinieren.
OpenClaw hat enormes Potenzial für Unternehmen, erfordert aber eine professionelle Enterprise-Architektur: Sandbox-Umgebung, rollenbasierte Zugriffskontrolle, Audit-Logging und DSGVO-konformes Deployment. Ein Standard-Community-Setup ist nicht Enterprise-tauglich. Clawgency implementiert OpenClaw mit dieser Architektur für Unternehmen im DACH-Raum.
ClawHub ist der offizielle Skill-Marketplace für OpenClaw – vergleichbar mit einem App Store für Agenten-Fähigkeiten. Tausende community-entwickelte Skills erweitern den Agenten. Für Enterprise-Nutzung sollten ausschließlich verifizierte, kuratierte Skills verwendet werden; im Community-Pool wurden malware-verseuchte Skills gefunden.
OpenClaw enterprise-ready machen – für Ihr Unternehmen
Clawgency implementiert OpenClaw mit professioneller Enterprise-Architektur: DSGVO-konform, sicher, skalierbar – live in 2–4 Wochen, mit 90-Tage-ROI-Garantie.
Kostenloses Erstgespräch buchen →