Was ist SOUL.md bei OpenClaw?

SOUL.md ist eine Markdown-Datei, die die Persönlichkeit, Werte und Verhaltensregeln eines OpenClaw-Agenten definiert. Sie wird bei jedem Start des Agenten in den System-Prompt injiziert und gibt dem Agenten eine persistente Identität über alle Sitzungen hinweg.

Welche Messaging-Apps unterstützt OpenClaw?

OpenClaw unterstützt WhatsApp, Telegram, Discord, Signal, Slack, iMessage, Matrix, LINE, QQ Bot und Microsoft Teams (Stand: April 2026). Der Agent hat dabei ein einziges, geteiltes Gedächtnis – unabhängig davon, über welchen Kanal man kommuniziert.

Wie OpenClaw entstand: Von einer Stunde Code zu 247.000 GitHub-Stars

Q: Wie wurde OpenClaw gebaut?

Peter Steinberger baute die erste Version von OpenClaw (damals Clawdbot) in einer Stunde: Er verband die WhatsApp-API mit der Anthropic-Claude-API und ermöglichte es, dem KI-Modell Aufgaben auf dem eigenen Computer zu delegieren. Das Projekt wurde im November 2025 auf GitHub veröffentlicht.

Q: Was ist der Unterschied zwischen OpenClaw und ChatGPT?

ChatGPT beantwortet Fragen in einem Browser-Fenster. OpenClaw handelt: Es liest E-Mails, verwaltet Kalender, führt Terminal-Befehle aus, steuert Browser und erledigt mehrstufige Aufgaben – vollständig autonom, auf der eigenen Hardware, ohne Cloud-Abhängigkeit. OpenClaw ist kein Chatbot, sondern ein Ausführungs-Framework.

01 —Die Ursprungsidee: „WhatsApp Relay"

Peter Steinberger saß Ende November 2025 an einem Abend an seinem Rechner und stellte sich eine einfache Frage: „Kann ich meinem Computer eine Aufgabe über WhatsApp schicken – und er erledigt sie, während ich woanders bin?"

Die Antwort war: Technisch ja, aber kein fertiges Tool existierte dafür. Also baute er es selbst. Er nannte es intern „WhatsApp Relay". Die Mechanik war radikal simpel: Eine Nachricht geht an eine WhatsApp-Nummer. Die WhatsApp-API leitet sie weiter. Anthropics Claude-API empfängt sie, denkt darüber nach, gibt eine Anweisung zurück. Die Anweisung wird auf dem lokalen Rechner ausgeführt.

Erste funktionierende Version: eine Stunde.

„Er hatte eine deceptively simple Frage: Kann ein KI-Assistent den Fortschritt seiner Arbeit über eine Chat-App überprüfen? Eines Abends verband er eine Messaging-API mit Claudes API, gab dem System lokalen Systemzugriff – und hatte einen Prototyp in einer Stunde."

— emergent.sh, Complete Guide OpenClaw 2026

Steinberger dachte, das sei so offensichtlich, dass OpenAI oder Anthropic in Kürze genau das bauen würden. Also stellte er den Code auf GitHub – nicht als Produkt, sondern als Experiment. Das Projekt hieß Clawdbot, ein Wortspiel auf „Claude" mit einer Hummer-Klaue als Maskottchen. Das Internet antwortete mit einer Begeisterung, die er nicht erwartet hatte.

02 —Was OpenClaw wirklich ist – und was nicht

Vor allem anderen muss eine Sache klar sein: OpenClaw ist kein Chatbot. Es ist auch kein Modell, keine SaaS-Lösung und kein Konkurrenzprodukt zu Claude oder ChatGPT.

OpenClaw ist eine Orchestrierungsschicht – ein Framework, das auf dem eigenen Computer läuft und aus einem beliebigen KI-Modell (Claude, GPT-5, Gemini, DeepSeek, Llama via Ollama) einen handlungsfähigen Agenten macht.

💡 Die einfachste Erklärung

ChatGPT antwortet auf Fragen. OpenClaw erledigt Aufgaben. Es liest E-Mails, bucht Termine, führt Terminal-Befehle aus, scrapt Webseiten, füllt Formulare aus, verwaltet Dateien – und tut das autonom, auf der eigenen Hardware, 24/7. Man nennt es treffend: „Claude with hands."

Der entscheidende Unterschied liegt im Verhältnis von Input zu Output. Bei einem Chatbot gibt man einen Prompt ein und erhält Text zurück. Bei OpenClaw gibt man ein Ziel vor – und der Agent entscheidet selbstständig, welche Schritte nötig sind, führt sie aus, beobachtet das Ergebnis und iteriert, bis die Aufgabe erledigt ist.

Das Projekt ist MIT-lizenziert, kostenfrei und Open Source. Geschrieben in TypeScript und Swift. Läuft lokal auf der eigenen Hardware – Daten verlassen den eigenen Rechner nur dann, wenn man ein externes KI-Modell (Claude API, GPT API) nutzt.

03 —Architektur: Die vier Schichten des Agenten

OpenClaw funktioniert nicht wie ein konventionelles Software-System mit fester Logik. Es ist ein Kompositions-System, das den Agenten bei jedem Start aus einzelnen Bausteinen zusammensetzt – aus dem Dateisystem heraus, in Echtzeit.

Die Architektur besteht aus vier zentralen Schichten:

🏗 OpenClaw Core Architecture

Identität

SOUL.md + IDENTITY.md

Persönlichkeit, Werte, Kommunikationsstil, spezifische Rolle – in den System-Prompt injiziert bei jedem Start

Gedächtnis

MEMORY.md + Vector Index

Persistentes Langzeitgedächtnis in Markdown-Dateien, semantisch durchsuchbar via SQLite + Embeddings

Fähigkeiten

Skills + HEARTBEAT.md

Modulare Fähigkeiten (Markdown + Skript), proaktive geplante Aktionen, ClawHub-Marketplace

Gateway

Harness / MCPorter / Messaging Bridge

Verbindung zu Messaging-Apps (WhatsApp, Telegram etc.), MCP-Protokoll, Ausführung auf dem lokalen System

Der entscheidende Unterschied zu anderen Agenten-Frameworks: Standard-Agenten sind Amnesiasten. Bei jedem Neustart beginnen sie bei null. OpenClaw löst das durch das konsequente Lesen von Konfigurationsdateien beim Start – der Agent „wacht auf" und liest sich buchstäblich selbst in seine Existenz hinein.

Ein tiefes Verständnis des eigenen Systems ist ebenfalls eingebaut: Der Agent kennt seinen eigenen Source Code, seine Konfiguration, welche Modelle er nutzt und welche Optionen verfügbar sind. Daraus entsteht das, was Steinberger „System-Bewusstsein" nannte – nicht im philosophischen Sinn, aber in einem hochpraktischen: Ein Agent, der seine eigene Architektur kennt, kann sich selbst weiterentwickeln und neue Fähigkeiten on demand erzeugen.

04 —SOUL.md – Der „Charakter" des Agenten

Eines der innovativsten Konzepte von OpenClaw ist die SOUL.md-Datei. Sie ist das Fundament jedes OpenClaw-Agenten – eine simple Markdown-Datei, die in natürlicher Sprache beschreibt, wer der Agent ist, wie er kommuniziert, was seine Werte sind und welche Grenzen er einhalten muss.

📄 Was SOUL.md enthält

Typische SOUL.md-Sektionen: Identity (Wer bist du?), Communication Style (Wie kommunizierst du?), Core Values (Wofür stehst du?), Non-Negotiables (Was tust du nie?). Die Datei wird bei jedem Agenten-Start in den System-Prompt injiziert. Kein Datenbankzugriff, keine API – nur Markdown.

Der philosophische Unterschied zu einem gewöhnlichen System-Prompt liegt in der Intention: „You're not a chatbot. You're becoming someone." So beginnt ein vielzitiertes SOUL.md-Beispiel aus der Community. Die erste Zeile eines Standard-Prompts würde lauten: „You are a helpful assistant." Das ist eine Verhaltensanweisung. SOUL.md ist eine Identitätsdefinition.

Zusammen mit IDENTITY.md (spezifische Rolle), MEMORY.md (Wissen) und HEARTBEAT.md (geplante autonome Aktionen) bildet SOUL.md das, was Steinberger das „Harness" nannte – das Gerüst, das sicherstellt, dass der Agent immer läuft, immer erreichbar ist und immer über alle Kanäle hinweg denselben Kontext trägt.

05 —Das Gedächtnis-System: Persistenz ohne Datenbank

Der häufigste Kritikpunkt an KI-Chatbots lautet: „Goldfish Brain." Sobald das Browser-Fenster geschlossen wird, ist alles vergessen. OpenClaw löst das Problem radikal einfach – und genau darin liegt die Eleganz.

Gedächtnis in OpenClaw sind Markdown-Dateien auf der lokalen Festplatte. Der Agent wird angewiesen, nach jeder bedeutsamen Interaktion relevante Fakten in seine Gedächtnisdateien zu schreiben. Beim nächsten Start liest er sie ein. „Mental notes" verschwinden beim Neustart – Dateien nicht.

⚙️ Technisch: Wie das Retrieval funktioniert

OpenClaw baut einen Vektor-Index über die Gedächtnisdateien: Chunking (ca. 400 Tokens, 80-Token-Überlappung) → Embedding via OpenAI, Gemini oder lokales GGUF-Modell → SQLite mit optionaler sqlite-vec-Beschleunigung. Beim Abruf kombiniert es Vektor-Ähnlichkeit (semantischer Match) mit BM25-Keyword-Relevanz (exakter Token-Match). Score: vectorWeight × vectorScore + textWeight × textScore. Das Ergebnis: Ein Agent, der „Mac Studio gateway host" versteht, auch wenn in der Notiz nur „die Maschine, auf der das Gateway läuft" steht.

06 —Skills: Wie OpenClaw seine Fähigkeiten erweitert

In den meisten Agenten-Frameworks ist ein „Tool" eine JSON-Funktionssignatur. Eine starre Schnittstelle. OpenClaw denkt das radikal anders: Skills sind Markdown-Dateien mit eingebetteten Skripten.

Um OpenClaw eine neue Fähigkeit beizubringen, legt man ein Verzeichnis an, schreibt eine Markdown-Datei, die beschreibt was der Skill tut, fügt das Skript hinzu – und der Agent kann ihn sofort nutzen. Kein Neustart, kein Code-Deploy, keine API-Registrierung.

📧

E-Mail & Kalender

Eingehende E-Mails lesen, kategorisieren, beantworten, weiterleiten. Termine buchen, Konflikte erkennen, Erinnerungen setzen.

🖥

System-Steuerung

Terminal-Befehle ausführen, Dateien lesen/schreiben/verschieben, Prozesse starten, Logs analysieren – mit Root-Level-Zugriff.

🌐

Web-Automatisierung

Browser steuern, Formulare ausfüllen, Websites scrapen, Daten extrahieren – ohne manuelle Intervention.

🤖

Sub-Agenten (Lobster)

Spezialisierte Unter-Agenten spawnen und koordinieren. Ein Master-Agent delegiert Teilaufgaben – parallele Ausführung.

⏰

Proaktive Aktionen

HEARTBEAT.md definiert geplante Aktionen: tägliche Reports, Monitoring-Checks, automatische Follow-ups – ohne User-Trigger.

🛠

Self-Extension

Wenn ein Feature fehlt, schreibt der Agent das benötigte Skript selbst. Das WhatsApp-Sprachmemo-Beispiel ist kanonisch.

Der ClawHub Marketplace ist der App Store für OpenClaw-Skills. Tausende Community-entwickelte Skills decken alles ab: von Notion-Integration über Bright-Data-Scraping bis zu Spotify-Steuerung. Der Haken: Die Qualität variiert stark, und vor dem Sicherheits-Hardening 2026 wurden auf ClawHub 341 bösartige Skills mit einer Kontaminationsrate von 12 % gefunden – ein direkter Hinweis darauf, warum Enterprise-Deployments kuratierten, verifizierten Skill-Quellen benötigen.

Die unterstützten Messaging-Plattformen (Stand: April 2026):

WhatsApp Telegram Discord Signal Slack iMessage Matrix LINE QQ Bot Microsoft Teams

Alle Kanäle teilen sich ein einziges, geteiltes Gedächtnis. Ein Befehl über WhatsApp am Morgen ist dem Agenten bekannt, wenn abends über Slack nachgefragt wird.

07 —Produktevolution: Von v0.1 bis NemoClaw

Nov. 2025 · Phase 0

„WhatsApp Relay" – Die erste Stunde

Peter Steinberger verbindet WhatsApp mit der Claude-API. Lokale Systemausführung. Erste Version in einer Stunde. Das Projekt heißt intern „WhatsApp Relay" – noch kein Name, noch kein GitHub-Repo.

WhatsApp ↔ Claude API1h BuildPrivat

Nov. 2025 · Phase 1

Clawdbot – Erster öffentlicher Release

Veröffentlichung auf GitHub unter dem Namen Clawdbot. Maskottchen: Cartoon-Hummer „Clawd". Support für mehrere KI-Modelle. Erste Plugin-Architektur. Browser-Automatisierung kommt hinzu – der Sprung vom simplen Chatbot zum Automatisierungs-Agenten.

Multi-ModelPlugin-ArchitekturBrowser-AutomationOpen Source

25. Jan. 2026 · Phase 2

Offizieller Launch – 9.000 Stars in 24h

Offizieller GitHub-Launch mit globalem Medienecho. 9.000 Stars in 24 Stunden. Andrej Karpathy nennt es das Beeindruckendste, das er je gesehen hat. 2 Millionen Besucher in einer Woche.

9K Stars / 24h2M Wochenbesucher

27.–30. Jan. 2026 · Phase 3

Moltbot → OpenClaw: Zwei Umbenennungen in einer Woche

Trademark-Beschwerde von Anthropic. 5-Uhr-Discord-Brainstorm. Moltbot. Handle-Sniping. $CLAWD-Krypto-Crash. Drei Tage später: OpenClaw. Trademark-geprüft, Domains gesichert. (Vollständige Naming-History →)

Trademark-StreitOpenClawMIT-Lizenz bestätigt

Feb. 2026 · Phase 4

100.000 Stars · Security-Hardening · OpenAI-Hire

100K Stars – schnellstes Wachstum in GitHub-Geschichte. Sicherheitsforscher melden 1.000+ ungesicherte Instanzen. Steinberger publiziert 34 Security-Commits. ClawHub-Marketplace wächst. Vercel sponsert das Projekt. 14. Februar: Steinberger wechselt zu OpenAI, OpenClaw in unabhängige Foundation.

100K StarsClawHubFoundation

März 2026 · Phase 5

247.000 Stars · NVIDIA NemoClaw · Globales Ökosystem

NVIDIA kündigt auf der GTC 2026 NemoClaw an – eine Enterprise-Version mit GPU-Beschleunigung. Tencent, Alibaba und ByteDance bauen Plattformen auf OpenClaw. 300.000 Zeilen Code. 47.700 Forks. Feishu/Lark-Support für den chinesischen Markt.

247K StarsNVIDIA NemoClaw300K+ LoC

08 —OpenClaw vs. ChatGPT Enterprise vs. n8n – der ehrliche Vergleich

Kriterium	OpenClaw	ChatGPT Enterprise	n8n / Zapier
Typ	Autonomer Agent + Framework	Chatbot mit eingeschr. Aktionen	Workflow-Automatisierung
Handelt autonom	✓ Ja – mehrstufig, ohne Bestätigung	⚠ Eingeschränkt – Tools via API	✗ Nein – regelbasiert, kein KI-Denken
Datenhoheit	✓ Lokal, On-Premise möglich	✗ OpenAI-US-Cloud	⚠ Abhängig vom Hosting
Gedächtnis	✓ Persistent, session-übergreifend	⚠ Memory-Feature, begrenzt	✗ Kein KI-Gedächtnis
Skill-Erweiterung	✓ Markdown-Dateien, selbstschreibend	⚠ GPT-Plugins (limitiert)	✓ Viele Konnektoren
Multi-Model	✓ Claude, GPT, Gemini, DeepSeek, Ollama	✗ Nur OpenAI	⚠ Über AI-Nodes
Messaging-native	✓ WhatsApp, Telegram, Slack u.v.m.	✗ Browser/API only	⚠ Über Webhook-Konnektoren
Open Source	✓ MIT-Lizenz	✗ Closed Source	⚠ n8n: teilweise, Zapier: nein
Enterprise-ready (out-of-box)	⚠ Braucht professionelles Setup	✓ Sofort einsetzbar	✓ Für einfache Flows
Kosten	€ – nur LLM-API-Kosten	€€€ – Abo + API	€ bis €€ – Abo-Modell

Die Kurzversion für Entscheider: n8n und Zapier sind die richtige Wahl für regelbasierte, vorhersehbare Prozesse ohne KI-Denken. ChatGPT Enterprise ist der einfachste Weg in die KI-Nutzung, mit dem Nachteil US-Cloud-Abhängigkeit und keiner echten Agentenlogik. OpenClaw ist das leistungsstärkste Tool für komplexe, autonome Workflows – aber es braucht professionelles Deployment, um Enterprise-Anforderungen zu erfüllen.

09 —Was Unternehmen im DACH-Raum wissen müssen

OpenClaw ist kein Plug-and-Play-Produkt für Unternehmen. Die Sicherheitsforscher von SOCprime fanden kurz nach dem Launch über 1.000 ungesicherte Instanzen im öffentlichen Internet – mit offengelegten API-Keys, Chat-Historien und System-Credentials. Der Grund: Der Agent benötigt Root-Level-Zugriff auf das System, um seine Aufgaben zu erfüllen. Ohne professionelles Sicherheitskonzept ist das eine massive Angriffsfläche.

⚠️ Enterprise-Anforderungen für OpenClaw

Was jede Unternehmensinstallation braucht: Sandboxed Execution Environment · Rollenbasierte Zugriffskontrolle (RBAC) · Audit-Logging aller Agent-Aktionen · Verschlüsselung aller Kommunikationskanäle · Kuratierte, verifizierten Skill-Quellen statt ClawHub-Community · AVV-Vertrag für alle API-Aufrufe an externe Modelle · On-Premise-Deployment für DSGVO-kritische Daten

Die gute Nachricht: Die Enterprise-Reife wächst rasant. NVIDIA NemoClaw adressiert GPU-Beschleunigung und Enterprise-Governance. Die OpenClaw-Foundation arbeitet an Team-Management, Compliance-Tools und auditfähigem Logging. Und Projekte wie IronClaw (NEAR AI) fokussieren sich explizit auf sichereres Sandboxing.

Für Unternehmen im DACH-Raum, die heute mit OpenClaw starten wollen, führt kein Weg an einem erfahrenen Implementierungspartner vorbei – jemanden, der die Enterprise-Architektur kennt, DSGVO-konforme Deployments durchgeführt hat und versteht, wo die Grenzen des aktuellen Frameworks liegen.

— — —

FAQ: Häufige Fragen zu OpenClaw

Wie wurde OpenClaw gebaut?

Peter Steinberger baute die erste Version in einer Stunde: Er verband die WhatsApp-API mit Anthropics Claude-API und ermöglichte es, dem KI-Modell Aufgaben auf dem lokalen Rechner zu delegieren. Das Projekt wurde im November 2025 auf GitHub veröffentlicht und seitdem von der Community auf 300.000+ Zeilen Code gewachsen.

Was ist der Unterschied zwischen OpenClaw und ChatGPT?

ChatGPT ist ein Chatbot, der Text generiert. OpenClaw ist ein Ausführungsframework, das autonome Aktionen in der realen Welt durchführt: E-Mails lesen, Terminal-Befehle ausführen, Kalender verwalten, Browser steuern, Dateien verschieben – ohne Bestätigung bei jedem Schritt. Es läuft lokal, ist model-agnostisch und open source.

Was ist SOUL.md?

SOUL.md ist eine Markdown-Datei, die die Persönlichkeit, Werte und Verhaltensregeln eines OpenClaw-Agenten in natürlicher Sprache definiert. Sie wird bei jedem Start des Agenten in den System-Prompt injiziert und sorgt für eine persistente, konsistente Identität über alle Sitzungen und Messaging-Kanäle hinweg.

Welche KI-Modelle unterstützt OpenClaw?

OpenClaw ist model-agnostisch: Es unterstützt Claude (Anthropic), GPT-5 (OpenAI), Gemini (Google), DeepSeek, KIMI K2.5, Xiaomi MiMo sowie lokal betriebene Modelle via Ollama. Unternehmen können jedes Modell wählen – oder für unterschiedliche Tasks unterschiedliche Modelle kombinieren.

Ist OpenClaw für Unternehmen geeignet?

OpenClaw hat enormes Potenzial für Unternehmen, erfordert aber eine professionelle Enterprise-Architektur: Sandbox-Umgebung, rollenbasierte Zugriffskontrolle, Audit-Logging und DSGVO-konformes Deployment. Ein Standard-Community-Setup ist nicht Enterprise-tauglich. Clawgency implementiert OpenClaw mit dieser Architektur für Unternehmen im DACH-Raum.

Was ist der ClawHub-Marketplace?

ClawHub ist der offizielle Skill-Marketplace für OpenClaw – vergleichbar mit einem App Store für Agenten-Fähigkeiten. Tausende community-entwickelte Skills erweitern den Agenten. Für Enterprise-Nutzung sollten ausschließlich verifizierte, kuratierte Skills verwendet werden; im Community-Pool wurden malware-verseuchte Skills gefunden.

🦀 OpenClaw-Experten im DACH-Raum

OpenClaw enterprise-ready machen – für Ihr Unternehmen

Clawgency implementiert OpenClaw mit professioneller Enterprise-Architektur: DSGVO-konform, sicher, skalierbar – live in 2–4 Wochen, mit 90-Tage-ROI-Garantie.

Kostenloses Erstgespräch buchen →