Hermes Agent: Taugt ein KI-Agent mit Gedächtnis über Sitzungen hinweg für Automatisierung?

Kurzantwort

Hermes Agent ist ein Open-Source-Agent, der mit sitzungsübergreifendem Gedächtnis und wiederverwendbaren Skill-Dateien arbeitet. Das passt zu echter Automatisierung, verlangt aber klare Grenzen für Shell-Zugriff, Messaging-Gateways, Skill-Freigaben, Audit-Logs und menschliche Prüfung.

Wichtigste Punkte

Hermes Agent ist interessant, weil Arbeitsmuster über Sitzungen hinweg erhalten bleiben können.
Zahlen zu wiederholten Geschwindigkeitsgewinnen sind ein Anlass zum Testen, aber kein allgemeines Versprechen.
Support-Triage, Incident-Checklisten, Betriebsberichte und Sales-Follow-up sind bessere Startpunkte als riskante Ausführung.
Terminalzugriff, Remote-Messaging und automatisch geschriebene Skills brauchen Rechtebegrenzung und Review-Logs.
Vor mehr Autonomie sollten mindestens 30 vergleichbare Durchläufe mit Bearbeitungszeit, Korrekturen und Abbrüchen gemessen werden.

Geeignet für: Service-Planer, Operations-Verantwortliche und Automatisierungsverantwortliche, die persistente KI-Agenten für wiederkehrende Arbeit prüfen.
Thema: Automatisierung
Zuletzt geprüft: 15. Juni 2026

Behandelte Tools

Hermes Agent
ChatGPT
Claude
Claude Code
OpenAI Codex
GPT-5.5
Telegram
Discord

Workflow-Snapshot

Eine kompakte Karte, um diesen Guide in einen Automationsablauf zu übersetzen.

01 Input
Kläre zuerst die wiederkehrende Aufgabe, benötigte Daten, Verantwortliche und Erfolgskriterien.
02 KI-Schritt
Setze KI dort ein, wo Entwurf, Sortierung, Zusammenfassung, Routing oder Tool-Aufrufe klar begrenzt sind.
03 Menschliche Prüfung
Genehmigungen, Ausnahmen, Kostenlimits und sensible Entscheidungen bleiben in menschlicher Prüfung.
04 Ergebnis
Überführe das Ergebnis in eine Checkliste, gespeicherte Prompts, eine SOP oder einen überwachten Automationslauf.

Tools im Ablauf

Fokuspunkte

Hermes Agent
KI-Agent
KI-Automatisierung
persistentes Gedächtnis
Skill-Dateien

Diagramm eines persistenten KI-Agenten, bei dem wiederholte Sitzungen in Gedächtnis und Skill-Karten übergehen und zurück zur menschlichen Prüfung führen — Bei Hermes Agent zählt nicht nur, dass der Agent sich erinnert. Entscheidend ist, was er behält, wer es freigibt und welche Rechte in die nächste Ausführung mitgehen.

Operative Notiz

Erst prüfen, ob das Tool zum Arbeitsablauf passt.

Wenn Input, Freigabepunkt und Fehlerprotokoll unklar sind, beschleunigt Automatisierung nur die Verwirrung.

Entscheidungspunkt

Wo ist das Tool vertrauenswürdig, wo braucht es Kontrolle, wo stoppt es?

Hilft Automatisierungsverantwortlichen zu entscheiden, ob Hermes Agent für wiederholte Betriebsarbeit geeignet ist und wo Gedächtnis, Skills und Remote-Ausführung begrenzt werden müssen.

Unterlagen prüfen

6 Geprüfte öffentliche Quellen

Prüfen Sie veränderliche Funktionen und Preise über die verlinkten Quellen und offiziellen Seiten.

Erster Schritt

Vergleiche

Starten Sie mit einem kleinen Pilotlauf und erweitern Sie erst, wenn der Prüfpunkt klar ist.

Was vor dem Rollout klar sein muss

Hermes Agent ist interessant, weil Arbeitsmuster über Sitzungen hinweg erhalten bleiben können.
Zahlen zu wiederholten Geschwindigkeitsgewinnen sind ein Anlass zum Testen, aber kein allgemeines Versprechen.
Support-Triage, Incident-Checklisten, Betriebsberichte und Sales-Follow-up sind bessere Startpunkte als riskante Ausführung.
Terminalzugriff, Remote-Messaging und automatisch geschriebene Skills brauchen Rechtebegrenzung und Review-Logs.

Workflow-Pfad

Wo dieser Guide einzuordnen ist

Dieser Abschnitt verbindet den aktuellen Guide mit dem größeren Workflow, den er unterstützt.

Tool-Stack-Entscheidungen Den Stack wählen, der zur operativen Reife des Teams passt.

Ein Pfad zum Vergleich von Automationsplattformen, App-Buildern, Agent-Buildern, Buchhaltungstools und KI-Assistenten.

Workflow-Pfad öffnen

Passt gut für: Teams zwischen einfachem Toolkauf, internem Workflow-Aufbau und breiter Plattformentscheidung
Weniger passend, wenn: Du erwartest einen vollständigen Praxistest für ein einzelnes Tool statt Kriterien für Workflow-Fit.

Nach ein paar Tagen mit KI-Agenten fällt oft nicht die Modellleistung als erstes auf. Es ist die Wiederholung. Man erklärt wieder die Ordnerstruktur, wieder die Ausnahmefälle, wieder das gewünschte Format und wieder die Stellen, an denen der Agent vorsichtig sein soll.

Hermes Agent ist deshalb interessant, weil es genau an dieser Stelle ansetzt. Der Agent soll Gedächtnis über Sitzungen hinweg behalten, wiederkehrende Muster in Skill-Dateien ablegen und diese beim nächsten ähnlichen Auftrag wiederverwenden. Für Automatisierung ist das keine kleine Komfortfunktion. Es geht darum, ob Arbeitswissen aus einzelnen Sessions heraus in einen wiederverwendbaren Ablauf kommt.

Ich prüfe solche Werkzeuge zuerst nicht nach der Demo, sondern nach den Grenzen. Gedächtnis ist nützlich, aber falsche Regeln können ebenfalls bleiben. Automatisch erzeugte Skills sind nützlich, aber jemand muss sie freigeben. Wenn dazu Shell-Zugriff und Messaging-Gateways kommen, ist das kein reiner Chat-Assistent mehr, sondern eine Betriebsfläche.

Warum Gedächtnis über Sitzungen hinweg zählt

Viele KI-Werkzeuge arbeiten weiterhin in einer Sitzung. Bei leichter ChatGPT- oder Claude-Nutzung endet die Unterhaltung, der Kontext bricht ab, und beim nächsten Lauf beginnt die Erklärung oft von vorne. Für Experimente ist das in Ordnung. Für wiederkehrende Arbeit ist es teuer.

Nehmen wir Support-Triage. Am ersten Tag wird in Rückerstattung, Störung, Vertrag, Produktfrage und Konto eingeteilt. Später kommt hinzu, dass VIP-Rückerstattungen nicht automatisch beantwortet werden. Danach kommt hinzu, dass Sicherheitsbegriffe in eine Review-Queue gehen. Wenn diese Regeln jedes Mal wieder in den Prompt müssen, bleibt die Automatisierung an der Person hängen.

Persistentes Gedächtnis kann hier helfen. Es kann Regeln, Formate und Ausnahmewege über mehrere Läufe tragen. Die wichtige Frage lautet dann aber: Wer darf diese Erinnerung ändern, löschen oder auf eine andere Aufgabe anwenden?

Was Hermes Agent speichern will

Die Hermes-Agent-Dokumentation beschreibt ein System aus Gedächtnis, Skills, Tools und Messaging.

Baustein	Nutzen im Betrieb	Vorher klären
Persistentes Gedächtnis	Weniger wiederholte Erklärung von Kontext und Regeln	Wie falsche oder alte Erinnerungen entfernt werden
Skill-Dateien	Wiederkehrende Abläufe werden wiederverwendbar	Wer den Ablauf freigibt
Tool-Ausführung	Der Agent kann Dateien und Befehle nutzen	Welche Aktionen erlaubt sind
Messaging	Telegram oder Discord können Arbeit auslösen	Identität, Rechte und erlaubte Befehle
Open Source	Teams können prüfen und anpassen	Updates und Härtung bleiben Betreiberaufgabe
Musterlernen	Ähnliche Arbeit kann stabiler werden	Bei wenig Wiederholung ist der Effekt begrenzt

Der Unterschied zu einem normalen Assistenten liegt nicht in einem schöneren Chatfenster. Der Unterschied liegt darin, dass Arbeitsweisen erhalten bleiben.

Geschwindigkeitszahlen vorsichtig lesen

The New Stack und andere Vergleiche zu persistenten Agenten sprechen von möglichen Geschwindigkeitsgewinnen bei wiederholter Arbeit. Die häufig genannte 40-Prozent-Zahl würde ich nicht als allgemeines Benchmark-Versprechen verwenden. Dafür fehlen in öffentlichen Vergleichen oft Task-Setup, Wiederholungszahl, Review-Zeit und Fehlerbehandlung.

Die Richtung ist trotzdem plausibel. Wenn ein Agent nicht jedes Mal bei null beginnt, kann ähnliche Arbeit schneller werden. Für den Betrieb zählt aber, ob auch die menschliche Prüfung kürzer wird.

Metrik	Warum sie zählt	Gutes Signal
30 vergleichbare Läufe	Skill-Effekte brauchen Wiederholung	Nicht aus wenigen Tests entscheiden
Zeit nach dem zehnten Lauf	Anfangseffekte herausrechnen	Ausführung und Review werden kürzer
Menschlich korrigierte Skills	Zeigt Qualität der erzeugten Verfahren	Kritische Skills sind freigegeben
Abgelehnte Ergebnisse	Geschwindigkeit ohne Qualität hilft nicht	Ablehnungsrate steigt nicht
Blockierte Risikoaktionen	Agenten müssen stoppen können	Blockgründe stehen im Log
Zeitpunkt der Freigabe	Menschliche Prüfung muss vor Wirkung passieren	Review vor Kunden- oder Systemwirkung

Ich würde also nicht die Prozentzahl verkaufen, sondern den eigenen Review-Aufwand messen.

Support-Triage ist ein realistischer Startpunkt

Support-Triage passt gut zu Hermes Agent. Es gibt wiederkehrende Kategorien, Zuständigkeiten und Ausnahmewege.

Der Agent kann Nachrichten klassifizieren, zusammenfassen, einen Verantwortlichen vorschlagen und Antwortentwürfe schreiben. Mit der Zeit entstehen Regeln: Rückerstattung mit Kontorisiko in Review, Zahlungsfehler an Payment, Sicherheitswörter nicht automatisch beantworten.

Solche Regeln als Skills zu speichern, ist sinnvoll. Ein Support-Lead sollte das Regelwerk nicht jede Woche neu in die Sitzung kopieren müssen.

Ich würde trotzdem nicht automatisch senden lassen. Klassifizierung, Zusammenfassung, Owner-Vorschlag und Entwurf sind vertretbar. Kundensendung nicht. Wenn Sicherheitsfälle als normale Fragen laufen, nicht freigegebene Policy-Sätze auftauchen oder Vertragsausnahmen ohne Owner weitergehen, stoppt der Test.

Incident Response braucht enge Rechte

Incident Response hat ebenfalls wiederkehrende Muster: Logpfade, Health Checks, Impact Notes, Rollback-Schritte, Benachrichtigungskanäle. Hermes Agent kann daraus bessere Erstdiagnosen und Checklisten machen.

Der Haken ist die Nähe zu realen Systemen. Dateien, Shell-Befehle, Neustarts, Konfigurationen, Deployments und Kundenwirkung liegen nah beieinander. Dass Hermes Sicherheitskontrollen gesondert dokumentiert, reicht als Hinweis: Terminal-, Gateway- und Adapterflächen gehören vorsichtig behandelt.

Ich würde am Anfang nur Lesen, Zusammenfassen, Checklisten und nächste Prüfungen erlauben. Neustart, Löschen, Deploy, Konfigurationsänderung und Rechteänderung brauchen Freigabe. Bei Telegram oder Discord kommen Identitätsprüfung, Befehls-Whitelist, Ausführungslog und Not-Stopp zuerst.

Nicht wählen würde ich ein Setup, bei dem jemand im Chat “prüf den Server” schreibt und der Agent im Hintergrund Befehle ausführt, ohne dass später klar ist, was passiert ist. Schnell ist das. Betriebssicher ist es nicht.

Betriebsberichte und Sales-Follow-up sind bessere Kandidaten

Betriebsberichte wiederholen sich. Dieselben Metriken, ähnliche Ausreißer, wiederkehrende Ursachen, ähnliche nächste Schritte. Hermes Agent kann Format und Prüflogik behalten.

Die Grenze ist Nachvollziehbarkeit. Eine gut geschriebene Zusammenfassung reicht nicht. Zahl, Query, Dashboard-Link, Zeitraum und Prüfer müssen mitkommen. Sonst prüft der Mensch alles erneut.

Sales-Follow-up passt ebenfalls: Kundenproblem, versprochenes Material, Owner, Timing, Risiko, nächster Schritt. Der Agent kann fehlende Felder erkennen und Entwürfe vorbereiten. Preiszusagen, Vertragsbedingungen und sensible Kundentexte bleiben beim Menschen.

Ich sehe Hermes Agent hier als assistierenden Operator. Entwurf, Lückenprüfung, nächste Aktion, Review-Notiz. Nicht als Person, die allein Zusagen verschickt.

Kosten sind mehr als API-Gebühren

Open Source heißt nicht kostenloser Betrieb. Kosten entstehen bei Modellaufrufen, Hosting, Logging, Sicherheitsprüfung, Skill-Review und Schulung der Nutzer. Pauschale Monatszahlen sind nur grobe Orientierung. Modellwahl, Eingabelänge, Wiederholungen und Tool-Nutzung verändern alles.

Kostenfeld	Wo es entsteht	Was messen
Modellnutzung	Zusammenfassung, Planung, Retry, Recherche	Tokens je Aufgabe und Wiederholungen
Skill-Review	Automatisch erzeugte Verfahren	Freigegebene vs verworfene Skills
Sicherheit	Rechte, Tokens, Remote-Befehle	Whitelist und Audit-Log
Training	Nutzer lernen sinnvolle Anfragen	Falsche Anfragearten
Fehlerbehandlung	Falsche oder blockierte Läufe	Wiederherstellungszeit
Wartung	Modell-, Tool- und Skill-Änderungen	Monatlicher Owner-Review

Der erste Monat ist aus meiner Sicht ein Validierungsmonat. Noch kein Einsparungsmonat.

Auswahl und Nicht-Auswahl

Hermes Agent passt, wenn Wiederholung echt ist und Risiko begrenzt werden kann.

Situation	Entscheidung
Gleiche Anfrageart kommt jede Woche	Kandidat
Ergebnis wird intern geprüft	Kandidat
Lesen, Zusammenfassen, Entwurf, Checkliste	Hier starten
Systemändernde Befehle nötig	Erst Freigabe-Gates bauen
Kundendaten oder vertrauliche Daten enthalten	Retention und Zugriff prüfen
Niemand liest Skill-Dateien	Warten
Jeder Fall ist anders	Normaler Agent kann reichen
Messaging löst Runs aus	Identität und Befehlsgrenzen zuerst

Das Gedächtnis ist die Stärke. Es kann aber auch Altlast werden.

Rollout-Reihenfolge

Ich würde bewusst langweilig starten.

Einen wiederkehrenden Workflow auswählen.
Dreißig echte Beispiele sammeln.
Wiederholte Regeln aufschreiben.
Nur Lesen, Zusammenfassen, Entwurf und Checkliste erlauben.
Erzeugte Skills von Menschen freigeben lassen.
Input, Output, Skill, Tool-Call und Reviewer loggen.
Kundensendung, Löschen, Deploy und Rechteänderung blockieren.
Nach zwei Wochen Review-Zeit, Korrekturrate, Ablehnung und Near Misses prüfen.
Rechte nur erweitern, wenn die Zahlen besser werden.

Autonome Agenten wirken in Demos spannender. Im Betrieb ist Auditierbarkeit wichtiger.

Abbruchkriterien

Die Stoppschilder gehören vor den Start.

Fehlsignal	Sofortmaßnahme
Menschen verstehen den Skill nicht	Skill stoppen
Gleiche Ausnahme schlägt wieder fehl	Ausnahme-Queue oder Skill verwerfen
Review-Zeit fällt nicht	Umfang verkleinern
Logs erklären den Lauf nicht	Rechte nicht erweitern
Remote-Anforderer ist unklar	Messaging-Gateway schließen
Shell-Befehle laufen ohne Whitelist	Produktion stoppen
Kundentexte werden fast komplett umgeschrieben	Betriebsregeln überarbeiten
Kosten steigen durch Retries	Routing und Eingabelänge ändern

Wenn diese Kriterien nicht erfüllt sind, ist nicht automatisch Hermes Agent falsch. Dann ist der Workflow noch nicht bereit.

Praxisurteil aus dem Betrieb

Hermes Agent zeigt in eine sinnvolle Richtung. Gedächtnis, Skills und Remote-Auslösung sind Bausteine, die Automatisierung tatsächlich braucht.

Die Frage ist nicht, ob der Agent sich erinnern kann. Die Frage ist, was er behalten darf und was er daraus tun darf. Alte Regeln, riskante Befehle und ungeprüfte Skills können ebenfalls überleben.

Starten würde ich mit Support-Triage, Betriebsbericht-Entwürfen, Incident-Checklisten und Sales-Follow-up-Notizen. Ohne Skill-Freigabe, Rechtebegrenzung, Ausführungslog und Abbruchkriterien würde ich keine breite Autonomie geben.

Häufige Fragen

Kann Hermes Agent direkt in Produktion?

Nicht breit. Beginnen Sie mit Lesen, Zusammenfassen, Entwurf und Checklisten. Shell-Ausführung und Remote-Befehle kommen erst nach Freigabe-Gates und Logs.

Was bringt persistentes Gedächtnis praktisch?

Weniger wiederholte Erklärung. Regeln, Ausnahmen, Formate und Übergaben können in spätere Läufe mitgehen.

Was ist das größte Risiko?

Falsche Verfahren bleiben bestehen, und Tool-Rechte werden zu breit. Je mehr der Agent erinnert und ausführt, desto mehr Review braucht er.

Sind Geschwindigkeitsgewinne realistisch?

Möglich, aber nicht garantiert. Messen Sie vergleichbare Läufe, Review-Zeit, Korrekturen, Ablehnungen und Sicherheitsstopps im eigenen Ablauf.

Womit sollte man starten?

Support-Triage, Betriebsberichte, Incident-Checklisten und Sales-Follow-up sind gute erste Kandidaten. Unumkehrbare Systemaktionen und Kundenzusagen warten.

Geprüfte öffentliche Quellen

Wichtige öffentliche Seiten, die für Produktdetails, Preiskontext und Vergleichsaussagen geprüft wurden.

Hermes Agent documentation Nous Research
Hermes Agent quickstart Nous Research
Hermes Agent memory feature Nous Research
Hermes Agent skills feature Nous Research
Hermes Agent messaging gateway Nous Research
Hermes Agent security guide Nous Research

Nächster Schritt

Aus diesem Leitfaden eine operative Checkliste machen.

Nutze zuerst den Ressourcenpfad zur Prüfung des Workflows und vergleiche Tools erst, wenn Prozess und Übergabepunkte klar sind.

Vergleiche Update melden