Kurzantwort
Hermes Agent ist ein Open-Source-Agent, der mit sitzungsübergreifendem Gedächtnis und wiederverwendbaren Skill-Dateien arbeitet. Das passt zu echter Automatisierung, verlangt aber klare Grenzen für Shell-Zugriff, Messaging-Gateways, Skill-Freigaben, Audit-Logs und menschliche Prüfung.
- Hermes Agent ist interessant, weil Arbeitsmuster über Sitzungen hinweg erhalten bleiben können.
- Zahlen zu wiederholten Geschwindigkeitsgewinnen sind ein Anlass zum Testen, aber kein allgemeines Versprechen.
- Support-Triage, Incident-Checklisten, Betriebsberichte und Sales-Follow-up sind bessere Startpunkte als riskante Ausführung.
- Terminalzugriff, Remote-Messaging und automatisch geschriebene Skills brauchen Rechtebegrenzung und Review-Logs.
- Vor mehr Autonomie sollten mindestens 30 vergleichbare Durchläufe mit Bearbeitungszeit, Korrekturen und Abbrüchen gemessen werden.
- Geeignet für
- Service-Planer, Operations-Verantwortliche und Automatisierungsverantwortliche, die persistente KI-Agenten für wiederkehrende Arbeit prüfen.
- Thema
- Automatisierung
- Zuletzt geprüft
- 15. Juni 2026
- Hermes Agent
- ChatGPT
- Claude
- Claude Code
- OpenAI Codex
- GPT-5.5
- Telegram
- Discord
Workflow-Snapshot
Eine kompakte Karte, um diesen Guide in einen Automationsablauf zu übersetzen.
- 01 Input
Kläre zuerst die wiederkehrende Aufgabe, benötigte Daten, Verantwortliche und Erfolgskriterien.
- 02 KI-Schritt
Setze KI dort ein, wo Entwurf, Sortierung, Zusammenfassung, Routing oder Tool-Aufrufe klar begrenzt sind.
- 03 Menschliche Prüfung
Genehmigungen, Ausnahmen, Kostenlimits und sensible Entscheidungen bleiben in menschlicher Prüfung.
- 04 Ergebnis
Überführe das Ergebnis in eine Checkliste, gespeicherte Prompts, eine SOP oder einen überwachten Automationslauf.
- Hermes Agent
- ChatGPT
- Claude
- Claude Code
- OpenAI Codex
- GPT-5.5
- Hermes Agent
- KI-Agent
- KI-Automatisierung
- persistentes Gedächtnis
- Skill-Dateien
Operative Notiz
Erst prüfen, ob das Tool zum Arbeitsablauf passt.
Wenn Input, Freigabepunkt und Fehlerprotokoll unklar sind, beschleunigt Automatisierung nur die Verwirrung.
Wo ist das Tool vertrauenswürdig, wo braucht es Kontrolle, wo stoppt es?
Hilft Automatisierungsverantwortlichen zu entscheiden, ob Hermes Agent für wiederholte Betriebsarbeit geeignet ist und wo Gedächtnis, Skills und Remote-Ausführung begrenzt werden müssen.
6 Geprüfte öffentliche Quellen
Prüfen Sie veränderliche Funktionen und Preise über die verlinkten Quellen und offiziellen Seiten.
Vergleiche
Starten Sie mit einem kleinen Pilotlauf und erweitern Sie erst, wenn der Prüfpunkt klar ist.
- Hermes Agent ist interessant, weil Arbeitsmuster über Sitzungen hinweg erhalten bleiben können.
- Zahlen zu wiederholten Geschwindigkeitsgewinnen sind ein Anlass zum Testen, aber kein allgemeines Versprechen.
- Support-Triage, Incident-Checklisten, Betriebsberichte und Sales-Follow-up sind bessere Startpunkte als riskante Ausführung.
- Terminalzugriff, Remote-Messaging und automatisch geschriebene Skills brauchen Rechtebegrenzung und Review-Logs.
Workflow-Pfad
Wo dieser Guide einzuordnen ist
Dieser Abschnitt verbindet den aktuellen Guide mit dem größeren Workflow, den er unterstützt.
Ein Pfad zum Vergleich von Automationsplattformen, App-Buildern, Agent-Buildern, Buchhaltungstools und KI-Assistenten.
Workflow-Pfad öffnen- Passt gut für
- Teams zwischen einfachem Toolkauf, internem Workflow-Aufbau und breiter Plattformentscheidung
- Weniger passend, wenn
- Du erwartest einen vollständigen Praxistest für ein einzelnes Tool statt Kriterien für Workflow-Fit.
Nach ein paar Tagen mit KI-Agenten fällt oft nicht die Modellleistung als erstes auf. Es ist die Wiederholung. Man erklärt wieder die Ordnerstruktur, wieder die Ausnahmefälle, wieder das gewünschte Format und wieder die Stellen, an denen der Agent vorsichtig sein soll.
Hermes Agent ist deshalb interessant, weil es genau an dieser Stelle ansetzt. Der Agent soll Gedächtnis über Sitzungen hinweg behalten, wiederkehrende Muster in Skill-Dateien ablegen und diese beim nächsten ähnlichen Auftrag wiederverwenden. Für Automatisierung ist das keine kleine Komfortfunktion. Es geht darum, ob Arbeitswissen aus einzelnen Sessions heraus in einen wiederverwendbaren Ablauf kommt.
Ich prüfe solche Werkzeuge zuerst nicht nach der Demo, sondern nach den Grenzen. Gedächtnis ist nützlich, aber falsche Regeln können ebenfalls bleiben. Automatisch erzeugte Skills sind nützlich, aber jemand muss sie freigeben. Wenn dazu Shell-Zugriff und Messaging-Gateways kommen, ist das kein reiner Chat-Assistent mehr, sondern eine Betriebsfläche.
Warum Gedächtnis über Sitzungen hinweg zählt
Viele KI-Werkzeuge arbeiten weiterhin in einer Sitzung. Bei leichter ChatGPT- oder Claude-Nutzung endet die Unterhaltung, der Kontext bricht ab, und beim nächsten Lauf beginnt die Erklärung oft von vorne. Für Experimente ist das in Ordnung. Für wiederkehrende Arbeit ist es teuer.
Nehmen wir Support-Triage. Am ersten Tag wird in Rückerstattung, Störung, Vertrag, Produktfrage und Konto eingeteilt. Später kommt hinzu, dass VIP-Rückerstattungen nicht automatisch beantwortet werden. Danach kommt hinzu, dass Sicherheitsbegriffe in eine Review-Queue gehen. Wenn diese Regeln jedes Mal wieder in den Prompt müssen, bleibt die Automatisierung an der Person hängen.
Persistentes Gedächtnis kann hier helfen. Es kann Regeln, Formate und Ausnahmewege über mehrere Läufe tragen. Die wichtige Frage lautet dann aber: Wer darf diese Erinnerung ändern, löschen oder auf eine andere Aufgabe anwenden?
Was Hermes Agent speichern will
Die Hermes-Agent-Dokumentation beschreibt ein System aus Gedächtnis, Skills, Tools und Messaging.
| Baustein | Nutzen im Betrieb | Vorher klären |
|---|---|---|
| Persistentes Gedächtnis | Weniger wiederholte Erklärung von Kontext und Regeln | Wie falsche oder alte Erinnerungen entfernt werden |
| Skill-Dateien | Wiederkehrende Abläufe werden wiederverwendbar | Wer den Ablauf freigibt |
| Tool-Ausführung | Der Agent kann Dateien und Befehle nutzen | Welche Aktionen erlaubt sind |
| Messaging | Telegram oder Discord können Arbeit auslösen | Identität, Rechte und erlaubte Befehle |
| Open Source | Teams können prüfen und anpassen | Updates und Härtung bleiben Betreiberaufgabe |
| Musterlernen | Ähnliche Arbeit kann stabiler werden | Bei wenig Wiederholung ist der Effekt begrenzt |
Der Unterschied zu einem normalen Assistenten liegt nicht in einem schöneren Chatfenster. Der Unterschied liegt darin, dass Arbeitsweisen erhalten bleiben.
Geschwindigkeitszahlen vorsichtig lesen
The New Stack und andere Vergleiche zu persistenten Agenten sprechen von möglichen Geschwindigkeitsgewinnen bei wiederholter Arbeit. Die häufig genannte 40-Prozent-Zahl würde ich nicht als allgemeines Benchmark-Versprechen verwenden. Dafür fehlen in öffentlichen Vergleichen oft Task-Setup, Wiederholungszahl, Review-Zeit und Fehlerbehandlung.
Die Richtung ist trotzdem plausibel. Wenn ein Agent nicht jedes Mal bei null beginnt, kann ähnliche Arbeit schneller werden. Für den Betrieb zählt aber, ob auch die menschliche Prüfung kürzer wird.
| Metrik | Warum sie zählt | Gutes Signal |
|---|---|---|
| 30 vergleichbare Läufe | Skill-Effekte brauchen Wiederholung | Nicht aus wenigen Tests entscheiden |
| Zeit nach dem zehnten Lauf | Anfangseffekte herausrechnen | Ausführung und Review werden kürzer |
| Menschlich korrigierte Skills | Zeigt Qualität der erzeugten Verfahren | Kritische Skills sind freigegeben |
| Abgelehnte Ergebnisse | Geschwindigkeit ohne Qualität hilft nicht | Ablehnungsrate steigt nicht |
| Blockierte Risikoaktionen | Agenten müssen stoppen können | Blockgründe stehen im Log |
| Zeitpunkt der Freigabe | Menschliche Prüfung muss vor Wirkung passieren | Review vor Kunden- oder Systemwirkung |
Ich würde also nicht die Prozentzahl verkaufen, sondern den eigenen Review-Aufwand messen.
Support-Triage ist ein realistischer Startpunkt
Support-Triage passt gut zu Hermes Agent. Es gibt wiederkehrende Kategorien, Zuständigkeiten und Ausnahmewege.
Der Agent kann Nachrichten klassifizieren, zusammenfassen, einen Verantwortlichen vorschlagen und Antwortentwürfe schreiben. Mit der Zeit entstehen Regeln: Rückerstattung mit Kontorisiko in Review, Zahlungsfehler an Payment, Sicherheitswörter nicht automatisch beantworten.
Solche Regeln als Skills zu speichern, ist sinnvoll. Ein Support-Lead sollte das Regelwerk nicht jede Woche neu in die Sitzung kopieren müssen.
Ich würde trotzdem nicht automatisch senden lassen. Klassifizierung, Zusammenfassung, Owner-Vorschlag und Entwurf sind vertretbar. Kundensendung nicht. Wenn Sicherheitsfälle als normale Fragen laufen, nicht freigegebene Policy-Sätze auftauchen oder Vertragsausnahmen ohne Owner weitergehen, stoppt der Test.
Incident Response braucht enge Rechte
Incident Response hat ebenfalls wiederkehrende Muster: Logpfade, Health Checks, Impact Notes, Rollback-Schritte, Benachrichtigungskanäle. Hermes Agent kann daraus bessere Erstdiagnosen und Checklisten machen.
Der Haken ist die Nähe zu realen Systemen. Dateien, Shell-Befehle, Neustarts, Konfigurationen, Deployments und Kundenwirkung liegen nah beieinander. Dass Hermes Sicherheitskontrollen gesondert dokumentiert, reicht als Hinweis: Terminal-, Gateway- und Adapterflächen gehören vorsichtig behandelt.
Ich würde am Anfang nur Lesen, Zusammenfassen, Checklisten und nächste Prüfungen erlauben. Neustart, Löschen, Deploy, Konfigurationsänderung und Rechteänderung brauchen Freigabe. Bei Telegram oder Discord kommen Identitätsprüfung, Befehls-Whitelist, Ausführungslog und Not-Stopp zuerst.
Nicht wählen würde ich ein Setup, bei dem jemand im Chat “prüf den Server” schreibt und der Agent im Hintergrund Befehle ausführt, ohne dass später klar ist, was passiert ist. Schnell ist das. Betriebssicher ist es nicht.
Betriebsberichte und Sales-Follow-up sind bessere Kandidaten
Betriebsberichte wiederholen sich. Dieselben Metriken, ähnliche Ausreißer, wiederkehrende Ursachen, ähnliche nächste Schritte. Hermes Agent kann Format und Prüflogik behalten.
Die Grenze ist Nachvollziehbarkeit. Eine gut geschriebene Zusammenfassung reicht nicht. Zahl, Query, Dashboard-Link, Zeitraum und Prüfer müssen mitkommen. Sonst prüft der Mensch alles erneut.
Sales-Follow-up passt ebenfalls: Kundenproblem, versprochenes Material, Owner, Timing, Risiko, nächster Schritt. Der Agent kann fehlende Felder erkennen und Entwürfe vorbereiten. Preiszusagen, Vertragsbedingungen und sensible Kundentexte bleiben beim Menschen.
Ich sehe Hermes Agent hier als assistierenden Operator. Entwurf, Lückenprüfung, nächste Aktion, Review-Notiz. Nicht als Person, die allein Zusagen verschickt.
Kosten sind mehr als API-Gebühren
Open Source heißt nicht kostenloser Betrieb. Kosten entstehen bei Modellaufrufen, Hosting, Logging, Sicherheitsprüfung, Skill-Review und Schulung der Nutzer. Pauschale Monatszahlen sind nur grobe Orientierung. Modellwahl, Eingabelänge, Wiederholungen und Tool-Nutzung verändern alles.
| Kostenfeld | Wo es entsteht | Was messen |
|---|---|---|
| Modellnutzung | Zusammenfassung, Planung, Retry, Recherche | Tokens je Aufgabe und Wiederholungen |
| Skill-Review | Automatisch erzeugte Verfahren | Freigegebene vs verworfene Skills |
| Sicherheit | Rechte, Tokens, Remote-Befehle | Whitelist und Audit-Log |
| Training | Nutzer lernen sinnvolle Anfragen | Falsche Anfragearten |
| Fehlerbehandlung | Falsche oder blockierte Läufe | Wiederherstellungszeit |
| Wartung | Modell-, Tool- und Skill-Änderungen | Monatlicher Owner-Review |
Der erste Monat ist aus meiner Sicht ein Validierungsmonat. Noch kein Einsparungsmonat.
Auswahl und Nicht-Auswahl
Hermes Agent passt, wenn Wiederholung echt ist und Risiko begrenzt werden kann.
| Situation | Entscheidung |
|---|---|
| Gleiche Anfrageart kommt jede Woche | Kandidat |
| Ergebnis wird intern geprüft | Kandidat |
| Lesen, Zusammenfassen, Entwurf, Checkliste | Hier starten |
| Systemändernde Befehle nötig | Erst Freigabe-Gates bauen |
| Kundendaten oder vertrauliche Daten enthalten | Retention und Zugriff prüfen |
| Niemand liest Skill-Dateien | Warten |
| Jeder Fall ist anders | Normaler Agent kann reichen |
| Messaging löst Runs aus | Identität und Befehlsgrenzen zuerst |
Das Gedächtnis ist die Stärke. Es kann aber auch Altlast werden.
Rollout-Reihenfolge
Ich würde bewusst langweilig starten.
- Einen wiederkehrenden Workflow auswählen.
- Dreißig echte Beispiele sammeln.
- Wiederholte Regeln aufschreiben.
- Nur Lesen, Zusammenfassen, Entwurf und Checkliste erlauben.
- Erzeugte Skills von Menschen freigeben lassen.
- Input, Output, Skill, Tool-Call und Reviewer loggen.
- Kundensendung, Löschen, Deploy und Rechteänderung blockieren.
- Nach zwei Wochen Review-Zeit, Korrekturrate, Ablehnung und Near Misses prüfen.
- Rechte nur erweitern, wenn die Zahlen besser werden.
Autonome Agenten wirken in Demos spannender. Im Betrieb ist Auditierbarkeit wichtiger.
Abbruchkriterien
Die Stoppschilder gehören vor den Start.
| Fehlsignal | Sofortmaßnahme |
|---|---|
| Menschen verstehen den Skill nicht | Skill stoppen |
| Gleiche Ausnahme schlägt wieder fehl | Ausnahme-Queue oder Skill verwerfen |
| Review-Zeit fällt nicht | Umfang verkleinern |
| Logs erklären den Lauf nicht | Rechte nicht erweitern |
| Remote-Anforderer ist unklar | Messaging-Gateway schließen |
| Shell-Befehle laufen ohne Whitelist | Produktion stoppen |
| Kundentexte werden fast komplett umgeschrieben | Betriebsregeln überarbeiten |
| Kosten steigen durch Retries | Routing und Eingabelänge ändern |
Wenn diese Kriterien nicht erfüllt sind, ist nicht automatisch Hermes Agent falsch. Dann ist der Workflow noch nicht bereit.
Praxisurteil aus dem Betrieb
Hermes Agent zeigt in eine sinnvolle Richtung. Gedächtnis, Skills und Remote-Auslösung sind Bausteine, die Automatisierung tatsächlich braucht.
Die Frage ist nicht, ob der Agent sich erinnern kann. Die Frage ist, was er behalten darf und was er daraus tun darf. Alte Regeln, riskante Befehle und ungeprüfte Skills können ebenfalls überleben.
Starten würde ich mit Support-Triage, Betriebsbericht-Entwürfen, Incident-Checklisten und Sales-Follow-up-Notizen. Ohne Skill-Freigabe, Rechtebegrenzung, Ausführungslog und Abbruchkriterien würde ich keine breite Autonomie geben.
Verwandte Guides
- Warum KI-Automatisierung in der Praxis anders wird
- Agentenrechte entwerfen
- ROI von KI-Automatisierung
Häufige Fragen
Kann Hermes Agent direkt in Produktion?
Nicht breit. Beginnen Sie mit Lesen, Zusammenfassen, Entwurf und Checklisten. Shell-Ausführung und Remote-Befehle kommen erst nach Freigabe-Gates und Logs.
Was bringt persistentes Gedächtnis praktisch?
Weniger wiederholte Erklärung. Regeln, Ausnahmen, Formate und Übergaben können in spätere Läufe mitgehen.
Was ist das größte Risiko?
Falsche Verfahren bleiben bestehen, und Tool-Rechte werden zu breit. Je mehr der Agent erinnert und ausführt, desto mehr Review braucht er.
Sind Geschwindigkeitsgewinne realistisch?
Möglich, aber nicht garantiert. Messen Sie vergleichbare Läufe, Review-Zeit, Korrekturen, Ablehnungen und Sicherheitsstopps im eigenen Ablauf.
Womit sollte man starten?
Support-Triage, Betriebsberichte, Incident-Checklisten und Sales-Follow-up sind gute erste Kandidaten. Unumkehrbare Systemaktionen und Kundenzusagen warten.
Geprüfte öffentliche Quellen
Wichtige öffentliche Seiten, die für Produktdetails, Preiskontext und Vergleichsaussagen geprüft wurden.
- Hermes Agent documentation Nous Research
- Hermes Agent quickstart Nous Research
- Hermes Agent memory feature Nous Research
- Hermes Agent skills feature Nous Research
- Hermes Agent messaging gateway Nous Research
- Hermes Agent security guide Nous Research