Kurzantwort

Hermes Agent ist ein Open-Source-Agent, der mit sitzungsübergreifendem Gedächtnis und wiederverwendbaren Skill-Dateien arbeitet. Das passt zu echter Automatisierung, verlangt aber klare Grenzen für Shell-Zugriff, Messaging-Gateways, Skill-Freigaben, Audit-Logs und menschliche Prüfung.

Wichtigste Punkte
  • Hermes Agent ist interessant, weil Arbeitsmuster über Sitzungen hinweg erhalten bleiben können.
  • Zahlen zu wiederholten Geschwindigkeitsgewinnen sind ein Anlass zum Testen, aber kein allgemeines Versprechen.
  • Support-Triage, Incident-Checklisten, Betriebsberichte und Sales-Follow-up sind bessere Startpunkte als riskante Ausführung.
  • Terminalzugriff, Remote-Messaging und automatisch geschriebene Skills brauchen Rechtebegrenzung und Review-Logs.
  • Vor mehr Autonomie sollten mindestens 30 vergleichbare Durchläufe mit Bearbeitungszeit, Korrekturen und Abbrüchen gemessen werden.
Geeignet für
Service-Planer, Operations-Verantwortliche und Automatisierungsverantwortliche, die persistente KI-Agenten für wiederkehrende Arbeit prüfen.
Thema
Automatisierung
Zuletzt geprüft
15. Juni 2026
Behandelte Tools

Workflow-Snapshot

Eine kompakte Karte, um diesen Guide in einen Automationsablauf zu übersetzen.

  1. 01 Input

    Kläre zuerst die wiederkehrende Aufgabe, benötigte Daten, Verantwortliche und Erfolgskriterien.

  2. 02 KI-Schritt

    Setze KI dort ein, wo Entwurf, Sortierung, Zusammenfassung, Routing oder Tool-Aufrufe klar begrenzt sind.

  3. 03 Menschliche Prüfung

    Genehmigungen, Ausnahmen, Kostenlimits und sensible Entscheidungen bleiben in menschlicher Prüfung.

  4. 04 Ergebnis

    Überführe das Ergebnis in eine Checkliste, gespeicherte Prompts, eine SOP oder einen überwachten Automationslauf.

Fokuspunkte
  • Hermes Agent
  • KI-Agent
  • KI-Automatisierung
  • persistentes Gedächtnis
  • Skill-Dateien
Diagramm eines persistenten KI-Agenten, bei dem wiederholte Sitzungen in Gedächtnis und Skill-Karten übergehen und zurück zur menschlichen Prüfung führen
Bei Hermes Agent zählt nicht nur, dass der Agent sich erinnert. Entscheidend ist, was er behält, wer es freigibt und welche Rechte in die nächste Ausführung mitgehen.

Operative Notiz

Erst prüfen, ob das Tool zum Arbeitsablauf passt.

Wenn Input, Freigabepunkt und Fehlerprotokoll unklar sind, beschleunigt Automatisierung nur die Verwirrung.

Entscheidungspunkt

Wo ist das Tool vertrauenswürdig, wo braucht es Kontrolle, wo stoppt es?

Hilft Automatisierungsverantwortlichen zu entscheiden, ob Hermes Agent für wiederholte Betriebsarbeit geeignet ist und wo Gedächtnis, Skills und Remote-Ausführung begrenzt werden müssen.

Unterlagen prüfen

6 Geprüfte öffentliche Quellen

Prüfen Sie veränderliche Funktionen und Preise über die verlinkten Quellen und offiziellen Seiten.

Erster Schritt

Vergleiche

Starten Sie mit einem kleinen Pilotlauf und erweitern Sie erst, wenn der Prüfpunkt klar ist.

Was vor dem Rollout klar sein muss
  • Hermes Agent ist interessant, weil Arbeitsmuster über Sitzungen hinweg erhalten bleiben können.
  • Zahlen zu wiederholten Geschwindigkeitsgewinnen sind ein Anlass zum Testen, aber kein allgemeines Versprechen.
  • Support-Triage, Incident-Checklisten, Betriebsberichte und Sales-Follow-up sind bessere Startpunkte als riskante Ausführung.
  • Terminalzugriff, Remote-Messaging und automatisch geschriebene Skills brauchen Rechtebegrenzung und Review-Logs.

Workflow-Pfad

Wo dieser Guide einzuordnen ist

Dieser Abschnitt verbindet den aktuellen Guide mit dem größeren Workflow, den er unterstützt.

Tool-Stack-Entscheidungen Den Stack wählen, der zur operativen Reife des Teams passt.

Ein Pfad zum Vergleich von Automationsplattformen, App-Buildern, Agent-Buildern, Buchhaltungstools und KI-Assistenten.

Workflow-Pfad öffnen
Passt gut für
Teams zwischen einfachem Toolkauf, internem Workflow-Aufbau und breiter Plattformentscheidung
Weniger passend, wenn
Du erwartest einen vollständigen Praxistest für ein einzelnes Tool statt Kriterien für Workflow-Fit.

Nach ein paar Tagen mit KI-Agenten fällt oft nicht die Modellleistung als erstes auf. Es ist die Wiederholung. Man erklärt wieder die Ordnerstruktur, wieder die Ausnahmefälle, wieder das gewünschte Format und wieder die Stellen, an denen der Agent vorsichtig sein soll.

Hermes Agent ist deshalb interessant, weil es genau an dieser Stelle ansetzt. Der Agent soll Gedächtnis über Sitzungen hinweg behalten, wiederkehrende Muster in Skill-Dateien ablegen und diese beim nächsten ähnlichen Auftrag wiederverwenden. Für Automatisierung ist das keine kleine Komfortfunktion. Es geht darum, ob Arbeitswissen aus einzelnen Sessions heraus in einen wiederverwendbaren Ablauf kommt.

Ich prüfe solche Werkzeuge zuerst nicht nach der Demo, sondern nach den Grenzen. Gedächtnis ist nützlich, aber falsche Regeln können ebenfalls bleiben. Automatisch erzeugte Skills sind nützlich, aber jemand muss sie freigeben. Wenn dazu Shell-Zugriff und Messaging-Gateways kommen, ist das kein reiner Chat-Assistent mehr, sondern eine Betriebsfläche.

Warum Gedächtnis über Sitzungen hinweg zählt

Viele KI-Werkzeuge arbeiten weiterhin in einer Sitzung. Bei leichter ChatGPT- oder Claude-Nutzung endet die Unterhaltung, der Kontext bricht ab, und beim nächsten Lauf beginnt die Erklärung oft von vorne. Für Experimente ist das in Ordnung. Für wiederkehrende Arbeit ist es teuer.

Nehmen wir Support-Triage. Am ersten Tag wird in Rückerstattung, Störung, Vertrag, Produktfrage und Konto eingeteilt. Später kommt hinzu, dass VIP-Rückerstattungen nicht automatisch beantwortet werden. Danach kommt hinzu, dass Sicherheitsbegriffe in eine Review-Queue gehen. Wenn diese Regeln jedes Mal wieder in den Prompt müssen, bleibt die Automatisierung an der Person hängen.

Persistentes Gedächtnis kann hier helfen. Es kann Regeln, Formate und Ausnahmewege über mehrere Läufe tragen. Die wichtige Frage lautet dann aber: Wer darf diese Erinnerung ändern, löschen oder auf eine andere Aufgabe anwenden?

Was Hermes Agent speichern will

Die Hermes-Agent-Dokumentation beschreibt ein System aus Gedächtnis, Skills, Tools und Messaging.

BausteinNutzen im BetriebVorher klären
Persistentes GedächtnisWeniger wiederholte Erklärung von Kontext und RegelnWie falsche oder alte Erinnerungen entfernt werden
Skill-DateienWiederkehrende Abläufe werden wiederverwendbarWer den Ablauf freigibt
Tool-AusführungDer Agent kann Dateien und Befehle nutzenWelche Aktionen erlaubt sind
MessagingTelegram oder Discord können Arbeit auslösenIdentität, Rechte und erlaubte Befehle
Open SourceTeams können prüfen und anpassenUpdates und Härtung bleiben Betreiberaufgabe
MusterlernenÄhnliche Arbeit kann stabiler werdenBei wenig Wiederholung ist der Effekt begrenzt

Der Unterschied zu einem normalen Assistenten liegt nicht in einem schöneren Chatfenster. Der Unterschied liegt darin, dass Arbeitsweisen erhalten bleiben.

Geschwindigkeitszahlen vorsichtig lesen

The New Stack und andere Vergleiche zu persistenten Agenten sprechen von möglichen Geschwindigkeitsgewinnen bei wiederholter Arbeit. Die häufig genannte 40-Prozent-Zahl würde ich nicht als allgemeines Benchmark-Versprechen verwenden. Dafür fehlen in öffentlichen Vergleichen oft Task-Setup, Wiederholungszahl, Review-Zeit und Fehlerbehandlung.

Die Richtung ist trotzdem plausibel. Wenn ein Agent nicht jedes Mal bei null beginnt, kann ähnliche Arbeit schneller werden. Für den Betrieb zählt aber, ob auch die menschliche Prüfung kürzer wird.

MetrikWarum sie zähltGutes Signal
30 vergleichbare LäufeSkill-Effekte brauchen WiederholungNicht aus wenigen Tests entscheiden
Zeit nach dem zehnten LaufAnfangseffekte herausrechnenAusführung und Review werden kürzer
Menschlich korrigierte SkillsZeigt Qualität der erzeugten VerfahrenKritische Skills sind freigegeben
Abgelehnte ErgebnisseGeschwindigkeit ohne Qualität hilft nichtAblehnungsrate steigt nicht
Blockierte RisikoaktionenAgenten müssen stoppen könnenBlockgründe stehen im Log
Zeitpunkt der FreigabeMenschliche Prüfung muss vor Wirkung passierenReview vor Kunden- oder Systemwirkung

Ich würde also nicht die Prozentzahl verkaufen, sondern den eigenen Review-Aufwand messen.

Support-Triage ist ein realistischer Startpunkt

Support-Triage passt gut zu Hermes Agent. Es gibt wiederkehrende Kategorien, Zuständigkeiten und Ausnahmewege.

Der Agent kann Nachrichten klassifizieren, zusammenfassen, einen Verantwortlichen vorschlagen und Antwortentwürfe schreiben. Mit der Zeit entstehen Regeln: Rückerstattung mit Kontorisiko in Review, Zahlungsfehler an Payment, Sicherheitswörter nicht automatisch beantworten.

Solche Regeln als Skills zu speichern, ist sinnvoll. Ein Support-Lead sollte das Regelwerk nicht jede Woche neu in die Sitzung kopieren müssen.

Ich würde trotzdem nicht automatisch senden lassen. Klassifizierung, Zusammenfassung, Owner-Vorschlag und Entwurf sind vertretbar. Kundensendung nicht. Wenn Sicherheitsfälle als normale Fragen laufen, nicht freigegebene Policy-Sätze auftauchen oder Vertragsausnahmen ohne Owner weitergehen, stoppt der Test.

Incident Response braucht enge Rechte

Incident Response hat ebenfalls wiederkehrende Muster: Logpfade, Health Checks, Impact Notes, Rollback-Schritte, Benachrichtigungskanäle. Hermes Agent kann daraus bessere Erstdiagnosen und Checklisten machen.

Der Haken ist die Nähe zu realen Systemen. Dateien, Shell-Befehle, Neustarts, Konfigurationen, Deployments und Kundenwirkung liegen nah beieinander. Dass Hermes Sicherheitskontrollen gesondert dokumentiert, reicht als Hinweis: Terminal-, Gateway- und Adapterflächen gehören vorsichtig behandelt.

Ich würde am Anfang nur Lesen, Zusammenfassen, Checklisten und nächste Prüfungen erlauben. Neustart, Löschen, Deploy, Konfigurationsänderung und Rechteänderung brauchen Freigabe. Bei Telegram oder Discord kommen Identitätsprüfung, Befehls-Whitelist, Ausführungslog und Not-Stopp zuerst.

Nicht wählen würde ich ein Setup, bei dem jemand im Chat “prüf den Server” schreibt und der Agent im Hintergrund Befehle ausführt, ohne dass später klar ist, was passiert ist. Schnell ist das. Betriebssicher ist es nicht.

Betriebsberichte und Sales-Follow-up sind bessere Kandidaten

Betriebsberichte wiederholen sich. Dieselben Metriken, ähnliche Ausreißer, wiederkehrende Ursachen, ähnliche nächste Schritte. Hermes Agent kann Format und Prüflogik behalten.

Die Grenze ist Nachvollziehbarkeit. Eine gut geschriebene Zusammenfassung reicht nicht. Zahl, Query, Dashboard-Link, Zeitraum und Prüfer müssen mitkommen. Sonst prüft der Mensch alles erneut.

Sales-Follow-up passt ebenfalls: Kundenproblem, versprochenes Material, Owner, Timing, Risiko, nächster Schritt. Der Agent kann fehlende Felder erkennen und Entwürfe vorbereiten. Preiszusagen, Vertragsbedingungen und sensible Kundentexte bleiben beim Menschen.

Ich sehe Hermes Agent hier als assistierenden Operator. Entwurf, Lückenprüfung, nächste Aktion, Review-Notiz. Nicht als Person, die allein Zusagen verschickt.

Kosten sind mehr als API-Gebühren

Open Source heißt nicht kostenloser Betrieb. Kosten entstehen bei Modellaufrufen, Hosting, Logging, Sicherheitsprüfung, Skill-Review und Schulung der Nutzer. Pauschale Monatszahlen sind nur grobe Orientierung. Modellwahl, Eingabelänge, Wiederholungen und Tool-Nutzung verändern alles.

KostenfeldWo es entstehtWas messen
ModellnutzungZusammenfassung, Planung, Retry, RechercheTokens je Aufgabe und Wiederholungen
Skill-ReviewAutomatisch erzeugte VerfahrenFreigegebene vs verworfene Skills
SicherheitRechte, Tokens, Remote-BefehleWhitelist und Audit-Log
TrainingNutzer lernen sinnvolle AnfragenFalsche Anfragearten
FehlerbehandlungFalsche oder blockierte LäufeWiederherstellungszeit
WartungModell-, Tool- und Skill-ÄnderungenMonatlicher Owner-Review

Der erste Monat ist aus meiner Sicht ein Validierungsmonat. Noch kein Einsparungsmonat.

Auswahl und Nicht-Auswahl

Hermes Agent passt, wenn Wiederholung echt ist und Risiko begrenzt werden kann.

SituationEntscheidung
Gleiche Anfrageart kommt jede WocheKandidat
Ergebnis wird intern geprüftKandidat
Lesen, Zusammenfassen, Entwurf, ChecklisteHier starten
Systemändernde Befehle nötigErst Freigabe-Gates bauen
Kundendaten oder vertrauliche Daten enthaltenRetention und Zugriff prüfen
Niemand liest Skill-DateienWarten
Jeder Fall ist andersNormaler Agent kann reichen
Messaging löst Runs ausIdentität und Befehlsgrenzen zuerst

Das Gedächtnis ist die Stärke. Es kann aber auch Altlast werden.

Rollout-Reihenfolge

Ich würde bewusst langweilig starten.

  1. Einen wiederkehrenden Workflow auswählen.
  2. Dreißig echte Beispiele sammeln.
  3. Wiederholte Regeln aufschreiben.
  4. Nur Lesen, Zusammenfassen, Entwurf und Checkliste erlauben.
  5. Erzeugte Skills von Menschen freigeben lassen.
  6. Input, Output, Skill, Tool-Call und Reviewer loggen.
  7. Kundensendung, Löschen, Deploy und Rechteänderung blockieren.
  8. Nach zwei Wochen Review-Zeit, Korrekturrate, Ablehnung und Near Misses prüfen.
  9. Rechte nur erweitern, wenn die Zahlen besser werden.

Autonome Agenten wirken in Demos spannender. Im Betrieb ist Auditierbarkeit wichtiger.

Abbruchkriterien

Die Stoppschilder gehören vor den Start.

FehlsignalSofortmaßnahme
Menschen verstehen den Skill nichtSkill stoppen
Gleiche Ausnahme schlägt wieder fehlAusnahme-Queue oder Skill verwerfen
Review-Zeit fällt nichtUmfang verkleinern
Logs erklären den Lauf nichtRechte nicht erweitern
Remote-Anforderer ist unklarMessaging-Gateway schließen
Shell-Befehle laufen ohne WhitelistProduktion stoppen
Kundentexte werden fast komplett umgeschriebenBetriebsregeln überarbeiten
Kosten steigen durch RetriesRouting und Eingabelänge ändern

Wenn diese Kriterien nicht erfüllt sind, ist nicht automatisch Hermes Agent falsch. Dann ist der Workflow noch nicht bereit.

Praxisurteil aus dem Betrieb

Hermes Agent zeigt in eine sinnvolle Richtung. Gedächtnis, Skills und Remote-Auslösung sind Bausteine, die Automatisierung tatsächlich braucht.

Die Frage ist nicht, ob der Agent sich erinnern kann. Die Frage ist, was er behalten darf und was er daraus tun darf. Alte Regeln, riskante Befehle und ungeprüfte Skills können ebenfalls überleben.

Starten würde ich mit Support-Triage, Betriebsbericht-Entwürfen, Incident-Checklisten und Sales-Follow-up-Notizen. Ohne Skill-Freigabe, Rechtebegrenzung, Ausführungslog und Abbruchkriterien würde ich keine breite Autonomie geben.

Verwandte Guides

Häufige Fragen

Kann Hermes Agent direkt in Produktion?

Nicht breit. Beginnen Sie mit Lesen, Zusammenfassen, Entwurf und Checklisten. Shell-Ausführung und Remote-Befehle kommen erst nach Freigabe-Gates und Logs.

Was bringt persistentes Gedächtnis praktisch?

Weniger wiederholte Erklärung. Regeln, Ausnahmen, Formate und Übergaben können in spätere Läufe mitgehen.

Was ist das größte Risiko?

Falsche Verfahren bleiben bestehen, und Tool-Rechte werden zu breit. Je mehr der Agent erinnert und ausführt, desto mehr Review braucht er.

Sind Geschwindigkeitsgewinne realistisch?

Möglich, aber nicht garantiert. Messen Sie vergleichbare Läufe, Review-Zeit, Korrekturen, Ablehnungen und Sicherheitsstopps im eigenen Ablauf.

Womit sollte man starten?

Support-Triage, Betriebsberichte, Incident-Checklisten und Sales-Follow-up sind gute erste Kandidaten. Unumkehrbare Systemaktionen und Kundenzusagen warten.

Geprüfte öffentliche Quellen

Wichtige öffentliche Seiten, die für Produktdetails, Preiskontext und Vergleichsaussagen geprüft wurden.

Nächster Schritt

Aus diesem Leitfaden eine operative Checkliste machen.

Nutze zuerst den Ressourcenpfad zur Prüfung des Workflows und vergleiche Tools erst, wenn Prozess und Übergabepunkte klar sind.