Guardrails
Guardrails sind technische oder inhaltliche Schutzmechanismen, die verhindern, dass ein KI-System unerwünschte, unsichere oder regelwidrige Ausgaben erzeugt oder Aktionen ausführt. Sie reichen von einfachen Inhaltsfiltern bis zu strukturellen Regeln, welche Werkzeuge ein Modell überhaupt aufrufen darf.
Quelle: OpenAI — Guardrails