Das KI-Lexikon KI-Grundbegriffe

Alignment

Alignment beschreibt die Ausrichtung eines KI-Systems auf die Absichten, Werte und Sicherheitsanforderungen der Menschen, die es einsetzen — im Gegensatz zu einem Modell, das zwar leistungsfähig, aber unvorhersehbar oder unerwünscht handelt. Es ist ein zentrales Forschungsfeld der KI-Sicherheit.

Quelle: Anthropic — Core views on AI safety

← Zurück zum Lexikon