Alignment
Alignment beschreibt die Ausrichtung eines KI-Systems auf die Absichten, Werte und Sicherheitsanforderungen der Menschen, die es einsetzen — im Gegensatz zu einem Modell, das zwar leistungsfähig, aber unvorhersehbar oder unerwünscht handelt. Es ist ein zentrales Forschungsfeld der KI-Sicherheit.