INDEX
Negative Logits
laid
-0.08
===========================================================================
-0.08
angepasst
-0.08
UH
-0.08
etud
-0.08
Housewives
-0.08
героя
-0.07
HEET
-0.07
empresarios
-0.07
gestaltung
-0.07
POSITIVE LOGITS
successive
0.09
stop
0.09
falt
0.08
_stop
0.08
_tokens
0.08
stopp
0.08
-stop
0.08
.Stop
0.08
apag
0.08
logout
0.08
Activations Density 0.018%