INDEX
Negative Logits
sufficient
-0.08
apparatus
-0.08
ausreich
-0.07
Then
-0.07
insufficient
-0.07
killed
-0.07
ATURE
-0.07
심
-0.07
Ok
-0.07
.birth
-0.07
POSITIVE LOGITS
lih
0.09
Alternatives
0.09
alternatief
0.09
monopoly
0.08
gamitin
0.08
równie
0.08
llama
0.08
подум
0.08
सकता
0.08
chal
0.08
Activations Density 0.054%