INDEX
Negative Logits
podr
-0.08
black
-0.07
cas
-0.07
Dale
-0.07
ur
-0.07
য়
-0.07
demonstrates
-0.07
avant
-0.07
dan
-0.07
Near
-0.07
POSITIVE LOGITS
moll
0.08
ので
0.08
�
0.08
auk
0.08
人成
0.08
haben
0.08
Cos
0.08
Costa
0.08
demean
0.08
höchste
0.07
Activations Density 0.047%