INDEX
Negative Logits
WIN
-0.06
archive
-0.06
(ignore
-0.06
SU
-0.06
_:
-0.06
’,
-0.06
人民共和国
-0.06
třídy
-0.06
IZATION
-0.06
زینه
-0.06
POSITIVE LOGITS
gek
0.07
corr
0.07
gfx
0.06
[prop
0.06
provinc
0.06
Married
0.06
stranger
0.06
Heb
0.06
�
0.06
باش
0.06
Activations Density 0.006%