INDEX
Negative Logits
berge
-0.08
copia
-0.08
republican
-0.08
parte
-0.08
باره
-0.08
کپ
-0.07
meer
-0.07
plicht
-0.07
úp
-0.07
Genuine
-0.07
POSITIVE LOGITS
mari
0.08
apparatuur
0.08
implied
0.08
zny
0.07
chem
0.07
Hamburger
0.07
Paused
0.07
нравится
0.07
autem
0.07
Ital
0.07
Activations Density 0.002%