INDEX
Negative Logits
(?)
-0.08
trú
-0.08
reciproc
-0.08
Hole
-0.08
Chester
-0.08
mellitus
-0.07
PHONE
-0.07
Coron
-0.07
ിനു
-0.07
судеб
-0.07
POSITIVE LOGITS
heed
0.08
något
0.08
lut
0.08
Hi
0.07
rele
0.07
tym
0.07
fre
0.07
敦
0.07
Tale
0.07
Phys
0.07
Activations Density 0.032%