INDEX
Negative Logits
phys
-0.08
איך
-0.08
.pol
-0.08
Wege
-0.07
urger
-0.07
-р
-0.07
violent
-0.07
sober
-0.07
tri
-0.07
Largo
-0.07
POSITIVE LOGITS
revers
0.08
掃
0.07
swaps
0.07
yoy
0.07
possa
0.07
Swap
0.07
მართ
0.07
reverse
0.07
tasi
0.07
casecmp
0.07
Activations Density 0.006%