INDEX
Negative Logits
alten
-0.06
alien
-0.06
обов
-0.06
orrh
-0.06
ียบ
-0.06
伝
-0.06
ampaign
-0.06
�
-0.06
hog
-0.06
SENT
-0.06
POSITIVE LOGITS
surgeons
0.07
Friedrich
0.07
Bun
0.07
/body
0.06
Dove
0.06
Uni
0.06
uni
0.06
_BS
0.06
фун
0.06
Jays
0.06
Activations Density 0.029%