INDEX
Negative Logits
borderline
-0.08
TAB
-0.08
addon
-0.08
moz
-0.08
pamam
-0.08
baño
-0.07
เรียน
-0.07
론
-0.07
లేదు
-0.07
Therap
-0.07
POSITIVE LOGITS
tratt
0.08
尖
0.08
�
0.08
Ik
0.07
comb
0.07
袋
0.07
958
0.07
Lauf
0.07
Versuch
0.07
.tr
0.07
Activations Density 0.003%