INDEX
Negative Logits
:y
-0.09
তথ
-0.07
companh
-0.07
spre
-0.07
tig
-0.07
Individ
-0.07
koş
-0.07
verandert
-0.07
そこで
-0.07
invas
-0.07
POSITIVE LOGITS
lots
0.07
yes
0.07
interpersonal
0.07
Hari
0.07
Philharm
0.07
ера
0.07
heavy
0.07
अवसर
0.07
blocs
0.07
Blocks
0.07
Activations Density 0.050%