INDEX
Negative Logits
nsh
-0.09
ismen
-0.08
beisp
-0.08
Thorough
-0.08
programm
-0.07
Fixture
-0.07
yine
-0.07
thorough
-0.07
flair
-0.07
né
-0.07
POSITIVE LOGITS
subtle
0.08
permanecer
0.08
confiar
0.08
प्रतिब
0.07
ov
0.07
لمات
0.07
"?
0.07
satisfe
0.07
छन्
0.07
দান
0.07
Activations Density 0.036%