INDEX
Negative Logits
њ
-0.08
NAS
-0.08
ն
-0.08
letion
-0.08
něj
-0.07
)o
-0.07
compromet
-0.07
proteg
-0.07
$o
-0.07
tuig
-0.07
POSITIVE LOGITS
boh
0.07
insure
0.07
Berl
0.07
chodzi
0.07
ീത
0.07
pourront
0.07
13
0.07
alleged
0.07
ahl
0.07
voluntarily
0.06
Activations Density 0.074%