INDEX
Negative Logits
masterpiece
-0.08
which
-0.08
awulo
-0.07
Which
-0.07
िक
-0.07
carton
-0.07
समाज
-0.07
Standalone
-0.07
Notre
-0.07
Karte
-0.07
POSITIVE LOGITS
wijn
0.07
şk
0.07
factual
0.07
stemming
0.07
iei
0.07
donne
0.07
gask
0.07
skall
0.07
plantes
0.07
zp
0.07
Activations Density 0.002%