INDEX
Negative Logits
Belg
-0.08
somehow
-0.08
Fact
-0.08
_RGB
-0.08
James
-0.07
Ass
-0.07
vibe
-0.07
Ram
-0.07
ram
-0.07
Ва
-0.07
POSITIVE LOGITS
colocado
0.10
coloque
0.09
meistens
0.09
meist
0.09
preceded
0.09
meestal
0.09
בהתאם
0.09
You'll
0.09
מפר
0.09
자는
0.08
Activations Density 0.017%