INDEX
Negative Logits
connaissent
-0.09
посвящ
-0.09
BOOL
-0.08
dalej
-0.08
знают
-0.08
တြက္
-0.08
suelen
-0.08
conocen
-0.08
consent
-0.08
_VERIFY
-0.08
POSITIVE LOGITS
ahara
0.08
rebellious
0.08
-ir
0.07
evoc
0.07
Asia
0.07
irrational
0.07
attack
0.07
irregular
0.07
zig
0.07
attack
0.07
Activations Density 0.007%