INDEX
Negative Logits
Attr
-0.07
factions
-0.07
léka
-0.06
всіх
-0.06
Corp
-0.06
ance
-0.06
caucus
-0.06
supers
-0.06
Atkins
-0.06
GBP
-0.06
POSITIVE LOGITS
!)↵↵
0.07
ated
0.07
olume
0.07
,copy
0.06
systematically
0.06
parachute
0.06
Public
0.06
وجد
0.06
очевид
0.06
_example
0.06
Activations Density 0.000%