INDEX
Negative Logits
Fiesta
-0.08
bes
-0.07
男
-0.07
palindrome
-0.07
anne
-0.07
Craig
-0.07
Sri
-0.07
conse
-0.07
Suit
-0.07
Huck
-0.07
POSITIVE LOGITS
bureaucracy
0.11
bureaucr
0.10
бю
0.10
paperwork
0.09
jargon
0.09
手续
0.09
અટ
0.08
burocr
0.08
tasked
0.08
inertia
0.08
Activations Density 0.005%