INDEX
Negative Logits
Rah
-0.09
Devon
-0.08
Ish
-0.07
Rah
-0.07
herm
-0.07
Elliot
-0.07
Laut
-0.07
玄
-0.07
કા
-0.07
Herm
-0.07
POSITIVE LOGITS
-orang
0.11
群众
0.10
dùng
0.09
-hole
0.09
-Owned
0.08
-owned
0.08
Moc
0.07
flest
0.07
who've
0.07
sain
0.07
Activations Density 0.058%