INDEX
Negative Logits
הול
-0.08
అడ
-0.08
.telegram
-0.08
مبت
-0.08
Tack
-0.08
SON
-0.08
Wick
-0.07
نف
-0.07
jihad
-0.07
dž
-0.07
POSITIVE LOGITS
grasses
0.08
Carolina
0.08
halb
0.08
Shawn
0.07
Federal
0.07
semi
0.07
.act
0.07
prescribed
0.07
Semi
0.07
辞
0.07
Activations Density 0.000%