INDEX
Negative Logits
合作
-0.07
Textarea
-0.07
desi
-0.07
banyak
-0.06
assault
-0.06
321
-0.06
Laura
-0.06
melted
-0.06
_income
-0.06
turret
-0.06
POSITIVE LOGITS
біл
0.08
Symbols
0.07
symbol
0.07
Symbol
0.07
Đảng
0.07
버
0.06
synchronized
0.06
표
0.06
.bel
0.06
티
0.06
Activations Density 0.015%