INDEX
Negative Logits
Paren
-0.07
raison
-0.06
War
-0.06
學院
-0.06
Tanrı
-0.06
تبال
-0.06
党
-0.06
_party
-0.06
Quad
-0.06
.rpc
-0.06
POSITIVE LOGITS
subtitle
0.07
(gr
0.07
freezing
0.07
estli
0.07
adjustments
0.06
жит
0.06
specially
0.06
activity
0.06
さい
0.06
_foot
0.06
Activations Density 0.000%