INDEX
Negative Logits
ังหว
-0.08
ombres
-0.06
ρών
-0.06
.todo
-0.06
映
-0.06
послуг
-0.06
सदस
-0.06
чних
-0.06
.inflate
-0.06
additive
-0.06
POSITIVE LOGITS
PASS
0.07
_symbols
0.06
pass
0.06
(max
0.06
census
0.06
кат
0.06
quarters
0.06
ськ
0.06
fen
0.06
ruling
0.06
Activations Density 0.018%