INDEX
Negative Logits
ynn
-0.08
ressent
-0.08
حس
-0.07
жен
-0.07
ู
-0.07
upp
-0.07
инфраструкт
-0.07
anxiety
-0.07
-0.07
üt
-0.07
POSITIVE LOGITS
contiguous
0.10
franceses
0.09
.Composite
0.08
twenty
0.08
nineteen
0.08
lattice
0.08
Glouc
0.08
centimeter
0.08
california
0.08
domino
0.08
Activations Density 0.008%