INDEX
Negative Logits
"c
-0.07
ingin
-0.07
μπο
-0.06
.FromResult
-0.06
iT
-0.06
vant
-0.06
writings
-0.06
تكون
-0.06
.Tool
-0.06
hobbies
-0.06
POSITIVE LOGITS
Sent
0.07
Spart
0.07
growth
0.07
subt
0.07
вели
0.07
phosphate
0.06
(ax
0.06
Sent
0.06
Locke
0.06
Salman
0.06
Activations Density 0.002%