INDEX
Negative Logits
Freight
-0.08
宣
-0.08
prag
-0.07
ולכן
-0.07
宣
-0.07
Atkins
-0.07
appropri
-0.07
बयान
-0.07
ibintu
-0.07
इस्तेमाल
-0.07
POSITIVE LOGITS
Cum
0.08
zame
0.08
Cum
0.08
idores
0.08
PLA
0.08
.ta
0.08
(blank
0.07
practicing
0.07
'aka
0.07
стал
0.07
Activations Density 0.011%