INDEX
Negative Logits
affaires
-0.08
dance
-0.08
过去
-0.08
δο
-0.08
antigu
-0.08
്റ
-0.08
“大
-0.08
יין
-0.08
ം
-0.08
nopeasti
-0.08
POSITIVE LOGITS
ifting
0.08
servings
0.08
ift
0.08
lifting
0.08
tabs
0.07
labels
0.07
stanov
0.07
постав
0.07
lbl
0.07
সার
0.07
Activations Density 0.004%