INDEX
Negative Logits
Vit
-0.07
Tur
-0.07
saged
-0.07
concerne
-0.07
મળ
-0.07
Od
-0.07
(work
-0.07
pamwe
-0.07
Vit
-0.07
Od
-0.07
POSITIVE LOGITS
've
0.11
يم
0.09
rope
0.09
Lah
0.08
Revis
0.08
coinc
0.08
Yin
0.08
beispielsweise
0.08
realistically
0.07
peligro
0.07
Activations Density 0.112%