INDEX
Negative Logits
κα
-0.08
antu
-0.07
conse
-0.07
cerc
-0.07
ંત્ર
-0.07
merit
-0.07
Sb
-0.07
mer
-0.07
.rollback
-0.07
prima
-0.07
POSITIVE LOGITS
тех
0.08
дання
0.08
culares
0.08
ously
0.08
სახ
0.08
dynasty
0.07
那
0.07
dad
0.07
they'd
0.07
0.07
Activations Density 0.104%