INDEX
Negative Logits
רא
-0.09
CHASE
-0.09
hund
-0.08
slaan
-0.08
ermine
-0.08
ptus
-0.08
लिए
-0.08
Diff
-0.07
Nürn
-0.07
Dud
-0.07
POSITIVE LOGITS
spicy
0.08
0.08
comma
0.08
さら
0.08
Comma
0.07
diary
0.07
.direct
0.07
divider
0.07
asar
0.07
إد
0.07
Activations Density 0.013%