INDEX
Negative Logits
mistake
-0.08
amu
-0.07
gan
-0.07
Gan
-0.07
soap
-0.07
puzzle
-0.07
.Tr
-0.07
उ
-0.07
очный
-0.07
acrit
-0.07
POSITIVE LOGITS
يق
0.08
يف
0.08
Stell
0.08
يص
0.08
实践
0.08
Sou
0.07
ESA
0.07
статье
0.07
Bezug
0.07
ಗೆ
0.07
Activations Density 0.008%