INDEX
Negative Logits
leva
-0.08
playing
-0.08
—a
-0.08
idir
-0.08
Qs
-0.07
table
-0.07
,f
-0.07
As
-0.07
stdio
-0.07
[f
-0.07
POSITIVE LOGITS
નથી
0.09
сначала
0.09
inye
0.08
спер
0.08
நேர
0.08
iny
0.08
Willie
0.08
tijden
0.08
Mohamed
0.08
Sara
0.07
Activations Density 0.000%