INDEX
Negative Logits
RITE
-0.07
ubre
-0.07
таких
-0.07
ього
-0.06
گوی
-0.06
моз
-0.06
itarian
-0.06
Char
-0.06
decode
-0.06
-lite
-0.06
POSITIVE LOGITS
عضو
0.07
rů
0.06
충
0.06
Hannah
0.06
istribution
0.06
.progressBar
0.06
-ind
0.06
martin
0.06
-normal
0.06
Manny
0.06
Activations Density 0.010%