INDEX
Negative Logits
slit
-0.08
salient
-0.08
.Move
-0.08
sad
-0.07
_MASK
-0.07
तम
-0.07
制服
-0.07
威
-0.07
Sad
-0.07
wani
-0.07
POSITIVE LOGITS
объяв
0.08
окруж
0.08
Syntax
0.08
declarations
0.08
nera
0.08
contenant
0.08
ивание
0.08
declaration
0.07
underscore
0.07
선언
0.07
Activations Density 0.007%