INDEX
Negative Logits
ellips
-0.77
Handle
-0.74
Logic
-0.73
문
-0.70
ellipse
-0.69
IERS
-0.68
lium
-0.67
read
-0.67
-0.66
Про
-0.66
POSITIVE LOGITS
Amo
0.69
änien
0.67
Bonne
0.66
ニーカー
0.64
Pwd
0.63
Marche
0.62
դ
0.61
ittens
0.61
schre
0.61
cognito
0.60
Activations Density 0.065%