INDEX
Negative Logits
weak
-0.08
Л
-0.08
susceptible
-0.07
irector
-0.07
than
-0.07
'était
-0.07
ugar
-0.07
done
-0.07
-eslint
-0.07
Tahoe
-0.07
POSITIVE LOGITS
הבר
0.09
hos
0.07
惋
0.07
痤
0.07
urz
0.07
גד
0.07
NTN
0.07
CGI
0.07
חר
0.07
主力军
0.06
Activations Density 0.042%