INDEX
Negative Logits
hai
-0.08
gets
-0.08
wsp
-0.07
wake
-0.07
Lip
-0.07
्चर
-0.07
কার
-0.07
pois
-0.07
wil
-0.07
mud
-0.07
POSITIVE LOGITS
-speaking
0.11
GLISH
0.10
IRONMENT
0.09
interne
0.09
-language
0.08
Scholar
0.08
0.08
公
0.08
leaning
0.07
Valle
0.07
Activations Density 0.023%