INDEX
Negative Logits
-benar
-0.09
΄
-0.08
►
-0.08
dictated
-0.08
योग्य
-0.08
ಮ್ಮ
-0.08
constitutes
-0.08
前三
-0.08
ಬಂದಿದೆ
-0.08
(rot
-0.08
POSITIVE LOGITS
colleagues
0.13
Kap
0.10
coworkers
0.09
Xu
0.08
Patel
0.08
Capit
0.08
Singh
0.08
Smith
0.08
Salz
0.08
Sharma
0.08
Activations Density 0.009%