INDEX
Negative Logits
工作人员
-0.08
đảm
-0.08
સા�
-0.07
לא
-0.07
שלך
-0.07
soepel
-0.07
否
-0.07
аясь
-0.07
ột
-0.07
സി
-0.07
POSITIVE LOGITS
radians
0.11
90
0.08
ρόν
0.08
greg
0.08
倍
0.08
424
0.07
γ
0.07
�
0.07
Hind
0.07
�
0.07
Activations Density 0.003%