INDEX
Negative Logits
countryside
-0.07
attorneys
-0.07
hesion
-0.07
hierarchy
-0.07
Identity
-0.07
Naming
-0.07
Race
-0.07
-window
-0.07
ьи
-0.06
"in
-0.06
POSITIVE LOGITS
Qur
0.08
RR
0.07
oficial
0.06
修改
0.06
řed
0.06
улыб
0.06
.KeyEvent
0.06
در
0.06
подав
0.06
readcr
0.06
Activations Density 0.008%