INDEX
Negative Logits
immun
-0.06
(xhr
-0.06
elas
-0.06
Surface
-0.06
_logged
-0.06
aded
-0.06
_ABC
-0.06
-0.06
funktion
-0.06
michael
-0.06
POSITIVE LOGITS
गई
0.07
образ
0.07
.edu
0.06
розрах
0.06
indr
0.06
ватися
0.06
_STRUCT
0.06
-elected
0.06
引
0.06
verbally
0.06
Activations Density 0.005%