INDEX
Negative Logits
níkem
-0.08
('?-0.07
drive
-0.07
Character
-0.06
ắt
-0.06
JC
-0.06
doubts
-0.06
своей
-0.06
Jo
-0.06
->{_-0.06
POSITIVE LOGITS
clique
0.07
tol
0.06
scar
0.06
переп
0.06
cep
0.06
910
0.06
.we
0.06
autor
0.06
detach
0.06
bush
0.06
Activations Density 0.010%