INDEX
Negative Logits
罪
-0.07
auss
-0.06
ouce
-0.06
районе
-0.06
surface
-0.06
Constructed
-0.06
изб
-0.06
insults
-0.06
.cgi
-0.06
tracted
-0.06
POSITIVE LOGITS
Hop
0.07
With
0.07
isOk
0.07
HE
0.07
Driver
0.06
ORT
0.06
T
0.06
فة
0.06
ion
0.06
manifesto
0.06
Activations Density 0.000%