INDEX
Negative Logits
maka
-0.07
uci
-0.07
-danger
-0.06
[test
-0.06
egreg
-0.06
-final
-0.06
les
-0.06
_anim
-0.06
Elena
-0.06
ِه
-0.06
POSITIVE LOGITS
–and
0.07
μιλος
0.07
wart
0.07
irst
0.06
Completed
0.06
FormControl
0.06
zure
0.06
?:
0.06
вол
0.06
har
0.06
Activations Density 0.001%