INDEX
Negative Logits
house
-0.07
upwards
-0.07
Liv
-0.07
arpa
-0.07
elkaar
-0.07
naughty
-0.07
ancouver
-0.07
straps
-0.07
.helper
-0.06
-0.06
POSITIVE LOGITS
evident
0.12
evidenced
0.08
τυ
0.07
إذ
0.07
_DET
0.07
.dtd
0.06
spont
0.06
ीय
0.06
Entity
0.06
جد
0.06
Activations Density 0.003%