INDEX
Negative Logits
_receive
-0.08
reciben
-0.08
təmin
-0.08
Histor
-0.08
rí
-0.08
لگ
-0.07
concili
-0.07
Gé
-0.07
recib
-0.07
recibió
-0.07
POSITIVE LOGITS
sewage
0.08
binder
0.08
cups
0.08
speech
0.07
.player
0.07
Ashley
0.07
.repository
0.07
Phrase
0.07
pam
0.07
Aurora
0.07
Activations Density 0.082%