INDEX
Negative Logits
slowly
-0.08
yadda
-0.08
einen
-0.07
hold
-0.07
ைத்து
-0.07
vede
-0.07
quase
-0.07
desert
-0.07
junk
-0.07
cared
-0.07
POSITIVE LOGITS
гай
0.08
Mano
0.08
cuales
0.08
буде
0.08
SAB
0.08
HOT
0.07
scriptures
0.07
Impro
0.07
жерде
0.07
ING
0.07
Activations Density 0.028%