INDEX
Negative Logits
flowing
-0.09
néanmoins
-0.08
aza
-0.08
azas
-0.08
Adding
-0.08
แน
-0.07
ಡೆಯ
-0.07
АЗ
-0.07
"ז
-0.07
Nevertheless
-0.07
POSITIVE LOGITS
requiere
0.08
SAF
0.08
sori
0.07
individuos
0.07
YES
0.07
suna
0.07
japones
0.07
Japón
0.07
Fed
0.07
indivíduos
0.07
Activations Density 0.001%