INDEX
Negative Logits
altern
-0.87
claras
-0.86
ages
-0.85
turista
-0.85
olf
-0.84
の高
-0.84
secrétaire
-0.80
Covers
-0.78
adas
-0.77
граждан
-0.77
POSITIVE LOGITS
Shakespeare
1.41
Shakespeare
1.14
jednoduch
1.02
ondissement
0.96
stown
0.95
Wordsworth
0.93
imte
0.93
Ruto
0.88
Ergebnisse
0.86
implementación
0.85
Activations Density 0.028%