INDEX
Negative Logits
vidare
-0.08
(letter
-0.08
tud
-0.08
לים
-0.08
לה
-0.08
marx
-0.07
Employment
-0.07
plutôt
-0.07
employment
-0.07
threads
-0.07
POSITIVE LOGITS
слишком
0.14
demasi
0.12
Too
0.11
overly
0.11
מדי
0.11
terlalu
0.11
too
0.11
too
0.10
excessive
0.10
unrealistic
0.10
Activations Density 0.134%