INDEX
Negative Logits
eligible
-0.08
BOTH
-0.08
Versicher
-0.08
Integrity
-0.08
Dí
-0.08
Ад
-0.08
insula
-0.08
aforementioned
-0.08
Ε
-0.08
Ε
-0.08
POSITIVE LOGITS
explain
0.09
п
0.08
advise
0.08
936
0.07
кең
0.07
menehi
0.07
explicar
0.07
culin
0.07
iach
0.07
conseiller
0.07
Activations Density 0.039%