INDEX
Negative Logits
superior
-0.08
Superior
-0.07
-0.07
Superior
-0.07
chopping
-0.07
handling
-0.07
ell
-0.07
-0.07
RG
-0.07
superiores
-0.07
POSITIVE LOGITS
peacefully
0.14
détente
0.13
concili
0.13
amic
0.12
rapproche
0.12
coexist
0.12
eingeladen
0.12
שלום
0.12
reconciliation
0.12
reconc
0.12
Activations Density 0.124%