INDEX
Negative Logits
reden
-0.08
mellitus
-0.08
choose
-0.08
regard
-0.07
ple
-0.07
reckon
-0.07
onderzoek
-0.07
lied
-0.07
Reciprocity
-0.07
FEATURE
-0.07
POSITIVE LOGITS
dozen
0.09
_equal
0.08
iliar
0.08
imate
0.08
대부분
0.08
妙
0.07
besten
0.07
897
0.07
Vall
0.07
περισσότερο
0.07
Activations Density 0.022%