INDEX
Negative Logits
ogh
-0.07
qualifies
-0.07
анти
-0.07
크
-0.07
ado
-0.07
процесс
-0.07
stands
-0.07
-based
-0.07
.hm
-0.07
αιν
-0.07
POSITIVE LOGITS
anderer
0.08
colega
0.07
.ber
0.07
Brokerage
0.07
arger
0.07
bettor
0.07
bermain
0.07
那
0.07
collègues
0.07
gewohnt
0.07
Activations Density 0.129%