INDEX
Negative Logits
üzerinde
-0.07
传
-0.07
傳
-0.07
retorno
-0.07
넘어
-0.07
外
-0.07
ाओं
-0.07
Hindu
-0.07
***
-0.07
inir
-0.07
POSITIVE LOGITS
-alone
0.11
Alone
0.11
alone
0.09
puissant
0.09
alleine
0.09
-assisted
0.09
malfunction
0.09
ituksen
0.09
kontrib
0.09
.emit
0.09
Activations Density 0.022%