INDEX
Negative Logits
824
-0.07
Qu
-0.06
будів
-0.06
798
-0.06
šetř
-0.06
Ödül
-0.06
_DIRECT
-0.06
tú
-0.06
unnecessarily
-0.06
838
-0.06
POSITIVE LOGITS
sibling
0.08
genital
0.07
portal
0.07
<>
0.07
ivals
0.06
VERN
0.06
line
0.06
:|
0.06
.bold
0.06
Portal
0.06
Activations Density 0.029%