INDEX
Negative Logits
нік
-0.07
tense
-0.07
careless
-0.07
специ
-0.07
つけ
-0.07
сост
-0.06
příč
-0.06
menacing
-0.06
ijke
-0.06
디자인
-0.06
POSITIVE LOGITS
hybrid
0.18
Hybrid
0.16
hybrids
0.12
ybrid
0.08
brid
0.07
brids
0.07
Hy
0.07
Har
0.06
wedding
0.06
MO
0.06
Activations Density 0.004%