INDEX
Negative Logits
Kra
-0.09
appear
-0.08
степ
-0.07
eq
-0.07
Kow
-0.07
rheumatoid
-0.07
cy
-0.07
undi
-0.07
vorne
-0.07
ở
-0.07
POSITIVE LOGITS
Lee
0.08
dan
0.07
Dish
0.07
Lee
0.07
人氣
0.07
.Depth
0.07
ard
0.07
🏻
0.07
人生
0.07
辺
0.07
Activations Density 0.002%