INDEX
Negative Logits
Centr
-0.08
nga
-0.07
Jose
-0.07
ev
-0.07
footage
-0.07
tür
-0.07
calculation
-0.07
anh
-0.07
-0.07
overst
-0.07
POSITIVE LOGITS
明确
0.08
хозяй
0.08
критер
0.08
ulate
0.08
ulang
0.08
hypotheses
0.08
smanship
0.08
articulation
0.08
сформ
0.08
_vec
0.07
Activations Density 0.009%