INDEX
Negative Logits
mile
-0.08
mando
-0.07
gou
-0.07
Billing
-0.07
war
-0.07
saving
-0.07
tha
-0.07
aims
-0.07
והר
-0.07
שע
-0.07
POSITIVE LOGITS
$(".0.07
HV
0.07
窄
0.07
钩
0.07
传感器
0.07
cheek
0.07
座
0.07
donnees
0.07
}↵
0.07
enumerator
0.07
Activations Density 0.006%