INDEX
Negative Logits
tolerate
-0.08
Ros
-0.08
convention
-0.08
_dis
-0.07
OPEN
-0.07
_SU
-0.07
thi
-0.07
opent
-0.07
opbreng
-0.07
emp
-0.07
POSITIVE LOGITS
Hiring
0.10
Hiring
0.09
vividly
0.09
իչ
0.09
وتح
0.09
فراہم
0.09
ીક
0.08
vivid
0.08
ذهن
0.08
puesto
0.08
Activations Density 0.010%