INDEX
Negative Logits
Substitute
-0.08
ट
-0.07
Roof
-0.07
Thu
-0.07
्रदर
-0.06
_TypeInfo
-0.06
Thu
-0.06
698
-0.06
elt
-0.06
298
-0.06
POSITIVE LOGITS
personal
0.17
Personal
0.14
personal
0.12
Personal
0.12
personally
0.09
personalised
0.08
personalized
0.08
,小
0.08
moral
0.07
.IM
0.07
Activations Density 0.028%