INDEX
Negative Logits
Stud
-0.08
ಿಬ
-0.07
만들
-0.07
비롯
-0.07
뛰
-0.07
חברת
-0.07
నే
-0.07
ವ್ಯಾಪ
-0.07
étudiant
-0.07
solute
-0.07
POSITIVE LOGITS
disclaim
0.11
टिप्प
0.10
टिप्पणी
0.09
complications
0.09
date
0.09
remarks
0.08
निष
0.08
commentary
0.08
importantly
0.08
dress
0.08
Activations Density 0.011%