INDEX
Negative Logits
.partial
-0.08
ும்ப
-0.08
actor
-0.08
osto
-0.08
partial
-0.07
-0.07
Convertible
-0.07
При
-0.07
Happens
-0.07
Adder
-0.07
POSITIVE LOGITS
yönelik
0.09
傷
0.08
经营
0.08
mens
0.08
outreach
0.08
发展
0.08
വികസ
0.08
实践
0.08
прод
0.08
veterans
0.07
Activations Density 0.006%