INDEX
Negative Logits
লাগে
-0.09
-0.08
_rating
-0.08
જરૂર
-0.08
સર
-0.08
/actions
-0.08
કરશે
-0.08
trouble
-0.08
获取
-0.08
Rating
-0.08
POSITIVE LOGITS
spann
0.08
literatura
0.08
.,
0.07
бол
0.07
lifecycle
0.07
hygiene
0.07
том
0.07
0.07
खंड
0.07
gemeinschaft
0.07
Activations Density 0.001%