INDEX
Negative Logits
ப்
-0.08
动力
-0.08
革
-0.08
ાળા
-0.07
斗
-0.07
奋斗
-0.07
Dip
-0.07
然
-0.07
,以及
-0.07
以及
-0.07
POSITIVE LOGITS
389
0.08
esimerkiksi
0.08
550
0.08
Weih
0.08
पू
0.08
580
0.08
483
0.08
387
0.08
atrocities
0.07
918
0.07
Activations Density 0.007%