INDEX
Negative Logits
germs
-0.08
Flame
-0.08
seedlings
-0.08
benign
-0.07
testimonials
-0.07
plaint
-0.07
短信
-0.07
Mere
-0.07
hh
-0.07
جات
-0.07
POSITIVE LOGITS
നിറ
0.08
era
0.08
Era
0.08
cevap
0.08
Era
0.08
eras
0.08
cuir
0.08
ier
0.08
layer
0.07
shores
0.07
Activations Density 0.002%