INDEX
Negative Logits
juvenil
-0.08
usia
-0.07
骤
-0.07
जु
-0.07
gv
-0.07
ാത്ത
-0.07
Gut
-0.07
070
-0.07
ivities
-0.07
/The
-0.07
POSITIVE LOGITS
自己的
0.08
-seven
0.08
Roe
0.07
się
0.07
hosp
0.07
Valid
0.07
sobie
0.07
받
0.07
oneself
0.07
/stretch
0.07
Activations Density 0.900%