INDEX
Negative Logits
uchi
-0.07
Ordering
-0.07
orch
-0.07
ki
-0.07
である
-0.07
INFRINGEMENT
-0.06
chilly
-0.06
کن
-0.06
ندگان
-0.06
hesab
-0.06
POSITIVE LOGITS
som
0.07
believable
0.06
حس
0.06
-fat
0.06
gemeins
0.06
Genuine
0.06
(method
0.06
relacion
0.06
QS
0.06
rej
0.06
Activations Density 0.003%