INDEX
Negative Logits
%%%%%%%%%%%%%%%%
-0.07
hd
-0.06
Nit
-0.06
Obs
-0.06
Chr
-0.06
beden
-0.06
magistrate
-0.06
Bord
-0.06
_extent
-0.06
iets
-0.06
POSITIVE LOGITS
سام
0.08
poh
0.07
маш
0.06
Whatever
0.06
vo
0.06
zeigen
0.06
useStyles
0.06
comparer
0.06
้อ
0.06
recated
0.06
Activations Density 0.002%