INDEX
Negative Logits
Bewer
-0.08
boo
-0.07
demo
-0.07
procrast
-0.07
something
-0.07
Puppy
-0.07
opo
-0.07
баб
-0.07
prova
-0.07
kop
-0.07
POSITIVE LOGITS
stringent
0.08
sel
0.08
Correction
0.07
Accounting
0.07
inso
0.07
ढ
0.07
verkeer
0.07
zure
0.07
vorgenommen
0.07
ியான
0.07
Activations Density 0.003%