INDEX
Negative Logits
binge
-0.07
βά
-0.07
canc
-0.06
만
-0.06
significance
-0.06
252
-0.06
’autres
-0.06
exist
-0.06
드를
-0.06
257
-0.06
POSITIVE LOGITS
reporter
0.13
reporters
0.13
Reporter
0.11
Reporter
0.09
_spot
0.07
OCKET
0.07
_REFERER
0.07
realistic
0.07
надеж
0.06
ト
0.06
Activations Density 0.002%