INDEX
Negative Logits
North
-0.08
North
-0.08
rames
-0.08
orgot
-0.08
estival
-0.07
LOAT
-0.07
ifth
-0.07
ocused
-0.07
ilters
-0.07
acebook
-0.07
POSITIVE LOGITS
FTA
0.09
Fang
0.09
fdc
0.09
Foley
0.09
FH
0.09
fa
0.09
.FC
0.09
fantas
0.09
fü
0.08
Fan
0.08
Activations Density 0.704%