INDEX
Negative Logits
windows
-0.07
Hussein
-0.07
ago
-0.07
Afghan
-0.07
Pakistani
-0.07
gira
-0.07
Federal
-0.07
uranium
-0.07
Nature
-0.07
ducks
-0.07
POSITIVE LOGITS
Cruise
0.09
。ただ
0.09
きを
0.09
Vorsitz
0.09
IRIT
0.09
gewünschten
0.08
predefined
0.08
,只
0.08
motocic
0.08
cerim
0.08
Activations Density 0.003%