INDEX
Negative Logits
word
-0.07
bim
-0.07
Pil
-0.07
Esk
-0.07
lane
-0.07
Campus
-0.07
nger
-0.07
మ
-0.07
fla
-0.07
Fns
-0.07
POSITIVE LOGITS
Zucker
0.08
劇
0.08
Say
0.08
impl
0.08
Moving
0.08
телеф
0.07
Fitzgerald
0.07
ком
0.07
Xen
0.07
rece
0.07
Activations Density 0.000%