INDEX
Negative Logits
unethical
-0.08
koud
-0.08
ngam
-0.08
komende
-0.08
mang
-0.07
Oui
-0.07
lactose
-0.07
.anim
-0.07
oui
-0.07
اس
-0.07
POSITIVE LOGITS
egg
0.09
illuminating
0.08
boom
0.08
aftermath
0.07
ázquez
0.07
�果
0.07
อย่าง
0.07
constructive
0.07
Boom
0.07
useful
0.07
Activations Density 0.024%