INDEX
Negative Logits
ifndef
-0.08
SOAP
-0.08
erm
-0.08
ORM
-0.08
Städ
-0.08
paintings
-0.08
enchanted
-0.08
ogon
-0.08
atility
-0.08
Karl
-0.08
POSITIVE LOGITS
Zuschauer
0.11
espectadores
0.11
观看
0.10
popcorn
0.10
viewers
0.10
movie
0.09
snacks
0.09
观
0.09
viewer
0.09
watching
0.09
Activations Density 0.065%