INDEX
Negative Logits
වස
-0.08
Talk
-0.08
Lars
-0.07
вай
-0.07
raus
-0.07
trig
-0.07
itäts
-0.07
immed
-0.07
gotta
-0.07
verdere
-0.07
POSITIVE LOGITS
_you
0.07
赤
0.07
misunderstanding
0.07
coincidence
0.07
_owned
0.07
노력
0.07
för
0.07
서는
0.07
partly
0.07
possessed
0.07
Activations Density 0.059%