INDEX
Negative Logits
Arlington
-0.08
указ
-0.08
Gson
-0.07
ogy
-0.07
um
-0.07
policy
-0.07
back
-0.07
Reports
-0.07
escort
-0.07
torna
-0.07
POSITIVE LOGITS
-speaking
0.10
Hey
0.08
Speaker
0.08
해
0.08
Nadu
0.08
பேச
0.08
speakers
0.08
énerg
0.08
tü
0.08
、西
0.08
Activations Density 0.001%