INDEX
Negative Logits
nicely
-0.09
neatly
-0.08
تحسين
-0.07
rebuilding
-0.07
Drinking
-0.07
ninth
-0.07
Building
-0.07
Cheat
-0.07
拧
-0.07
恨
-0.07
POSITIVE LOGITS
*,
0.09
0.07
bla
0.07
maxi
0.07
*
0.07
o
0.06
ably
0.06
똬
0.06
')
0.06
manız
0.06
Activations Density 0.023%