INDEX
Negative Logits
Nice
-0.09
Seed
-0.08
Schlaf
-0.08
avoids
-0.08
Nice
-0.08
Tid
-0.08
famb
-0.07
待遇
-0.07
_vm
-0.07
پال
-0.07
POSITIVE LOGITS
telling
0.08
-standing
0.08
unner
0.07
banget
0.07
રૂપ
0.07
gezien
0.07
ले
0.07
ysql
0.07
読む
0.07
mê
0.07
Activations Density 0.004%