INDEX
Negative Logits
+=
-0.08
avulla
-0.08
/tasks
-0.08
任务
-0.07
maail
-0.07
❤️
-0.07
–
-0.07
stomach
-0.07
chores
-0.07
pancakes
-0.07
POSITIVE LOGITS
الحزب
0.09
obet
0.08
чит
0.08
desastre
0.08
حزب
0.08
chtend
0.08
itone
0.08
crimen
0.08
↵
0.08
retaliation
0.08
Activations Density 0.001%