INDEX
Negative Logits
学生
-0.08
liy
-0.08
student
-0.07
studies
-0.07
student's
-0.07
_RT
-0.07
arises
-0.07
학생
-0.07
étudiants
-0.07
students
-0.07
POSITIVE LOGITS
penger
0.09
ZERO
0.09
Emoji
0.09
ι
0.09
Swan
0.09
žu
0.08

0.08
Si
0.08
Apple
0.08
Gesture
0.08
Activations Density 0.025%