INDEX
Negative Logits
člán
-0.08
-0.08
Carta
-0.08
dw
-0.08
Teach
-0.08
Raven
-0.07
ingredient
-0.07
eros
-0.07
�
-0.07
_led
-0.07
POSITIVE LOGITS
Yee
0.08
떨어
0.08
вы
0.07
perpendicular
0.07
কে
0.07
sonder
0.07
tegelijk
0.07
фор
0.07
(which
0.07
yours
0.07
Activations Density 0.038%