INDEX
Negative Logits
rabbit
-0.08
gad
-0.08
この
-0.08
lach
-0.07
�
-0.07
camper
-0.07
Aur
-0.07
cycl
-0.07
atuurlijk
-0.07
Joy
-0.07
POSITIVE LOGITS
aş
0.08
фин
0.08
обходимо
0.07
itim
0.07
у
0.07
daring
0.07
구축
0.07
ಾನ್ಯ
0.07
."<
0.07
이션
0.07
Activations Density 0.256%