INDEX
Negative Logits
认真
-0.08
/in
-0.08
ınd
-0.08
উচিত
-0.08
sede
-0.08
Bür
-0.08
remarks
-0.08
روس
-0.08
avanja
-0.07
大陆
-0.07
POSITIVE LOGITS
Valentine's
0.08
�
0.07
Valentine
0.07
ifting
0.07
pouring
0.07
comand
0.07
donut
0.07
escl
0.07
despl
0.07
ಿಸಲು
0.07
Activations Density 0.003%