INDEX
Negative Logits
حداقل
0.57
ATORS
0.55
jedynie
0.55
少なくとも
0.55
bitos
0.54
uttosto
0.52
heathen
0.52
믄
0.52
کہ
0.51
Фурга
0.51
POSITIVE LOGITS
ствие
0.43
พัก
0.41
服
0.41
change
0.41
Count
0.39
is
0.39
меня
0.39
sess
0.39
Change
0.37
ess
0.37
Activations Density 0.000%