INDEX
Negative Logits
alimento
0.32
mediately
0.31
meget
0.30
urt
0.29
কিছুর
0.29
ພວກເຮົາ
0.29
rages
0.28
slightest
0.28
juegan
0.28
evils
0.28
POSITIVE LOGITS
Airbnb
0.29
<unused2121>
0.28
0.28
ljubav
0.26
ߋ
0.26
<unused2148>
0.26
ਿੰ
0.25
Airbnb
0.24
arlı
0.24
ραπε
0.24
Activations Density 0.001%