INDEX
Negative Logits
üh
1.46
襲
1.36
ıyla
1.35
TextMessage
1.31
таки
1.30
amel
1.27
prefecture
1.26
ël
1.25
ுக்
1.25
ليز
1.24
POSITIVE LOGITS
naires
1.43
ই
1.38
tract
1.32
telling
1.31
rations
1.31
ead
1.31
িক
1.30
naire
1.30
ક
1.30
ted
1.28
Activations Density 0.000%