INDEX
Negative Logits
indifference
0.44
indifer
0.43
apathy
0.42
ያለ
0.39
brinda
0.38
aparentemente
0.38
bene
0.37
racquet
0.37
Lato
0.37
patriotism
0.37
POSITIVE LOGITS
ktur
0.46
眽
0.41
烝
0.39
ünstler
0.38
想象
0.38
ologico
0.38
發展
0.38
öffentlich
0.37
рассчиты
0.37
uslar
0.37
Activations Density 0.000%