INDEX
Negative Logits
Asi
0.59
soutien
0.54
issances
0.53
पड़े
0.52
つけ
0.52
মুক্তিয
0.50
mathrm
0.50
ért
0.49
Tomas
0.49
Tele
0.49
POSITIVE LOGITS
actively
0.71
активно
0.60
knows
0.59
custody
0.58
োয়
0.57
biasing
0.57
ALWAYS
0.56
isActive
0.56
wonder
0.55
ahili
0.55
Activations Density 0.000%