INDEX
Negative Logits
d
0.98
m
0.82
se
0.66
emd
0.65
were
0.63
v
0.61
dan
0.59
opss
0.58
dare
0.58
:
0.58
POSITIVE LOGITS
میراتھن
0.54
Polish
0.53
صہی
0.52
iniai
0.52
Investor
0.51
اتب
0.50
فين
0.49
för
0.49
في
0.49
thren
0.49
Activations Density 0.001%