INDEX
Negative Logits
cancellations
-0.08
Accept
-0.07
pounding
-0.07
pikk
-0.07
شناخت
-0.07
sincere
-0.07
വൈക
-0.07
ذکر
-0.07
sincerity
-0.07
discrepancy
-0.07
POSITIVE LOGITS
tangent
0.09
tess
0.09
'emb
0.08
0.08
fes
0.08
Ny
0.07
Gre
0.07
Dani
0.07
embarking
0.07
выпуск
0.07
Activations Density 0.014%