INDEX
Negative Logits
պարտ
-0.09
uctus
-0.09
գեր
-0.09
hæ
-0.08
ավորման
-0.08
ierst
-0.08
leger
-0.08
Seda
-0.08
ային
-0.08
ŷ
-0.08
POSITIVE LOGITS
مت
0.08
worried
0.08
precies
0.08
tod
0.08
juuri
0.07
anxious
0.07
quiere
0.07
cope
0.07
réellement
0.07
précisément
0.07
Activations Density 0.001%