INDEX
Negative Logits
tossing
-0.08
crisp
-0.08
страхов
-0.07
тиз
-0.07
Thur
-0.07
редак
-0.07
vertra
-0.07
ത്തിലെ
-0.07
сотрудников
-0.07
-0.07
POSITIVE LOGITS
onto
0.09
.relationship
0.08
attaches
0.08
붙
0.08
借
0.08
iner
0.08
挂
0.08
steals
0.08
Lifetime
0.08
species
0.07
Activations Density 0.009%