INDEX
Negative Logits
ді
-0.08
wer
-0.08
vs
-0.08
411
-0.07
Оч
-0.07
Viol
-0.07
Lift
-0.07
ң
-0.07
viol
-0.07
Esk
-0.07
POSITIVE LOGITS
rek
0.08
fenn
0.08
kerran
0.08
bono
0.08
crude
0.08
hil
0.08
dern
0.08
dulu
0.07
ിയാണ്
0.07
ars
0.07
Activations Density 0.021%