INDEX
Negative Logits
ẳ
-0.07
ure
-0.06
800
-0.06
-0.06
refr
-0.06
ont
-0.06
NST
-0.06
що
-0.06
whats
-0.06
入
-0.06
POSITIVE LOGITS
Sherman
0.07
мис
0.07
gul
0.06
PostMapping
0.06
(seq
0.06
bağ
0.06
Peninsula
0.06
basic
0.06
beginners
0.06
basis
0.06
Activations Density 0.000%