INDEX
Negative Logits
.reduce
-0.07
enge
-0.07
akter
-0.07
beautiful
-0.07
Revenge
-0.06
Mockito
-0.06
不好意思
-0.06
deck
-0.06
疲惫
-0.06
plural
-0.06
POSITIVE LOGITS
ᾷ
0.08
телей
0.07
Athletics
0.07
젬
0.07
yıllarda
0.07
WINDOWS
0.07
השנה
0.07
führ
0.07
�
0.07
繁
0.07
Activations Density 0.001%