INDEX
Negative Logits
-width
-0.07
спів
-0.07
ті
-0.06
업데이트
-0.06
Spi
-0.06
Goldberg
-0.06
نى
-0.06
وقد
-0.06
regar
-0.06
�
-0.06
POSITIVE LOGITS
ोकर
0.07
government
0.06
swapping
0.06
journey
0.06
alers
0.06
topic
0.06
Position
0.06
ipers
0.06
bw
0.06
ped
0.06
Activations Density 0.212%