INDEX
Negative Logits
pleinement
-0.08
sang
-0.08
agara
-0.07
зач
-0.07
ambos
-0.07
phát
-0.07
発
-0.07
가
-0.07
bắt
-0.07
аков
-0.07
POSITIVE LOGITS
tun
0.09
taas
0.08
Tun
0.08
scholarships
0.08
invers
0.08
loo
0.08
(original
0.07
idi
0.07
_HANDLER
0.07
.trade
0.07
Activations Density 0.047%