INDEX
Negative Logits
lag
-0.08
gera
-0.08
fik
-0.08
Cd
-0.07
Aug
-0.07
kapa
-0.07
potem
-0.07
เหตุ
-0.07
uro
-0.07
scap
-0.07
POSITIVE LOGITS
0.09
greater
0.08
.drag
0.08
仙
0.08
photo
0.07
만
0.07
ίων
0.07
পাও
0.07
nm
0.07
.pe
0.07
Activations Density 0.002%