INDEX
Negative Logits
robbed
-0.07
owie
-0.07
pv
-0.07
297
-0.07
/me
-0.07
pur
-0.07
pps
-0.07
296
-0.07
که
-0.06
robber
-0.06
POSITIVE LOGITS
빨
0.09
มาย
0.08
பிர
0.08
різ
0.08
.jsx
0.08
róż
0.08
.keyword
0.08
Cite
0.08
imut
0.08
қат
0.08
Activations Density 0.002%