INDEX
Negative Logits
reinterpret
-0.07
BUF
-0.07
,size
-0.07
드라마
-0.07
mát
-0.07
_fp
-0.06
نبود
-0.06
_gamma
-0.06
xo
-0.06
↵ ↵
-0.06
POSITIVE LOGITS
(se
0.06
icro
0.06
�
0.06
radically
0.06
liking
0.06
resume
0.06
ejac
0.06
Dia
0.05
Authorized
0.05
_IM
0.05
Activations Density 0.014%