INDEX
Negative Logits
�
-0.08
acqu
-0.07
Considering
-0.07
�
-0.07
퇼
-0.07
nz
-0.07
novation
-0.07
屠
-0.07
突
-0.07
Imm
-0.06
POSITIVE LOGITS
peł
0.08
Roman
0.07
замет
0.07
cheg
0.07
Agregar
0.07
StateException
0.07
tabel
0.07
住院
0.07
.Rect
0.07
站着
0.07
Activations Density 0.004%