INDEX
Negative Logits
ヾ
-0.07
ف
-0.07
몰
-0.06
.calls
-0.06
до
-0.06
με
-0.06
cant
-0.06
thrott
-0.06
узн
-0.06
)get
-0.06
POSITIVE LOGITS
lin
0.28
Lin
0.13
LIN
0.13
Lin
0.13
lin
0.12
linen
0.11
_lin
0.11
.lin
0.10
LIN
0.09
liner
0.08
Activations Density 0.004%