INDEX
Negative Logits
ужас
-0.09
狼
-0.09
lemm
-0.09
。その
-0.08
Philosophy
-0.08
있는데
-0.08
,据
-0.08
,但是
-0.08
。有
-0.08
。しかし
-0.08
POSITIVE LOGITS
concluded
0.09
�
0.08
grease
0.08
conclude
0.08
advis
0.08
please
0.08
calories
0.07
paste
0.07
✓
0.07
)</
0.07
Activations Density 0.021%