INDEX
Negative Logits
cript
-0.08
catastroph
-0.08
mma
-0.08
etu
-0.08
Leuven
-0.08
剧情
-0.08
�
-0.08
יל
-0.07
Knock
-0.07
atetime
-0.07
POSITIVE LOGITS
org
0.08
preoc
0.08
dal
0.07
/news
0.07
lagere
0.07
reasoning
0.07
oil
0.07
derived
0.07
fis
0.07
type
0.07
Activations Density 0.003%