INDEX
Negative Logits
WRITE
-0.09
Schra
-0.09
AYER
-0.09
Luft
-0.08
Nixon
-0.08
ATRIX
-0.08
.Adam
-0.08
Alma
-0.08
Account
-0.08
WRITE
-0.08
POSITIVE LOGITS
ly
0.08
-du
0.07
topic
0.07
id
0.07
title
0.07
confirme
0.07
ра
0.07
axi
0.07
argument
0.07
tracking
0.07
Activations Density 0.000%