INDEX
Negative Logits
couch
-0.08
code
-0.07
eins
-0.07
prev
-0.07
بير
-0.07
acob
-0.06
fooled
-0.06
','#
-0.06
boyut
-0.06
oranges
-0.06
POSITIVE LOGITS
.deb
0.07
Dest
0.06
уч
0.06
ع
0.06
Voyage
0.06
reeting
0.06
/perl
0.06
razier
0.06
ري
0.06
IGNED
0.06
Activations Density 0.256%