INDEX
Negative Logits
Cab
-0.08
.expand
-0.07
िगत
-0.07
leve
-0.07
جاب
-0.07
latch
-0.07
zez
-0.07
yll
-0.07
लगे
-0.07
existem
-0.07
POSITIVE LOGITS
fictional
0.09
Somewhere
0.09
fict
0.09
fiction
0.09
_dummy
0.08
Dummy
0.08
hypot
0.08
Fakten
0.08
arga
0.08
_fake
0.08
Activations Density 0.015%