INDEX
Negative Logits
�
-0.08
conserv
-0.08
cath
-0.07
429
-0.07
FIN
-0.07
Jacques
-0.07
narratives
-0.07
�
-0.07
fint
-0.07
fino
-0.07
POSITIVE LOGITS
oops
0.08
bim
0.08
속
0.08
allotted
0.07
sorts
0.07
cale
0.07
爵
0.07
ub
0.07
tun
0.07
seal
0.07
Activations Density 0.000%