INDEX
Negative Logits
ibri
-0.18
ael
-0.17
ober
-0.15
yre
-0.15
chied
-0.15
iday
-0.14
-0.14
uft
-0.14
aggable
-0.14
erland
-0.14
POSITIVE LOGITS
alive
0.17
ÑĤÑĢо
0.16
alive
0.15
ICLE
0.14
vez
0.13
Linh
0.13
chy
0.13
è¿ŀ
0.13
zzle
0.13
ÙĪÙĦÙĬ
0.13
Activations Density 0.001%