INDEX
Negative Logits
8
0.51
ྞ
0.50
絢
0.49
णारे
0.48
ന്ത്രാ
0.48
ﺓ
0.48
脅
0.48
科学家
0.46
.”[
0.46
Ꭽ
0.46
POSITIVE LOGITS
o
0.57
et
0.52
e
0.51
e
0.51
ob
0.49
Ro
0.49
emer
0.48
ome
0.48
vital
0.48
0.48
Activations Density 0.001%
8
ྞ
絢
णारे
ന്ത്രാ
ﺓ
脅
科学家
.”[
Ꭽ
o
et
e
e
ob
Ro
emer
ome
vital