INDEX
Negative Logits
-
0.61
’
0.58
'
0.57
0.54
l
0.52
.
0.49
."
0.47
/
0.46
Basics
0.46
and
0.45
POSITIVE LOGITS
malice
0.40
𝗢
0.40
ಪ್ರತಿ
0.39
विद्युत
0.38
陳
0.37
thèse
0.37
繭
0.37
אל
0.36
nuovamente
0.36
dirigés
0.36
Activations Density 0.143%
-
’
'
l
.
."
/
Basics
and
malice
𝗢
ಪ್ರತಿ
विद्युत
陳
thèse
繭
אל
nuovamente
dirigés