INDEX
Negative Logits
ن
0.79
ش
0.77
岕
0.77
ivasena
0.76
онов
0.75
㐸
0.75
li
0.73
лить
0.73
焘
0.73
larını
0.72
POSITIVE LOGITS
'
1.20
ו
1.05
↵
0.86
CH
0.81
c
0.81
D
0.81
ב
0.79
К
0.77
P
0.76
revealed
0.76
Activations Density 0.028%
ن
ش
岕
ivasena
онов
㐸
li
лить
焘
larını
'
ו
↵
CH
c
D
ב
К
P
revealed