INDEX
Negative Logits
h
0.62
of
0.57
ى
0.52
'
0.45
ت
0.44
d
0.43
g
0.42
ೇ
0.42
}.
0.39
gı
0.39
POSITIVE LOGITS
н
0.50
in
0.49
ido
0.37
hi
0.36
icio
0.35
neath
0.34
лла
0.33
ходя
0.33
iped
0.33
int
0.33
Activations Density 0.000%
h
of
ى
'
ت
d
g
ೇ
}.
gı
н
in
ido
hi
icio
neath
лла
ходя
iped
int