INDEX
Negative Logits
’
1.12
and
0.93
od
0.82
for
0.82
is
0.78
om
0.74
ik
0.73
y
0.71
ort
0.70
ij
0.70
POSITIVE LOGITS
۴
0.81
𝟰
0.81
도
0.77
ﻢ
0.74
գ
0.73
че
0.71
תו
0.71
에
0.70
гей
0.70
깊
0.70
Activations Density 0.000%
’
and
od
for
is
om
ik
y
ort
ij
۴
𝟰
도
ﻢ
գ
че
תו
에
гей
깊