INDEX
Negative Logits
ри
1.64
р
1.57
𝚝
1.52
zerstört
1.37
echt
1.34
hohen
1.33
ﺍ
1.29
Bước
1.27
مان
1.27
ﻴ
1.27
POSITIVE LOGITS
ך
1.42
NESS
1.41
1.36
1.34
1.31
daki
1.30
ע
1.30
↵↵
1.27
ს
1.23
ش
1.23
Activations Density 0.007%
ри
р
𝚝
zerstört
echt
hohen
ﺍ
Bước
مان
ﻴ
ך
NESS
daki
ע
↵↵
ს
ش