INDEX
Negative Logits
ल
3.71
ה
3.29
3.02
deki
2.95
nd
2.74
ndan
2.62
2.61
Золо
2.57
দ
2.54
พย์
2.52
POSITIVE LOGITS
到的
2.81
THUR
2.75
শীল
2.65
efeller
2.63
пищи
2.54
antlers
2.53
rishna
2.53
hline
2.50
৩
2.50
SIB
2.49
Activations Density 0.023%
ल
ה
deki
nd
ndan
Золо
দ
พย์
到的
THUR
শীল
efeller
пищи
antlers
rishna
hline
৩
SIB