INDEX
Negative Logits
ل
1.58
зю
1.53
G
1.52
M
1.45
dimes
1.38
秶
1.34
maximizes
1.34
ة
1.34
وغير
1.33
疵
1.32
POSITIVE LOGITS
та
1.93
am
1.91
ms
1.90
te
1.82
ations
1.79
ments
1.79
ir
1.78
son
1.76
ів
1.74
ින්
1.73
Activations Density 0.061%
ل
зю
G
M
dimes
秶
maximizes
ة
وغير
疵
та
am
ms
te
ations
ments
ir
son
ів
ින්