INDEX
Negative Logits
ne
1.05
ni
0.93
as
0.91
ren
0.83
that
0.82
ma
0.81
nt
0.80
จะ
0.80
ere
0.78
se
0.77
POSITIVE LOGITS
اك
1.00
0
0.96
ווי
0.95
ா
0.93
고
0.91
0
0.90
ו
0.88
ালা
0.87
]
0.77
γκ
0.76
Activations Density 0.001%
ne
ni
as
ren
that
ma
nt
จะ
ere
se
اك
0
ווי
ா
고
0
ו
ালা
]
γκ