INDEX
Negative Logits
ūn
0.43
BK
0.42
akaan
0.41
ук
0.41
Ụ
0.41
.,
0.40
</em>
0.39
PG
0.39
9
0.39
ائه
0.39
POSITIVE LOGITS
idios
0.45
捪
0.45
志森
0.45
兗
0.44
Giuseppe
0.44
Veja
0.43
Pause
0.43
瑭
0.43
忪
0.42
त्रिपुरा
0.42
Activations Density 0.001%
ūn
BK
akaan
ук
Ụ
.,
</em>
PG
9
ائه
idios
捪
志森
兗
Giuseppe
Veja
Pause
瑭
忪
त्रिपुरा