INDEX
Negative Logits
4
0.83
7
0.77
5
0.75
6
0.72
-
0.70
2
0.68
3
0.66
8
0.66
га
0.61
٤
0.60
POSITIVE LOGITS
is
0.82
0.61
]
0.52
↵↵
0.51
สม
0.49
evasion
0.49
)
0.49
리로
0.48
사용
0.47
র
0.47
Activations Density 0.132%
4
7
5
6
-
2
3
8
га
٤
is
]
↵↵
สม
evasion
)
리로
사용
র