INDEX
Negative Logits
istica
-0.08
들
-0.08
들을
-0.07
Ys
-0.07
hoff
-0.07
牧
-0.07
flattering
-0.07
들도
-0.07
halve
-0.07
;;;;;;;;;;;;;;;;
-0.07
POSITIVE LOGITS
رنگ
0.09
�
0.09
اللون
0.09
hybrids
0.08
vuln
0.08
_TEAM
0.08
�
0.08
Planning
0.08
️
0.08
�
0.08
Activations Density 0.010%