INDEX
Negative Logits
andex
-0.09
פאר
-0.08
mnop
-0.08
paru
-0.08
loha
-0.08
hōʻike
-0.08
oslo
-0.08
американ
-0.08
президента
-0.08
ঠন
-0.08
POSITIVE LOGITS
众
0.08
众
0.07
😍
0.07
请
0.07
挑
0.07
网友
0.07
inut
0.07
ICIAL
0.07
walnuts
0.07
们
0.07
Activations Density 0.002%