INDEX
Negative Logits
exit
-0.09
அ
-0.08
p
-0.08
port
-0.08
parity
-0.08
pace
-0.07
extent
-0.07
அத
-0.07
determ
-0.07
td
-0.07
POSITIVE LOGITS
WON
0.09
faucibus
0.08
ുകള്
0.08
集
0.08
を
0.08
지도
0.08
アイ
0.08
holo
0.08
الداخلية
0.08
σύν
0.08
Activations Density 0.003%