INDEX
Negative Logits
Stop
-0.08
hết
-0.08
backpack
-0.08
Secretary
-0.07
Landing
-0.07
-handed
-0.07
Lap
-0.07
செய்யப்பட்ட
-0.07
-stop
-0.07
laš
-0.07
POSITIVE LOGITS
0.09
gụ
0.08
curiosity
0.08
avity
0.08
sø
0.07
الفرد
0.07
ibilities
0.07
535
0.07
ofile
0.07
Sue
0.07
Activations Density 0.005%