INDEX
Negative Logits
raad
-0.08
foil
-0.08
મેળ
-0.08
Greenwood
-0.08
ট্র
-0.07
Mundial
-0.07
ack
-0.07
Leopold
-0.07
Sears
-0.07
验
-0.07
POSITIVE LOGITS
autonom
0.08
alar
0.08
ayanan
0.08
mot
0.08
thus
0.07
age
0.07
insist
0.07
Dl
0.07
dictated
0.07
yan
0.07
Activations Density 0.001%