INDEX
Negative Logits
Ter
-0.08
verbally
-0.08
fulf
-0.08
abel
-0.07
Terry
-0.07
systems
-0.07
Systems
-0.07
latina
-0.07
Ter
-0.07
ek
-0.07
POSITIVE LOGITS
Au
0.08
Feder
0.08
elasticity
0.07
Skyline
0.07
ний
0.07
যুগ
0.07
Yuan
0.07
як
0.07
silver
0.07
Wu
0.07
Activations Density 0.002%