INDEX
Negative Logits
arded
-0.08
পেল
-0.08
vela
-0.07
LOL
-0.07
സം
-0.07
Wonders
-0.07
Vigo
-0.07
Մի
-0.07
Lo
-0.07
useless
-0.07
POSITIVE LOGITS
objective
0.09
intricate
0.08
outlines
0.08
overarching
0.08
Illustr
0.08
Objectives
0.07
Thorn
0.07
objectives
0.07
nuanced
0.07
æk
0.07
Activations Density 0.034%