INDEX
Negative Logits
homo
-0.08
Toc
-0.08
مف
-0.08
Aman
-0.08
gh
-0.08
Mani
-0.08
cí
-0.07
રસ
-0.07
موج
-0.07
üğü
-0.07
POSITIVE LOGITS
作用
0.08
но
0.08
bu
0.08
奋
0.07
posture
0.07
働
0.07
Libert
0.07
奋斗
0.07
accordance
0.07
#.
0.07
Activations Density 0.003%