INDEX
Negative Logits
مصدر
-0.08
wahrscheinlich
-0.08
vermutlich
-0.08
interp
-0.07
ouns
-0.07
waarschijnlijk
-0.07
பட
-0.07
Ep
-0.07
normen
-0.07
qor
-0.07
POSITIVE LOGITS
Ý
0.09
cybers
0.08
/tab
0.08
misc
0.08
版
0.08
trendy
0.08
gladly
0.07
pline
0.07
railing
0.07
downfall
0.07
Activations Density 0.002%