INDEX
Negative Logits
အစ
-0.08
tobac
-0.08
trad
-0.08
נות
-0.07
ість
-0.07
Ever
-0.07
পূর্ণ
-0.07
Post
-0.07
-0.07
expedited
-0.07
POSITIVE LOGITS
_encoder
0.08
乳
0.08
интерф
0.08
қаты
0.08
Magnesium
0.07
Administration
0.07
Aix
0.07
అలాగే
0.07
_span
0.07
antagon
0.07
Activations Density 0.003%