INDEX
Negative Logits
_Tool
-0.08
STRICT
-0.07
time
-0.07
ния
-0.07
unwitting
-0.06
attended
-0.06
contradict
-0.06
ته
-0.06
committee
-0.06
Filename
-0.06
POSITIVE LOGITS
bán
0.07
/an
0.07
Limit
0.07
,D
0.07
przedsiębiorst
0.06
美容
0.06
junior
0.06
nell
0.06
🍽
0.06
marc
0.06
Activations Density 0.004%