INDEX
Negative Logits
vul
-0.08
一阵
-0.08
抟
-0.07
BASE
-0.07
밴
-0.07
삻
-0.07
ADIUS
-0.07
多个国家
-0.07
酞
-0.07
鸶
-0.07
POSITIVE LOGITS
Они
0.08
Topics
0.07
ironic
0.07
circuits
0.07
emissions
0.06
suggest
0.06
Ig
0.06
------------------------------------------------------------------------------------------------
0.06
itorio
0.06
_events
0.06
Activations Density 0.004%