INDEX
Negative Logits
амп
-0.08
-dismissible
-0.08
есто
-0.08
таңда
-0.08
ылып
-0.08
ест
-0.07
маг
-0.07
уса
-0.07
-elles
-0.07
这里只
-0.07
POSITIVE LOGITS
corrobor
0.10
reaffirm
0.09
.verify
0.09
confirm
0.09
confirms
0.09
.confirm
0.08
Confirm
0.08
Confirm
0.08
reasoning
0.08
分析
0.08
Activations Density 0.067%