INDEX
Negative Logits
人格
-0.08
сет
-0.07
Eating
-0.07
уни
-0.07
hấp
-0.07
тар
-0.07
eaten
-0.07
梨
-0.07
последствия
-0.07
внимание
-0.07
POSITIVE LOGITS
wow
0.08
helic
0.08
闪
0.08
fluorescence
0.08
HE
0.08
拿
0.08
pw
0.08
tw
0.08
wk
0.07
iw
0.07
Activations Density 0.003%