INDEX
Negative Logits
とな
-0.08
religioso
-0.08
لقد
-0.08
Eg
-0.07
wf
-0.07
religiosos
-0.07
αγ
-0.07
IMM
-0.07
圖片
-0.07
Lak
-0.07
POSITIVE LOGITS
구축
0.08
manipulated
0.08
abus
0.08
જુ
0.08
equil
0.07
het
0.07
જૂ
0.07
\Schema
0.07
tät
0.07
/gen
0.07
Activations Density 0.002%