INDEX
Negative Logits
sv
-0.07
Nelson
-0.07
Remark
-0.07
march
-0.07
utherford
-0.07
Moss
-0.07
moss
-0.07
ŝ
-0.07
ను
-0.07
äl
-0.07
POSITIVE LOGITS
-producing
0.08
tanker
0.08
turbine
0.08
燃
0.08
ware
0.07
nasium
0.07
성
0.07
fase
0.07
Feat
0.07
pains
0.07
Activations Density 0.012%