INDEX
Negative Logits
韌
0.48
hrte
0.47
rů
0.47
عت
0.47
Haci
0.47
protože
0.46
dě
0.46
價格
0.46
كري
0.46
afferma
0.46
POSITIVE LOGITS
spare
0.49
ann
0.48
modified
0.46
modify
0.45
polish
0.45
ora
0.44
Ann
0.44
groove
0.44
ol
0.43
희
0.43
Activations Density 0.001%