INDEX
Negative Logits
š
0.48
全員
0.47
لت
0.47
KOM
0.46
知识
0.46
问题
0.46
数的
0.45
Köz
0.45
৬
0.44
Juicy
0.44
POSITIVE LOGITS
than
0.54
亠
0.46
אור
0.45
รวม
0.44
അവളെ
0.44
ประกอบ
0.44
tyle
0.43
orse
0.43
ANT
0.42
antique
0.42
Activations Density 0.001%
š
全員
لت
KOM
知识
问题
数的
Köz
৬
Juicy
than
亠
אור
รวม
അവളെ
ประกอบ
tyle
orse
ANT
antique