INDEX
Negative Logits
鈈
0.76
詓
0.73
Mâc
0.70
ⴳ
0.69
afterDir
0.67
ຽງ
0.65
ராஜ
0.65
Ὀ
0.65
゚
0.64
្វី
0.62
POSITIVE LOGITS
H
2.03
H
2.02
ハ
1.95
ハ
1.92
h
1.84
ஹ
1.82
ഹ
1.80
HT
1.79
HC
1.76
H
1.75
Activations Density 0.927%
鈈
詓
Mâc
ⴳ
afterDir
ຽງ
ராஜ
Ὀ
゚
្វី
H
H
ハ
ハ
h
ஹ
ഹ
HT
HC
H