INDEX
Explanations
abstract qualities and positive states
New Auto-Interp
Negative Logits
↵
0.60
T
0.56
unofficial
0.51
B
0.51
s
0.50
/
0.50
h
0.50
S
0.50
u
0.49
ts
0.49
POSITIVE LOGITS
maravilloso
0.66
meravigli
0.62
美丽的
0.61
maravill
0.59
鲞
0.59
怎样的
0.58
prachtige
0.57
美丽
0.57
这样的
0.55
生命的
0.55
Activations Density 0.029%