INDEX
Negative Logits
preserving
0.79
müssen
0.78
appending
0.78
платы
0.74
restoring
0.74
garantir
0.74
новые
0.72
строку
0.71
деше
0.71
ensuring
0.71
POSITIVE LOGITS
Traits
0.87
Traits
0.84
Personality
0.82
traits
0.82
Personality
0.80
人格
0.75
rasgos
0.75
性格
0.75
分析
0.73
Analysis
0.73
Activations Density 0.001%