INDEX
Explanations
verbs indicating existence or presence
New Auto-Interp
Negative Logits
preced
-0.58
énergé
-0.56
olmaz
-0.51
appart
-0.51
ursa
-0.51
bruges
-0.50
effective
-0.49
captures
-0.48
économiques
-0.48
Lights
-0.47
POSITIVE LOGITS
findpost
1.01
+#+#
0.99
مرئيه
0.97
незавершена
0.91
يتيمه
0.91
nahilalakip
0.91
)
0.90
EconPapers
0.88
évaluateur
0.87
]),
0.86
Activations Density 0.293%