INDEX
Explanations
future outcomes and capabilities
New Auto-Interp
Negative Logits
бывает
0.55
weakens
0.52
diminue
0.52
பாதிக்கிறது
0.50
தருக
0.50
enhances
0.50
येतो
0.49
complicates
0.49
는다
0.49
அதிகரிக்கிறது
0.49
POSITIVE LOGITS
będzie
1.09
خواهند
1.07
будут
1.06
olacaktır
1.04
будет
1.02
will
1.00
sẽ
1.00
acaktır
1.00
থাকবে
0.97
sarà
0.95
Activations Density 0.211%