INDEX
Explanations
state evaluation or conclusion
New Auto-Interp
Negative Logits
أي
0.79
سعی
0.77
பாண்டிய
0.76
動作
0.75
策略
0.74
çap
0.74
Closed
0.74
பிரச்சின
0.74
problém
0.73
Upgrade
0.71
POSITIVE LOGITS
exceeds
1.40
wynosi
1.36
determines
1.22
outweighs
1.22
outweigh
1.16
varies
1.15
определяется
1.08
beträgt
1.05
depends
1.05
составляет
1.05
Activations Density 0.205%