INDEX
Explanations
economic crisisfinancial crisis
New Auto-Interp
Negative Logits
ные
0.88
ून
0.82
dır
0.80
err
0.73
िनी
0.71
risy
0.70
นี้
0.69
اں
0.65
तया
0.65
ंना
0.64
POSITIVE LOGITS
9
0.99
f
0.95
7
0.95
ב
0.94
5
0.89
ক
0.89
ப
0.89
crises
0.88
৭
0.88
8
0.87
Activations Density 0.007%