INDEX
Explanations
classification or decision making
New Auto-Interp
Negative Logits
จ
0.45
six
0.42
motorcycles
0.40
Vt
0.39
westward
0.38
ล
0.38
vietnam
0.37
six
0.37
lenght
0.37
unstable
0.37
POSITIVE LOGITS
decidir
0.48
Classifier
0.47
alakip
0.47
决定
0.46
這個
0.45
这个
0.44
Comparisons
0.44
这些
0.43
এইসব
0.43
这份
0.42
Activations Density 0.004%