INDEX
Explanations
moral duty and ethical frameworks
New Auto-Interp
Negative Logits
अफवाह
0.53
গুজব
0.51
உற்ச
0.47
คนิค
0.46
기능을
0.45
ช่วง
0.44
craze
0.44
ڈیٹا
0.44
পাখি
0.44
मार्केटिंग
0.43
POSITIVE LOGITS
moral
2.14
ethical
1.94
morally
1.92
Moral
1.91
morality
1.88
Moral
1.86
moral
1.84
ethics
1.82
道德
1.75
Ethical
1.72
Activations Density 0.058%