INDEX
Explanations
expressions of concern or reflection regarding personal or societal issues
New Auto-Interp
Negative Logits
dikembangkan
-0.44
uska
-0.40
optimised
-0.40
Suomessa
-0.40
hyrchwyd
-0.38
Források
-0.38
الدراسه
-0.38
tartalomajánló
-0.37
AsUp
-0.36
__':
-0.36
POSITIVE LOGITS
ModelExpression
0.69
دانشنامهٔ
0.56
fjspx
0.54
kaarangay
0.52
seeing
0.50
دیدن
0.49
Hentet
0.46
désolés
0.44
+#+
0.44
news
0.43
Activations Density 0.582%