INDEX
Negative Logits
semantics
0.78
chaos
0.73
merely
0.71
different
0.71
regression
0.71
latter
0.71
additives
0.71
variation
0.69
just
0.69
chromatic
0.69
POSITIVE LOGITS
సుకొ
0.89
préférence
0.87
積極的に
0.85
áveis
0.84
および
0.84
Drinking
0.84
drank
0.83
امن
0.82
réfrig
0.82
および
0.80
Activations Density 0.250%