INDEX
Negative Logits
at
0.61
he
0.52
ar
0.51
imi
0.51
os
0.49
im
0.49
abella
0.49
encije
0.49
ósito
0.48
amentos
0.48
POSITIVE LOGITS
Threats
0.55
threats
0.52
ದುಕೊಳ್ಳ
0.51
shampoos
0.51
СТ
0.51
Flat
0.50
你
0.47
Await
0.46
Buzz
0.46
Pup
0.46
Activations Density 0.000%