INDEX
Negative Logits
Have
-0.07
/pm
-0.07
Maybe
-0.07
あまり
-0.06
ברשת
-0.06
talk
-0.06
免
-0.06
.color
-0.06
茵
-0.06
Due
-0.06
POSITIVE LOGITS
Zinc
0.07
0.07
(Api
0.07
Rogers
0.07
ungalow
0.07
とにか
0.07
.articles
0.07
strat
0.07
Tough
0.07
Crosby
0.07
Activations Density 0.006%