INDEX
Negative Logits
ocasião
-0.08
DAT
-0.08
restaurants
-0.08
REB
-0.08
ОН
-0.08
iously
-0.08
øn
-0.07
exceptional
-0.07
apreci
-0.07
iav
-0.07
POSITIVE LOGITS
Presentation
0.08
су
0.08
заг
0.08
стан
0.08
Anonymous
0.07
danh
0.07
Nor
0.07
(Rem
0.07
pupp
0.07
narrator
0.07
Activations Density 0.001%