INDEX
Negative Logits
lowercase
-0.08
_digit
-0.07
facility
-0.06
Touch
-0.06
Wi
-0.06
.attack
-0.06
_zone
-0.06
dicho
-0.06
Symbol
-0.06
ещ
-0.06
POSITIVE LOGITS
riv
0.07
239
0.07
narcotics
0.07
245
0.06
.POST
0.06
сед
0.06
Δεν
0.06
(())↵
0.06
olid
0.06
.Application
0.06
Activations Density 0.027%