INDEX
Negative Logits
zón
0.65
hā
0.63
redditmedia
0.62
ziehung
0.61
orna
0.59
zné
0.59
tida
0.58
semblance
0.58
článku
0.58
ONES
0.57
POSITIVE LOGITS
써
0.56
../../../
0.55
Enemy
0.54
Dining
0.54
️
0.53
../../
0.51
cuales
0.49
лись
0.47
тори
0.47
ക്ര
0.46
Activations Density 0.834%