INDEX
Explanations
groups and their associations
New Auto-Interp
Negative Logits
ktorí
0.63
którzy
0.57
bedrijven
0.55
terlibat
0.50
giovani
0.49
famílias
0.49
powied
0.48
compañías
0.48
berusia
0.48
törté
0.48
POSITIVE LOGITS
a
0.54
data
0.54
(),
0.54
color
0.53
position
0.53
link
0.52
two
0.52
log
0.51
x
0.51
data
0.50
Activations Density 0.063%