INDEX
Negative Logits
sembles
0.93
ob
0.88
诒
0.84
micelles
0.83
grantees
0.83
anath
0.81
berries
0.79
donuts
0.78
neurons
0.78
perils
0.78
POSITIVE LOGITS
Bunu
0.93
però
0.92
しかし
0.91
درصد
0.89
jednak
0.89
tarjeta
0.89
Algunos
0.88
Entrenamiento
0.87
ט
0.87
ello
0.86
Activations Density 0.002%