INDEX
Explanations
virtually unparalleled, often credited
New Auto-Interp
Negative Logits
которое
0.75
яке
0.60
它
0.57
które
0.55
Оно
0.54
itself
0.54
которая
0.54
कहती
0.52
zostało
0.52
बताती
0.51
POSITIVE LOGITS
himself
1.02
இருக்கிறார்
0.76
personaggio
0.73
একজন
0.71
Himself
0.70
whom
0.70
someone
0.69
personnage
0.69
வருகிறார்
0.68
seorang
0.68
Activations Density 0.013%