INDEX
Explanations
Lysandra, Atsumori
the neuron detects proper names / named entities (especially personal or character names).
New Auto-Interp
Negative Logits
exposé
0.31
gleichen
0.29
résult
0.28
reconnaît
0.27
indiqué
0.27
जेक्ट
0.27
Ķ
0.26
dificult
0.26
ließend
0.26
geändert
0.26
POSITIVE LOGITS
의
0.31
の
0.31
في
0.29
_
0.29
.
0.28
は
0.27
Baru
0.27
도
0.27
ー
0.26
الس
0.26
Activations Density 0.252%