INDEX
Explanations
Chat/Conversations
This neuron detects conversational greetings and salutations (tokens used to say “hello” or open a conversation).
New Auto-Interp
Negative Logits
futuristic
-0.08
めた
-0.07
wurde
-0.07
iry
-0.07
McA
-0.06
itos
-0.06
strips
-0.06
trembling
-0.06
recursive
-0.06
.total
-0.06
POSITIVE LOGITS
lodash
0.07
presets
0.07
_PANEL
0.06
ディース
0.06
นาง
0.06
Якщо
0.06
违
0.06
尿
0.06
علام
0.06
車
0.06
Activations Density 0.025%