El refuerzo fomenta el comportamiento mientras que el castigo lo desalienta. Ambos desarrollan el aprendizaje a través de lo que se denomina condicionamiento operante, en el que los comportamientos aumentan o disminuyen según el tipo de resultado obtenido.
Edward Thorndike fue un psicólogo que primero estudió el condicionamiento operante, que describe el aprendizaje que se basa en las consecuencias del aprendiz. Su trabajo influyó en el de B.F. Skinner, un psicólogo del comportamiento que desarrolló los términos refuerzo y castigo en términos de condicionamiento operante. El trabajo de Skinner mostró que los castigos tienden a disminuir la probabilidad de comportamientos específicos, mientras que los refuerzos tienden a aumentar la probabilidad de comportamientos específicos.
Ambos términos se pueden describir en términos positivos y negativos. El refuerzo positivo ofrece algo deseable para aumentar los comportamientos positivos, mientras que el refuerzo negativo elimina algo indeseable para aumentar los comportamientos positivos. El castigo positivo ofrece algo indeseable para reducir los comportamientos negativos, mientras que el castigo negativo elimina algo deseable para reducir los comportamientos negativos.