De acuerdo con Unite for Sight, los científicos organizan datos de investigación a través de un proceso de codificación y asignación de nombres. Los investigadores a menudo usan software estadístico o programas de bases de datos para almacenar datos y crear archivos. Los científicos deben organizar los datos antes de que comience el análisis de los mismos.
Los científicos toman datos sin procesar de un experimento, observación u otro método de investigación y asignan cada pieza de información como una variable. Según la Universidad de California en Riverside, la forma en que un científico codifica una variable depende del tipo de variable. Una variable binaria recibe un código de cero o uno, mientras que las variables continuas reciben un número de código hasta las posibilidades de las opciones en el estudio. El tipo de variable informa la prueba estadística que utiliza el científico. Incluso algunos estudios cualitativos utilizan la codificación para organizar los datos en categorías. Dentro del software estadístico, cada variable recibe un nombre único para facilitar que los científicos realicen pruebas estadísticas o encuentren datos para una respuesta en particular.
Según la Administración de datos de investigación de la Universidad de Boston, los datos de cada estudio necesitan un nombre de archivo para una organización adicional. Los científicos ingresan datos y comienzan la organización en un programa de computadora tan pronto como los científicos capturan la primera parte de los datos. El desarrollo de una hoja de códigos estándar mejora la coherencia de la organización de los datos.