My First Programa in Python
My first program
# comandos para importar librerías
import pandas
import numpy
# para revisar el formato de mis variables
data[‘ETHRACE2A’].dtype
# comandos para la lectura de la data de estudio
data = pandas.read_csv('nesarc_pds.csv’, low_memory=False)
print (len(data)) #number of observations (rows)
print (len(data.columns)) # number of variables (columns)
# comandos para indicar las variables númericas que emplearemos
data['S3AQ3A1R’] = pandas.to_numeric(data['S3AQ3A1R’], errors='coerce’)
data['S3AQ3B1’] = pandas.to_numeric(data['S3AQ3B1’])
data['S3AQ3C1’] = pandas.to_numeric(data['S3AQ3C1’])
# comandos para la distribución de frecuencias considerando conteo y en porcentaje y considerando las variables en blanco o vacío.
print('conteo para S3AQ3A1R duración en horas desde el último cigarro fumado’)
c1 = data['S3AQ3A1R’].value_counts(sort=False, dropna=False)
print (c1)
print('porcentajes para S3AQ3A1R duración en horas desde el último cigarro fumado’)
p1 = data['S3AQ3A1R’].value_counts(sort=False, normalize=True, dropna=False)
print (p1)
print('conteo para S3AQ3B1 frecuencia usual cuando fuman cigarros’)
c2 = data['S3AQ3B1’].value_counts(sort=False, dropna=False)
print (c2)
print('porcentajes para S3AQ3B1 frecuencia usual cuando fuman cigarros’)
p2 = data['S3AQ3B1’].value_counts(sort=False, normalize=True, dropna=False)
print (p2)
print('conteo para S3AQ3C1 cantidad usual cuando fuman cigarros’)
c3 = data['S3AQ3C1’].value_counts(sort=False, dropna=False)
print (c3)
print('porcentajes para S3AQ3C1 cantidad usual cuando fuman cigarros’)
p3 = data['S3AQ3C1’].value_counts(sort=False, normalize=True, dropna=False)
print (p3)
En la primera distribución se observa que:
- El mayor número de personas (5877, que equivale al 13.6% del total) reportó haber pasado 1 hora desde el último cigarro fumado.
- Una persona reportó un tiempo de 66 años desde que fumó el último cigarro.
- Existen 25080 personas que no muestran cuánto tiempo pasó desde su último cigarro, quizás por falta de conocimiento, error en la base de datos, etc.


En la segunda distribución se observa que:
- La mayor cantidad de personas (14836, que equivale al 34.4% del total) reportó fumar en una frecuencia diaria.
- La menor cantidad de personas (102, que equivale al 0.2% del total) reportó fumar en una frecuencia desconocida, quizás por falta de un patrón, o por ser esporádico, etc.
- Hay 25080 personas que no muestran su frecuencia de fumar cigarros, quizás por no querer reportarlo, error en la base de datos, etc.

En la tercera distribución se observa que:
- La mayor cantidad de personas (5366, que equivale al 12.4% del total) reportó fumar 20 cigarros cuando fuman.
- Otra cantidad apreciable es la de 3077 personas, es decir, 7.1% del total, que reportaron fumar 10 cigarros cuando fuman.










