Otra vuelta de tuerca
El análisis estadístico que hemos emprendido sobre la protesta rural parece haber adquirido la densidad y persistencia del humo que cubre el área metropolitana de Buenos Aires.
La última vuelta de tuerca surgió al usar la soja como variable de control, para determinar si en efecto los cortes de ruta podían ser la consecuencia de una menor concentración de la tierra o a la presencia de pequeños y medianos productores. A partir de los resultados de las tablas, concluí que no había evidencia para afirmar una relación de causalidad entre concentración o escala y cortes de ruta. Sin embargo, revisando más cuidadosamente los coeficientes, debo decir que la evidencia resulta ambigua.
Sí, ya sé. Esto tiene más vueltas que la calesita. El quid de la cuestión pasa por la significación de la prueba de independencia estadística cuando se mantiene constante la variable soja.
Me explico. En estadística, el investigador determina qué nivel de confianza está dispuesto a aceptar para aceptar o rechazar una hipótesis. Estos niveles de confianza se calculan por la probabilidad de cometer el error de aceptar una hipótesis equivocada o de rechazar una hipótesis correcta. Lo mejor es elegir niveles altos, por arriba de 90%, es decir, que la probabilidad de cometer un error sea menor a 10% (p<0,1).
Vamos a los datos. Ver tabla 1, segunda subtabla. La asociación entre cortes de ruta y proporción de pequeños y medianos para las zonas sojeras tiene un nivel de significación p<0,114, es decir apenas sobre el nivel óptimo (p<0,1). En la tabla 2, segunda subtabla, la asociación entre concentración de la tierra y cortes de ruta da una significación de 0,24 (o sea, menos de 24% de probabilidad de error -lo que es mucho, pero…). Personalmente me inclino por la regla machacada en la academia de considerar aceptables solamente niveles p<0,05 (menos de 5% de probabilidad de error), pero por la web he encontrado artículos que consideran aceptables niveles de hasta p<0,2 (menos de 20% de probabilidad de error).
Entonces ¿hay causalidad o no? La evidencia estadística, como dije, es ambigua. Para afirmar que hay asociación más allá de la soja la probabilidad de error es mayor, pero no tanto (para los pequeños y medianos, poco más de 1 entre 10, contra 1 entre 20 recomendado). ¿Qué hacemos entonces? Pues, recolectar más información o resignarnos a que la evidencia no sea del todo concluyente, ni a favor ni en contra.
Bienvenidos al horno.
Lea también:
Publicado: sábado 19 de abril de 2008 a las 12:57 pm
Provincias.
Puede seguir todos los comentarios a esta entrada a través de RSS 2.0.
Puede dejar una respuesta, o referencia desde su propio sitio.
Andy
Un par de consideraciones, en mi carácter de diletante, sujetas a verificación por los especialistas.
1/ En el caso del arrendamiento y/o alquiler.
Si no entendí mal, en New York los propietarios de los terrenos donde están los rascacielos, arriendan por 100 años el espacio a los constructores.
Que a su vez subarriendan los pisos a los inquilinos.
¿La razón?, me parece que tiene que ver con los impuestos, y hay antecedentes de la época de Astor.
http://en.wikipedia.org/wiki/John_Jacob_Astor
http://en.wikipedia.org/wiki/William_Backhouse_Astor%2C_Sr.
2/En la Zona Núcleo, o Pampa Gringa, la soja ES parte de la rotación.
domingo 20 de abril de 2008 a las 11:41 amLa famosa Soja de Segunda, se siembra después de cosechar el Trigo, dentro del mismo año agrícola.
Para el Maíz es esencial la rotación con Soja, porque esta ultima fija nitrógeno al suelo.
Inclusive, ya se siembra en franjas Soja y Maíz, para las zonas con mucho viento.
Por eso el año agrícola no necesariamente es un año calendario, puede durar meses o mas de un año y medio.
Dependiendo del tipo de rotación que se haga.
La frase soja sobre soja, que es muy criticada dentro de los chacareros, es en realidad el monocultivo extractivo.
Un abrazo y mis disculpas por complicar el análisis.
Me parece totalmente lógico y razonable que los cortes se den donde hay mayor densidad de propietarios rurales por Ha ya que es precisamente alli de donde vienen los piqueteros rurales. Seria en consecuencia interesante investigar si la mayor densidad de propietarios rurales estan correlacionados con el indeice de gini.
domingo 20 de abril de 2008 a las 5:56 pmMuy bueno tu analisis y tu pagina!!!
Manolo, interesante lo que decís de los alquileres. Respecto a la soja de 1ra y 2da, según el CNA la primera es más o menos el doble que la segunda.
Fernando, gracias por tus comentarios. En una entrada previa hemos notado la correlación entre Gini y proporción de superficie de pequeños y medianos. Cabría ver respecto de la densidad de productores por ha.
lunes 21 de abril de 2008 a las 8:38 pmEn realidad, tendrias que ver que tantas observaciones tenes. A lo mejor, el problema es que tenes pocas obsevaciones y entonces te quedas con pocos grados de libertad cuando incorporas mas variables. Quedarian en el modelo las correlaciones mas fuertes mientras todo el resto se diluye. En ese caso, aceptar niveles de confianza de 10-20% tiene mas sentido. Cuando tenes muchas observaciones, justificar esos niveles es muy dificil.
jueves 24 de abril de 2008 a las 9:54 amMoe, las pruebas de independencia que aplico son para muestras pequeñas. De todas maneras una muestra un poco más grande sería lo óptimo, porque me quedan casilleros con frecuencias esperadas por debajo del mínimo. Claro, eso lleva al problema del muestreo en sí (un bolonqui infernal, por cierto), que hasta ahora no era tan importante en tanto la muestra del diario El Día resultaba lo suficientemente representativa.
jueves 24 de abril de 2008 a las 3:37 pm