AICYT: FUERZA DE PRODUCCION CIENTIFICA

Se llama “fuerza de producción” a los investigadores que podemos determinar en tanto que autores de artículos científicos. De alguna manera, la suma de autores nos indica la dimensión aproximada de una comunidad de investigación. La distribución de ellos como coautores o cosignatarios de artículos científicos nos está mostrando agrupamientos y cooperaciones. A veces se toma en cuenta la posición de los autores en la lista que aparece en los artículos. Los autores se pueden distribuir en función del número de artículos que ellos han publicado dentro de un periodo dado. Esta distribución sigue una ley empírica de potencia y que se conoce como la ley de Lotka. En general, la ley de Lotka define una distribución hiperbólica de los autores dentro de un campo específico y de un periodo dado.

Es usual, o al menos es la visión dominante, ordenar los autores por las citaciones o referencias que ellos reciben en un área específica y dentro de un periodo dado. Un medio indirecto es el “impact factor” (IF) que mide la tasa de citación que reciben las revistas científicas, siendo hasta ahora el más comúnmente utilizado el del ISI, hoy propiedad de la empresa Thomson-Reuters. Prácticamente es el termómetro de mayor uso en la administración o gestión de la ciencia, e incluso para establecer retribuciones a los investigadores-autores.

En lo que sigue, este último enfoque no se aplica porque la base de datos que utilizamos no lo permite, dado que no se cuenta con esta información. Indirectamente, se podría retener a las revistas que figuran en la intersección entre las bases INSPEC e ISI y así conocer su IF.

Al paso, mencionemos que los investigadores-autores pueden evaluarse mediante el índice de citación, siendo hoy el más debatido el “h-index” (o “Hirsch index”), véase al respecto la revista Scientometrics donde se encuentran más de 200 artículos refiriéndose a este índice.

¿Cómo es que vamos a proceder?

Primero se expone el número de autores por artículos de revista y de conferencia, observándose una distribución asimétrica por la derecha o asimétrica positiva.

Segundo se examina la producción de artículos (de revista y de conferencia) entre 1990 y 2010, su cantidad y distribución por año, y se le da una descripción estadística a la relación evidente entre número de autores y cantidad de artículos publicados.

Tercero se analiza la productividad científica de los autores en la que se manifiestan las leyes de Lotka y de Pareto definiendo una distribución hiperbólica de los investigadores.

Cuarto, dado lo anterior, se mide la desigualdad o concentración en la comunidad de productores de artículos científicos utilizando dos técnicas: una grafica, la curva de Lorenz, y otra numérica, el índice de Gini.

Quinto se distinguen dos clases de investigadores, la clase de autores nacionales y la clase de los autores extranjeros, el solapamiento de estas dos clases indica la existencia de cooperación científica, así como la internacionalización de la investigación local.

1 - Número de autores por artículos de revista y de conferencia

Los artículos científicos por lo general son producidos por más de un autor hecho que señala que la producción es dominantemente cooperativa, se trabaja y produce en equipo, son grupos de investigación que luego se manifiestan en la coautoría de los artículos publicados.

Tabla 1. La frecuencia en artículos del número de autores que los producen.

CONF designa a los articulos de conferencia y JOUR a los articulos de revista (journals).

Los artículos de 2 autores son los más frecuentes. A medida que se va aumentado el número de autores en la coautoría la frecuencia de artículos va en disminución. Es la característica que nos muestra la figura 1. Estadísticamente, se la llama distribución asimétrica por la derecha o asimétrica positiva, las frecuencias más altas se acumulan al principio de la distribución. Se denomina asimétrica por la derecha porque la cola de la distribución (donde están las frecuencias más bajas) está a la derecha.

Figura 1. Distribución asimétrica positiva.

Dado que se observa una distribución asimétrica por la derecha o asimétrica positiva, la moda =< media =< mediana. En efecto la moda está en los 2 autores, la media y la mediana se sitúan ambas en 5 autores. Mediante el coeficiente de asimetría se analiza numéricamente la simetría, si es igual a 0 la distribución es simétrica, si es mayor que 0 es asimétrica positiva (o por la derecha), y si es menor que 0 es asimétrica negativa (o por la izquierda). La asimetría positiva es mayor para el caso de los autores de artículos de revista que para los de conferencia, 1,66 y 1,36. En cuanto al rango, este es de 8 puesto que el mínimo es 1 y el máximo 9.

2 - Producción de los autores entre 1990-2010.

Sabemos que la producción se dimensiona por la cantidad de artículos. Los investigadores conjuntamente con resolver problemas producen artículos científicos en los que consignan los resultados de la investigación. La producción fue abordada anteriormente bajo el titulo PRODUCCION CIENTIFICA. Ahora se trata de medir el conjunto de autores respecto al conjunto de artículos publicados. En general, el número de autores (QA) es superior al número de artículos publicados (QP), QA > QP.

Tabla 2. Autores y artículos 1990-2010.

CONF = artículos de conferencia; JOUR = artículos de revista (“journal” en inglés). Se llama autor al investigador que produce una publicación.

En el primer bloque de la tabla 2 figuran los artículos por la modalidad de publicación y el total que ellos representan, así como también el total de autores, además se muestra el promedio de autores por articulo y luego la producción promedio de los autores.

En el segundo bloque aparece la distribución de los autores según los tipos de publicación y la intersección entre estos dos conjuntos de autores que son aquellos que figuran en los dos conjuntos, que son comunes a ambos grupos de autores. Además se exponen los porcentajes que la intersección significa para cada comunidad de autores. A esta parte se le puede dar una representación grafica utilizando, como se hace habitualmente, un diagrama de Venn.

Finalmente, se aplica un coeficiente de asociación para medir la conexión entre ambos grupos, es decir la intersección no vacía entre ambos conjuntos.

La relación lineal autor/publicación.

A la evidencia intuitiva de esta relación damos aquí una expresión estadística. No se despeja la duda de si existe o no alguna relación. Es una evidencia a la que se le da una medida estadística y que se resume en la figura 2a y b. Los artículos son la variable dependiente y los autores la variable explicativa. La cantidad de artículos (en las dos modalidades de publicación) está en relación lineal creciente con el número de autores. De ahí la importancia de la “masa crítica” necesaria para alcanzar un ritmo de crecimiento en la producción de artículos científicos. Siendo siempre la producción de artículos un indicador de la actividad de investigación en curso, dentro de un periodo, en nuestro caso 1990-2010.

Figura 2. La recta de regresión junto con la nube de puntos.

(a) la relación entre autores y artículos de conferencia (CONF)

(b) la relación entre autores y artículos de revista (JOUR)

La correlación nos indica si se puede decir que existe relación lineal entre el par de variables autores y artículos, el coeficiente de correlación es 0,887 para autores/artículos de conferencia y 0,960 para autores/artículos de revista. La regresión consiste en cifrar exactamente los coeficientes de tales relaciones lineales entre las variables. (Por ejemplo, si decimos que y = ax + b, se trata de encontrar los valores de a y b, operación que se denomina “estimación de mínimos cuadrados”). Los resultados de la regresión, como puede apreciarse en la figura 2, suponen que la cantidad de artículos aumenta 0,319 (CONF) y 0,412 (JOUR) por cada unidad que aumenta la comunidad de autores.

3 - Productividad científica

Pasemos de la “producción” a considerar la “productividad científica”. Por una parte tenemos la producción que se dimensiona por la cantidad de artículos, y por otra parte tenemos la productividad que se mide por la cantidad de artículos que produce cada investigador en un campo científico o tecnológico dentro de un periodo de tiempo. El primer aspecto fue analizado anteriormente. Aquí nos interesamos por el segundo aspecto: la productividad de los investigadores-autores. Estimamos que ella se define por la llamada “ley de Lotka” (Lotka, Alfred J. (1926). "The frequency distribution of scientific productivity". Journal of the Washington Academy of Sciences 16 (12): 317–324), o “ley de la productividad científica”, que consiste en una ley de potencia inversa que describe la tasa de productividad en términos de artículos científicos publicados en un periodo de tiempo.

La formula de Lotka establece que el número de autores que producen n publicaciones es aproximadamente 1/n^a de aquellos que publican 1 articulo. La formula puede escribirse y =C/n^a en donde y es la frecuencia relativa (o numero relativo o proporcional) de autores con n publicaciones, C y el exponente a son constantes que dependen del campo especifico. Lotka sugirió que el exponente a es casi siempre igual a 2, y la función puede entonces denominarse "inverse square law". Esto significa que el numero de autores produciendo 2 publicaciones es 1 / 2^2 = 1 / 4 = 0,250 de aquellos que producen 1 publicación; aquellos que producen 3 publicaciones es 1 / 3^2 = 1 / 9 = 0,110 y así sucesivamente. La determinación de las constantes empíricas, C y a, para un determinado set de datos puede hacerse por medio de una transformación logarítmica log y = log C – a log n, y utilizar la regresión lineal clásica (o método de mínimos cuadrados). También puede utilizarse el coeficiente de correlación lineal, 0 < r < 1, como medida de la bondad de ajuste (“goodness-of-fit”) entre la ecuación y los datos observados.

Figura 3. La productividad científica entre 1990 y 2010

a) la productividad de artículos de revista (JOUR)

n = número de artículos de revista; exponente a = 2; C = 1.

Coeficiente de correlación = 0,99977195

b) la productividad de artículos de conferencia (CONF)

n = número de artículos de conferencia; exponente a = 2; C = 1

Coeficiente de correlación = 0,997736267

Ambas modalidades de publicación siguen curvas de una misma forma descendente a medida que se pasa de los autores de 1 artículo a los de 2 y así sucesivamente. Entre 1, 2 y 3 artículos la caída del número de autores es fuerte, luego declina más lentamente hasta alcanzar el autor de 30 artículos de revista y el autor de 35 artículos de conferencia. Coloquialmente se dice que “muchos producen poco y pocos producen mucho”. Además, el ajuste entre los datos y lo previsto por la ley de Lotka es fuerte. Por último, como se tiene el nombre de cada investigador en los datos, podemos - si se quiere, o se requiere, - identificar cada uno de ellos dentro de una posición de productividad.

Se asocia la ley de Lotka a la máxima que "el éxito llama al éxito" ("success breeds success"), o a que “los ricos de hacen más ricos” (“the rich get richer”). Máximas que nos conducen a la “curva de la repartición de ingresos” de Pareto (1896) - ("La Courbe de la Repartition de la Richesse". In: G. Busino, editor (1965). Œuvres Complètes de Vilfredo Pareto. Geneva: Librairie Droz, t. 3 Ecrits sur la courbe de la répartition de la richesse).

Si la “ley de Pareto” (que originalmente se refiere a la distribución de ingresos) se formula (x(m)/x)^a, donde: x > x(m) es la riqueza de la gente más pobre (el subíndice m significa mínimo), y se aplica a nuestros datos, con los parámetros x > x(m) = 1 y a = 2, se obtienen los mismos resultados, la misma distribución. Nótese que cuanto más grande es el parámetro a, más pequeña será la proporción de investigadores muy “ricos” en artículos publicados. Hecho que podemos estimarlo como un proceso de concentración de la “renta” entendida ésta como el número de artículos publicados en el periodo, por tanto plantearnos las “medidas de desigualdad”

4 - Medidas de desigualdad

Como se sabe las medidas de desigualdad surgen con el estudio de la renta de los individuos y tratan de evaluar si la renta se reparte de manera igualitaria o si por el extremo opuesto pocos tienen mucho y los demás tienen poco. Los extremos son una situación de total igualdad y una situación de total concentración. Lo que se analiza entonces es, entre estas dos situaciones extremas, en qué situación se está, qué nivel de igualdad/desigualdad hay en el reparto. Para ello se han definidos dos técnicas: una grafica, la curva de Lorenz, y otra numérica, el índice de Gini.

a) Curva de Lorenz

Figura 4 La curva de Lorenz

JOUR = la distribución de los artículos de revista en la comunidad de investigadores

La lectura del grafico es que cuanto más próxima a la línea de igualdad mayor es el reparto de artículos entre los investigadores, mientras que si se aproxima al lado de abajo y al derecho del cuadrado será un caso de concentración.

b) Índice de Gini

Aunque la curva de Lorenz representa claramente las situaciones de mayor menor concentración (desigualdad), una medida numérica la aclara aun más. El índice de Gini calcula el área que hay entre la línea de igualdad y la curva de Lorenz; más exactamente el doble de esta área para que la medida esté entre 0 y 1. La lectura de este índice es sencilla: más próximo de 0 mayor igualdad, más próximo a 1 mayor desigualdad.

La fórmula del índice de Gini (IG) es:

IG = 1 - å (qi-1+qi)f1

Aplicando esta fórmula a los datos correspondientes a la publicación de artículos de revista, que está graficada por la curva de Lorenz en la figura 4, se obtiene IG = 1 – 0,80 = 0,20.

5 - Clases de investigadores-autores: nacionales y extranjeros

(Estudio en curso)

APENDICE

Tabla de datos sobre capital humano en la base de la OECD: para Chile se dispone solamente de los años 2007 y 2008 en la serie temporal

Diagrama que se deriva de la tabla OECD para el análisis del capital humano en investigación y I+D

Volver al PLAN DE ANALISIS

AICYT

sábado, 7 de enero de 2012

FUERZA DE PRODUCCION CIENTIFICA

No hay comentarios:

Publicar un comentario