sábado, 7 de enero de 2012

CONEXIÓN CIENCIA-TECNOLOGIA

La conexión ciencia-tecnología a la que nos referimos es la que establece la base INSPEC al momento de registrar las publicaciones científicas, indexándolas en el campo de la clasificación con códigos de la clasificación internacional de patentes (CIP más conocido en inglés como IPC). De manera que la “conexión” es entre los códigos de clasificación INSPEC para la ciencia y los códigos de la clasificación internacional de patentes que aparecen conjuntamente en los registros (o datos bibliográficos).

Para la OECD: “Patent indicators are used to map aspects of the innovative performance and technological progress of countries, regions or certain specific domains and technology fields.”

En el enfoque que aquí se sigue, es a partir de la literatura científica producida por la investigación en Chile, que se indican las áreas tecnológicas significadas por los códigos de la clasificación internacional de patentes (IPC); áreas en las que se puede proceder al análisis de patentes. El análisis de patentes esta fuera del alcance de este estudio.

Grafo Ciencia Tecnología



Clases conocimiento publicado (C o CIENCIA):

B Electrical engineering and electronics
C Computers and control
"B0170N"  Reliability
"B8120"  Power transmission, distribution and supply
"B8120E"  ac transmission
"B8120J"  Distribution networks
"B8120L"  Power supply quality and harmonics
"B8130"  Power transmission lines and cables
"B8210" Energy resources
"B8230G"  Combined cycle power stations and plants
"B8245"  Wind power plants
"B8390"  Other power apparatus and electric machines
"C1180"  Optimisation techniques
"C1340K"  Nonlinear control systems
"C3110B"  Voltage control
"C3110G"  Frequency control
"C3340H"  Control of electric power systems
"C6110J"  Object-oriented programming
"C7410B"  Power engineering computing

Clases conocimiento patentado (IPC):

F Mechanical engineering; Lighting; Heating; Weapons; Blasting
G Physics
H Electricity
"F03D"  Wind motors
"G05F"  Systems for regulating electric or magnetic variables
"G06F17/50"  Computer-aided design
"G06F9/44"  Arrangements for executing specific programmes.
"H01B9/00"  Power cables
"H01G4/00"  Fixed capacitors; Processes of their manufacture
"H02J"  Circuit arrangements or systems for supplying or distributing electric power; Systems for storing electric energy
"H02M1/12"  Arrangements for reducing harmonics from ac input or output
"H02M7/00"  Conversion of ac power input into dc power output; Conversion of dc power input into ac power output

Figura 2. Ciencia Tecnología



(Estudio en progreso)

Volver al PLAN DE ANALISIS

CLASES DE CONOCIMIENTO

El conocimiento del que es cuestión se declina en términos de “ingeniería”, la que en el sistema de clasificación de la base INSPEC está indicada definida, en el campo que nos interesa, por las secciones:
A. PHYSICS
B. ELECTRICAL ENGINEERING AND ELECTRONICS
C. COMPUTERS AND CONTROL
E. MECHANICAL AND PRODUCTION ENGINEERING
Cada una de estas secciones se subdividen en clases que siguiendo una forma jerárquica se subdividen a la vez en subclases de menor extensión pero de mayor intención (o significación técnica). La extensión se mide por el número de unidades de información que han sido afectadas a una clase dada.
Cada clase tiene su frecuencia, en otras palabras el número de veces que aparece en el conjunto de datos. De ahí entonces que la frecuencia define su extensión. Es decir, el número de documentos clasificados en esas clases. Las clases se ordenan usualmente de mayor a menor extensión (o frecuencia).
La atribución de clases (clasificación) puede ir de una a varias para un mismo documento; los conocimientos presentes en los documento son representados por cada una de las clases. Esto posibilita pasar de una base de datos (fuente de información) a una base en la que los conocimientos están representados por clases, es decir por un sistema de clasificación.
Vínculos hipertexto permiten al usuario ir al o los documentos de cada clase. De forma que se pueda acceder a los autores, títulos, resúmenes, afiliaciones y revistas.
Ejemplo
En 2010 se produjeron 10 artículos de revista. El contenido de todos ellos está caracterizado exclusivamente por clases de la sección B. La clase B8110B Power system management, operation and economics, dado que ella ha servido para extraer los datos desde la base INSPEC, es la raíz a la que se remiten todos los datos.
Uno de los documentos es un “bibliografic review” sobre “Transmission of Electric Energy” y que se representa por dos clases B: B8120 Power transmission, distribution and supply y B8110D Power system planning and layout. El interés particular de los “bibliografic reviews” es que ellos sintetizan el campo científico o tecnológico al que se refieren, de una manera autorizada y certificada. El resto de los artículos responde a la publicación de resultados de investigación y a los que se les asignó 13 clases B:
3 (30%)           B8110D Power system planning and layout.             
3 (30%)           B8120 Power transmission, distribution and supply
2 (20%)           B8120J Distribution networks
1 (10%)           B0140 Administration and management.
1 (10%)           B0170Q Environmental factors.
1 (10%)           B0260 Optimisation techniques
1 (10%)           B8200 Generating stations and plants.
1 (10%)           B8210 Energy resources.
1 (10%)           B8215 Energy conservation.
1 (10%)           B8230J Geothermal power stations and plants
1 (10%)           B8240C Tidal power stations and plants
1 (10%)           B8245 Wind power plants
1 (10%)           B8250 Solar power stations and photovoltaic power systems
El número que precede a cada clase es su frecuencia, es decir, la extensión de la clase en el total de los documentos. En porcentaje, la frecuencia relativa que puede interpretarse como el valor que representa una clase en la cantidad de información.
El paso siguiente es representar la red de conocimiento mediante un grafo no dirigido y ponderado. Los vértices o nodos del grafo son las clases de conocimiento que se presentan en la lista. El peso de cada nodo está indicado por la frecuencia. Las aristas (enlaces o conexiones) son los documentos que comparten dos clases y el número de documentos da el peso de la arista en la red.
Figura 1. El grafo de clases de conocimiento.

(Grafo producido y editado con aiSee Graph Layout Software: http://www.aisee.com/)  
El grafo corresponde a las publicaciones de artículos de revista en 2010. Nada impide aplicar retrospectivamente a los años anteriores el mismo procedimiento, o bien tomar el periodo precedente 1990-2009. Nótese que es Chile en este caso el objeto de cada una de las clases de conocimientos de la red. Cada nodo es un tema o centro de interés u objeto de estudio o investigación centrados en la temática “Power system management, operation and economics”
Los documentos que constituyen a la arista se pueden visualizar asimismo que los documentos de cada nodo a través de  la identidad numérica del documento en la base de datos.  Al mismo tiempo que representar las clases de conocimiento, el grafo constituye un medio de acceso a los documentos mismos. El usuario o analista puede así navegar en la base de datos guiado por este “mapa conceptual”. Es un aspecto interesante desde el punto de vista de un sistema de información al servicio de la investigación.
Por otra parte, el grafo permite medir numéricamente cada una de las propiedades de la red conforme a la teoría de grafos. Por ejemplo, medir la centralidad de cada clase de conocimiento (nodos) en la red. El  grafo no es solo un instrumento de representación, de navegación, principalmente es un modelo matemático de análisis que aquí no desarrollamos.


(Estudio por editar)

Volver al PLAN DE ANALISIS

ACTORES INSTITUCIONALES

En general, el investigador es el autor de una publicación científica en la que se distinguen dos modalidades, los artículos de revista y los artículos de conferencia, sin embargo detrás de todo autor se encuentra una institución, un organismo de investigación que al momento de publicar todo investigador declara como su afiliación o dirección o domicilio. Bajo el términos de actor institucional nos referimos a la afiliación o dirección o domicilio del autor. Así pasamos del nivel de los individuos al nivel de las instituciones en el análisis de las publicaciones científicas. Usualmente, los individuos proponen los temas de investigación y solicitan recursos, las instituciones deciden y financian. Se supone que los actores institucionales se comportan de acuerdo con una política científica. Al lado de ellos se encuentran las agencias y fondos de financiamiento de proyectos o iniciativas de investigación. Se supone igualmente que el comportamiento de estas agencias corresponde a definiciones estratégicas de política científica.
¿Qué se busca analizar a través de los actores institucionales?
Primero se trata de identificar y medir la producción científica de las instituciones de manera a establecer un ranking en el sector de investigación. Las instituciones pueden ser académicas o firmas o empresas del sector económico de actividad. Las que a su vez pueden ser públicas o privadas.
Segundo la colaboración entre actores institucionales. Las colaboraciones 1) entre actores institucionales nacionales, 2) entre estos y actores institucionales extranjeros y3) entre actores académicos y no académicos o económicos.
Quedan fuera del análisis aspectos importantes respecto a la producción científica de las instituciones, tales que los recursos humanos destinados a la investigación en el sector considerado,  los recursos económicos o financiamiento que los actores instituciones realizan y los proyectos de investigación que están al origen de las publicaciones científicas que aquí se analizan. 

OECD

Antes de entrar en materia, mencionemos que la OECD distingue la “Basic research expenditure” de la “Gross expenditure on R&D” (GERD) en donde distingue entre los actores institucionales que financian y los que ejecutan actividades de R&D es decir de investigación y desarrollo (I&D). Los actores institucionales que financian la GERD de un país son la industria, el gobierno, otras fuentes y las de afuera o extranjeras. Los actores institucionales que ejecutan GERD son cuatro sectores: empresa (“business Enterprise”), educación superior, gobierno y sin fines de lucro.

Figura 1 Esquema OECD de los actores institucionales


Tabla 1 Los datos numéricos para Chile 2007 y 2008. (OECD.Stat Extracts Main Science and Technology Indicators)



[1] GERD* as percentage of GDP  (*GERD = Gross expenditure on R&D)
[2] Estimated Civil GERD as a percentage of GDP
[3] Basic research expenditure as a percentage of GDP
[4] Industry-financed GERD as a percentage of GDP
[5] Government-financed GERD as a percentage of GDP
[6] Percentage of GERD financed by Industry
[7] Percentage of GERD financed by Government
[8] Percentage of GERD financed by other national sources
[9] Percentage of GERD financed by abroad
[10] Percentage of GERD performed by the Business Enterprise sector
[11] Percentage of GERD performed by the Higher Education sector
[12] Percentage of GERD performed by the Government sector
[13] Percentage of GERD performed by the Private Non-Profit sector

Actores institucionales

Para comenzar, veamos en la producción de artículos de conferencia, y luego de artículos de revista, el número de actores institucionales por artículo.

Tabla  2. Número de actores institucionales por artículo



[1] Número de actores institucionales coautores por artículo
[2] Número de artículos
CONF: Artículos de conferencia
JOUR:  Artículos de revista
S/AD: Sin dirección de la institución de afiliación de los autores

De la tabla 2 se desprende que el modo dominante de llevar a cabo la investigación es dentro de los muros de una sola institución. En cambio, la cooperación entre actores institucionales se reduce al 9%. La figura 2 traduce gráficamente esta realidad.

Figura 2  Relación de proporción inversa


A mayor número de actores institucionales en coautoría menor número de artículos producidos de revista y de conferencia

a) Artículos de conferencia

Dentro del periodo 1976-2010, el 87% de los artículos de conferencia son mono institucional, son el producto de un solo actor institucional; 8% es resultado de dos actores institucionales; 5% tres actores institucionales. Si se toma la coautoría como un indicador de colaboración científica entre instituciones, entonces podemos decir que la cooperación científica entre organismos es baja 12%, en cambio la no colaboración es netamente dominante. Datos en la tabla 2.

En la serie que va de 1976 a 2010 se observa que la cooperación de 2 tiene lugar entre 2008-2010, la cooperación de 3 en 2009 y 2010, es decr, hacia el fin del periodo la cooperación aumenta, señal que la investigación en cooperación inter-institucional se desarrolla en la producción de artículos de conferencia.

b) Artículos de revista

Dentro del periodo 1978-2010, el 89%  de los artículos de revista son mono institucional, son el producto de un solo actor institucional; 6% es resultado de dos actores institucionales; 3% tres actores institucionales y 2% de cuatro actores institucionales. Si se toma la coautoría como un indicador de colaboración científica entre instituciones, entonces podemos decir que la cooperación científica entre organismos es baja 10%, en cambio la no colaboración es netamente dominante. Datos en la tabla 2.

En la serie de 1978 a 2010 se observa la cooperación de 2 entre 2009-2010, la cooperación de 3 en 2008 y 2010 y 4 en 2010, esto es, hacia el fin del periodo la cooperación se acrecienta, índice que la investigación.en cooperación inter-institucional se desarrolla para la producción de artículos de revista.

Análisis de actores nacionales (NAC) y extranjeros (EXT).

El total de agentes institucionales es de 40 organismos, de los cuales 42,5% son nacionales y 57,5% extranjeros como se indica en la tabla 3, donde las instituciones están representados por siglas que se describen más abajo en el Índex de actores institucionales.

Tabla 3 Distribución por nacionalidad



Además de la condición de localización en países, a los actores instituciones se los reconoce por los sectores de actividad en los que se inscriben: A = Academia; E = Empresa; G = Gobierno (Ver más arriba el esquema OECD de los sectores). Los datos estadísticos se exponen en la tabla 4.

Tabla 4 Sectores y localización.


Distribución de los actores institucionales según la modalidad de publicación.
Se distinguen tres grupos: una minoría de actores institucionales 15% aparece exclusivamente como autor de artículos de conferencia (CONF); en cambio la mayoría 62,5% publica exclusivamente artículos de revista (JOUR); entre ambos conjuntos un grupo  que representa el 22,5% de los actores institucionales participa a la vez en ambas modalidades de publicación.

Tabla 5 Distribución según la modalidad de publicación.

A = Academia; E = Empresa o firmas; G = Gobierno

La tabla 5 podría entonces representarse por un diagrama de Venn (15% (22,5%) 62,5%). La orientación es netamente hacia la publicación de artículos de revista. Otra observación es lo que representa numéricamente y en porcentage cada uno de los sectores dentro de las modalidades de publicación.

Figura 3. Grafo de colaboración institucional



 
INDEX DE ACTORES INSTITUCIONALES



 
(Estudio en curso)

Volver al PLAN DE ANALISIS

FUERZA DE PRODUCCION CIENTIFICA

Se llama “fuerza de producción” a los investigadores que podemos determinar en tanto que autores de artículos científicos. De alguna manera, la suma de autores nos indica la dimensión aproximada de una comunidad de investigación. La distribución de ellos como coautores o cosignatarios de artículos científicos nos está mostrando agrupamientos y cooperaciones. A veces se toma en cuenta la posición de los autores en la lista que aparece en los artículos. Los autores se pueden distribuir en función del número de artículos que ellos han publicado dentro de un periodo dado. Esta distribución sigue una ley empírica de potencia y que se conoce como la ley de Lotka. En general, la ley de Lotka define una distribución hiperbólica de los autores dentro de un campo específico y de un periodo dado.

Es usual, o al menos es la visión dominante, ordenar los autores por las citaciones o referencias que ellos reciben en un área específica y dentro de un periodo dado. Un medio indirecto es el “impact factor” (IF) que mide la tasa de citación que reciben las revistas científicas, siendo hasta ahora el más comúnmente utilizado el del ISI, hoy propiedad de la empresa Thomson-Reuters. Prácticamente es el termómetro de mayor uso en la administración o gestión de la ciencia, e incluso para establecer retribuciones a los investigadores-autores.

En lo que sigue, este último enfoque no se aplica porque la base de datos que utilizamos no lo permite, dado que no se cuenta con esta información. Indirectamente, se podría retener a las revistas que figuran en la intersección entre las bases INSPEC e ISI y así conocer su IF.

Al paso, mencionemos que los investigadores-autores pueden evaluarse mediante el índice de citación, siendo hoy el más debatido el “h-index” (o “Hirsch index”), véase al respecto la revista Scientometrics donde se encuentran más de 200 artículos refiriéndose a este índice.

¿Cómo es que vamos a proceder?

Primero se expone el número de autores por artículos de revista y de conferencia, observándose una distribución asimétrica por la derecha o asimétrica positiva.

Segundo se examina la producción de artículos (de revista y de conferencia) entre 1990 y 2010, su cantidad y distribución por año, y se le da una descripción estadística a la relación evidente entre número de autores y cantidad de artículos publicados.

Tercero se analiza la productividad científica de los autores en la que se manifiestan las leyes de Lotka y de Pareto definiendo una distribución hiperbólica de los investigadores.

Cuarto, dado lo anterior, se mide la desigualdad o concentración en la comunidad de productores de artículos científicos utilizando dos técnicas: una grafica, la curva de Lorenz, y otra numérica, el índice de Gini.

Quinto se distinguen dos clases de investigadores, la clase de autores nacionales y la clase de los autores extranjeros, el solapamiento de estas dos clases indica la existencia de cooperación científica, así como la internacionalización de la investigación local.

1 - Número de autores por artículos de revista y de conferencia

Los artículos científicos por lo general son producidos por más de un autor hecho que señala que la producción es dominantemente cooperativa, se trabaja y produce en equipo, son grupos de investigación que luego se manifiestan en la coautoría de los artículos publicados.

Tabla 1. La frecuencia en artículos del número de autores que los producen.


CONF designa a los articulos de conferencia y JOUR a los articulos de revista (journals).

Los artículos de 2 autores son los más frecuentes. A medida que se va aumentado el número de autores en la coautoría la frecuencia de artículos va en disminución. Es la característica que nos muestra la figura 1. Estadísticamente, se la llama distribución asimétrica por la derecha o asimétrica positiva, las frecuencias más altas se acumulan al principio de la distribución. Se denomina asimétrica por la derecha porque la cola de la distribución (donde están las frecuencias más bajas) está a la derecha.

Figura 1. Distribución asimétrica positiva.


Dado que se observa una distribución asimétrica por la derecha o asimétrica positiva, la moda =< media =< mediana. En efecto la moda está en los 2 autores, la media y la mediana se sitúan ambas en 5 autores. Mediante el coeficiente de asimetría se analiza numéricamente la simetría, si es igual a 0 la distribución es simétrica, si es mayor que 0 es asimétrica positiva (o por la derecha), y si es menor que 0 es asimétrica negativa (o por la izquierda). La asimetría positiva es mayor para el caso de los autores de artículos de revista que para los de conferencia, 1,66 y 1,36. En cuanto al rango, este es de 8 puesto que el mínimo es 1 y el máximo 9.

2 - Producción de los autores entre 1990-2010.
Sabemos que la producción se dimensiona por la cantidad de artículos. Los investigadores conjuntamente con resolver problemas producen artículos científicos en los que consignan los resultados de la investigación. La producción fue abordada anteriormente bajo el titulo PRODUCCION CIENTIFICA. Ahora se trata de medir el conjunto de autores respecto al conjunto de artículos publicados. En general, el número de autores (QA) es superior al número de artículos publicados (QP), QA > QP.
Tabla 2. Autores y artículos 1990-2010.

CONF = artículos de conferencia; JOUR = artículos de revista (“journal” en inglés). Se llama autor al investigador que produce una publicación.
En el primer bloque de la tabla 2 figuran los artículos por la modalidad de publicación y el total que ellos representan, así como también el total de autores, además se muestra el promedio de autores por articulo y luego la producción promedio de los autores.
En el segundo bloque aparece la distribución de los autores según los tipos de publicación y la intersección entre estos dos conjuntos de autores que son aquellos que figuran en los dos conjuntos, que son comunes a ambos grupos de autores. Además se exponen los porcentajes que  la intersección significa para cada comunidad de autores. A esta parte se le puede dar una representación grafica utilizando, como se hace habitualmente, un diagrama de Venn.
Finalmente, se aplica un coeficiente de asociación para medir la conexión entre ambos grupos, es decir la intersección no vacía entre ambos conjuntos.

La relación lineal autor/publicación.
A la evidencia intuitiva de esta relación damos aquí una expresión estadística. No se despeja la duda de si existe o no alguna relación. Es una evidencia a la que se le da una medida estadística y que se resume en la figura 2a y b. Los artículos son la variable dependiente  y los autores la variable explicativa. La cantidad de artículos (en las dos modalidades de publicación) está en relación lineal creciente con el número de autores. De ahí la importancia de la “masa crítica” necesaria para alcanzar un ritmo de crecimiento en la producción de artículos científicos. Siendo siempre la producción de artículos un indicador de la actividad de investigación en curso, dentro de un periodo, en nuestro caso 1990-2010.
Figura 2. La recta de regresión junto con la nube de puntos.

(a) la relación entre autores y artículos de conferencia (CONF)

(b) la relación entre autores y artículos de revista (JOUR)


La correlación nos indica si se puede decir que existe relación lineal entre el par de variables autores y artículos, el coeficiente de correlación es 0,887 para autores/artículos de conferencia y 0,960 para autores/artículos de revista. La regresión consiste en cifrar exactamente los coeficientes de tales relaciones lineales entre las variables. (Por ejemplo, si decimos que y = ax + b, se trata de encontrar los valores de a y b, operación que se denomina “estimación de mínimos cuadrados”). Los resultados de la regresión, como puede apreciarse en la figura 2, suponen que la cantidad de artículos aumenta 0,319 (CONF) y 0,412 (JOUR) por cada unidad que aumenta la comunidad de autores.

3 - Productividad científica
Pasemos de la “producción” a considerar la “productividad científica”.  Por una parte tenemos la producción que se dimensiona por la cantidad de artículos, y por otra parte tenemos la productividad que se mide por la cantidad de artículos que produce cada investigador en un campo científico o tecnológico dentro de un periodo de tiempo. El primer aspecto fue analizado anteriormente. Aquí nos interesamos por el segundo aspecto: la productividad de los investigadores-autores. Estimamos que ella se define por la llamada “ley de Lotka” (Lotka, Alfred J. (1926). "The frequency distribution of scientific productivity". Journal of the Washington Academy of Sciences 16 (12): 317–324), o “ley de la productividad científica”, que consiste en una ley de potencia inversa que describe la tasa de productividad en términos de artículos científicos publicados en un periodo de tiempo.
La formula de Lotka establece que el número de autores que producen n publicaciones es aproximadamente 1/n^a de aquellos que publican 1 articulo. La formula puede escribirse y =C/n^a en donde y es la frecuencia relativa (o numero relativo o proporcional) de autores con n publicaciones, C y el exponente a son constantes que dependen del campo especifico. Lotka sugirió que el exponente a es casi siempre igual a 2, y la función puede entonces denominarse "inverse square law". Esto significa que el numero de autores produciendo 2 publicaciones es 1 / 2^2 = 1 / 4 = 0,250 de aquellos que producen 1 publicación; aquellos que producen 3 publicaciones es 1 / 3^2 = 1 / 9 = 0,110  y así sucesivamente. La determinación de las constantes empíricas, C y a, para un determinado set de datos puede hacerse por medio de una transformación logarítmica log y = log C – a log n, y utilizar la regresión lineal clásica (o método de mínimos cuadrados). También puede utilizarse el coeficiente de correlación lineal, 0 < r  < 1, como medida de la bondad de ajuste (“goodness-of-fit”) entre la ecuación y los datos observados.
Figura 3. La productividad científica entre 1990 y 2010
a) la productividad de artículos de revista (JOUR)

n = número de artículos de revista; exponente a = 2; C = 1.                       
Coeficiente de correlación = 0,99977195    
b) la productividad de artículos de conferencia (CONF)

n = número de artículos de conferencia; exponente a = 2; C = 1    
Coeficiente de correlación = 0,997736267
 Ambas modalidades de publicación siguen curvas de una misma forma descendente a medida que se pasa de los autores de 1 artículo a los de 2 y así sucesivamente. Entre 1,  2 y 3 artículos la caída del número de autores es fuerte, luego declina más lentamente hasta alcanzar el autor de 30 artículos de revista y el autor de 35 artículos de conferencia. Coloquialmente se dice que “muchos producen poco y pocos producen mucho”. Además, el ajuste entre los datos y lo previsto por la ley de Lotka es fuerte. Por último, como se tiene el nombre de cada investigador en los datos, podemos - si se quiere, o se requiere, - identificar cada uno de ellos dentro de una posición de productividad.
Se asocia la ley de Lotka a la máxima que "el éxito llama al éxito" ("success breeds success"), o a que “los ricos de hacen más ricos” (“the rich get richer”). Máximas que nos conducen a la “curva de la repartición de ingresos” de Pareto (1896) -  ("La Courbe de la Repartition de la Richesse". In: G. Busino, editor (1965). Œuvres Complètes de Vilfredo Pareto. Geneva: Librairie Droz, t. 3 Ecrits sur la courbe de la répartition de la richesse).
Si la “ley de Pareto” (que originalmente se refiere a la distribución de ingresos) se formula (x(m)/x)^a, donde: x > x(m) es la riqueza de la gente más pobre (el subíndice m significa mínimo), y se aplica a nuestros datos, con los parámetros x > x(m) = 1 y a = 2,  se obtienen los mismos resultados, la misma distribución. Nótese que cuanto más grande es el parámetro a, más pequeña será la proporción de investigadores muy “ricos” en artículos publicados. Hecho que podemos estimarlo como un proceso de concentración de la “renta” entendida ésta como el número de artículos publicados en el periodo, por tanto plantearnos las “medidas de desigualdad”

4 - Medidas de desigualdad

Como se sabe las medidas de desigualdad surgen con el estudio de la renta de los individuos y tratan de evaluar si la renta se reparte de manera igualitaria o si por el extremo opuesto pocos tienen mucho y los demás tienen poco. Los extremos son una situación de total igualdad y una situación de total concentración. Lo que se analiza entonces es, entre estas dos situaciones extremas, en qué situación se está, qué nivel de igualdad/desigualdad hay en el reparto. Para ello se han definidos dos técnicas: una grafica, la curva de Lorenz, y otra numérica, el índice de Gini.
a) Curva de Lorenz

Figura 4 La curva de Lorenz
JOUR = la distribución de los artículos de revista en la comunidad de investigadores

La lectura del grafico es que cuanto más próxima a la línea de igualdad mayor es el reparto de artículos entre los investigadores, mientras que si se aproxima al lado de abajo y al derecho del cuadrado será un caso de concentración.

b) Índice de Gini
Aunque la curva de Lorenz representa claramente las situaciones de mayor menor concentración (desigualdad), una medida numérica la aclara aun más. El índice de Gini calcula el área que hay entre la línea de igualdad y la curva de Lorenz; más exactamente el doble de esta área para que la medida esté entre 0 y 1. La lectura de este índice es sencilla: más próximo de 0 mayor igualdad, más próximo a 1 mayor desigualdad.
La fórmula del índice de Gini (IG) es:
IG = 1 - å (qi-1+qi)f1

Aplicando esta fórmula a los datos correspondientes a la publicación de artículos de revista, que está graficada por la curva de Lorenz en la figura 4, se obtiene IG = 1 – 0,80 = 0,20.

5 - Clases de investigadores-autores: nacionales y extranjeros

(Estudio en curso)

APENDICE

Tabla de datos sobre capital humano en la base de la OECD: para Chile se dispone solamente de los años 2007 y 2008 en la serie temporal


Diagrama que se deriva de la tabla OECD para el análisis del capital humano en investigación y I+D







Volver al PLAN DE ANALISIS

PRODUCCION CIENTIFICA

Los resultados de la investigación se miden por la cantidad de artículos publicados en revistas y conferencias. Entre 1976 y 2011, 230 artículos de revistas (53%) y conferencias (47%) han sido publicados por autores domiciliados o no en instituciones chilenas. Artículos registrados en la base especializada INSPEC. Este conjunto es el resultado de la consulta efectuada el 28/07/2011. En la presentación se mantiene la distinción artículos de revistas y de conferencias. Al mismo tiempo que la cantidad, la distribución en el tiempo (por años) y la tasa de producción, se compara el comportamiento de estos dos tipos de publicaciones. La unidad de análisis es el artículo y las dos variables cualitativas son revistas y conferencias. Entonces, el propósito es estudiar estadísticamente este par de atributos y si existe algún tipo de relación.

Recordemos que la producción científica que se analiza corresponde a la categoría especifica “B8110B Power system management, operation and economics.”

Se distingue dos periodos: uno “prehistórico” y otro de “investigación en desarrollo”.

PRIMER PERIODO

Tabla 1. Producción de artículos científicos entre 1976 y 1989


CONF = artículos de conferencias
JOUR = artículos de revistas

En los 14 años, aparecen 6 años sin producción (que representan 43% del periodo). El último año representa el 50% de la producción de todo el periodo, es un indicador que hacia fines de este primer periodo se comienza a consolidar una actividad de investigación, la que se traduce en más publicaciones. Por otra parte, los artículos de conferencia representan el 55%, mientras que los artículos de revistas no son más que el 45%, lo que podría tomarse como el indicio de un campo de investigación aun no constituido, en posible emergencia.

Descripción estadística: medidas de posición para el primer periodo (1976-1989).



Figura 1. Producción de artículos científicos entre 1976 y 1989


CONF = artículos de conferencias
JOUR = artículos de revistas

SEGUNDO PERIODO

Este segundo periodo que va de 1990 a 2010, y que hemos llamado “investigación en desarrollo”, se analiza primero en términos de producción, luego de rendimiento y tercero según las modalidades de publicación, i. e. artículos de conferencia y artículos de revista.

1 - Producción

Tabla 2. Producción de artículos científicos entre 1990 y 2010


CONF = artículos de conferencias
JOUR = artículos de revistas

Tabla 3. Las modalidades de publicación entre 1990 y 2010


CONF = artículos de conferencias
JOUR = artículos de revistas

Figura 2. Producción de artículos científicos entre 1990 y 2010


C = CONF = artículos de conferencias
J = JOUR = artículos de revistas
C+J = la suma de artículos científicos

La tendencia refleja el comportamiento ascendente o descendente, y refleja condiciones coyunturales en la economía de la producción científica de publicaciones. Tendencia lineal de las curvas de producción de artículos que aparecen en la figura 2:

CONF: y = 0,270x + 1,933
JOUR: y = 0,477x + 0,076
CONF+JOUR: y = 0,748x + 2,009

Descripción estadística del periodo 1990-2010

Medidas de posición [1], de dispersión [2], de forma [3] de las modalidades y de su suma o total, y de si existe algún tipo de relación [4] entre el par de modalidades.



Tasa de crecimiento

Para medir la tasa de crecimiento entre 1990 y 2010, aplicamos la media geométrica, de esta manera se revela que la tasa de crecimiento de “artículos de revista” es de 12% y la de “artículos de conferencia” de 5% en el periodo cuya serie es de 21 años.


2 - Rendimiento

El rendimiento se enfoca desde el punto de vista de la producción media o del promedio y enseguida desde la llamada “ley de Bradford” o “ley de rendimientos decrecientes”.

Figura 3. Rendimiento por sobre y bajo la media en el periodo 1990-2010


En el año 2005 producción y media coinciden. Se distinguen dentro del periodo dos etapas: la primera está por debajo de la media y la segunda por encima. Indicador de un aumento en el rendimiento.

Rendimiento decreciente y ley de Bradford

La “ley de Bradford” es un modelo enunciado el año 1934 originalmente por Samuel C. Bradford para estimar la disminución exponencial de rendimiento (Bradford, S. C., “Sources of Information on Specific Subjects”, Engineering (London), 137, 1934 (26 January), p. 85-86; reeditado in Journal of Information Science, 10, 4, 1985, p. 176-180). La “ley de Bradford” define una “distribución de rendimiento decreciente” que se la conoce también bajo la denominación de “distribución de Pareto”.

Figura 4. Ranking de los años (1990-2010) por rendimiento decreciente


Esta distribución corresponde a lo previsto por la “ley de Bradford”. En la abscisa, el orden de rango de 1 a 21 fija la posición de cada uno de los años del periodo de acuerdo al rendimiento decreciente de producción de artículos. A medida que los años retroceden en el orden de rango (ranking) como fuentes de información, esto es, de producción de artículos científicos, su rendimiento es decreciente. Ciertamente que el rango no corresponde al orden cronológico de los años. En ordenada, la frecuencia acumulada de artículos publicados expresada en porcentaje. Los valores numéricos exactos se encuentran en la tabla 4.

Tabla 4. Distribución de rendimientos decrecientes


Con solo tres años (cuyo orden de ranking es 2010, 2003 y 2002) se produce el 25%, para alcanzar el 54% se necesitaron cuatro años (2009, 2004, 2006 y 1995), para obtener el 76% otros cuatro años mas (2008, 1997, 2001, 2007), finalmente el último cuarto supone 10 años (el ranking de esos años se observa en la tabla 4). Mayoritariamente este ranking se ajusta a dos etapas cronológicas, en los primeros lugares los años dos mil, y luego los años noventa del periodo (1990-2010). Lógicamente aparece una correspondencia con excepciones entre el rendimiento y el paso de los años dentro del periodo, síntoma de un campo de investigación que se organiza mejor y se desarrolla en número, calidad y recursos. A verificar por medio de otros análisis.

En cuanto a la “ley de Bradford”, véase Garfield, E. (1980) "Bradford's law and related statistical pattern". Current Contents, 19, May 12, p. 5-12. (open access in http://garfield.library.upenn.edu)

3 - Relación entre modalidades de publicación

Plantémonos la cuestión de identificar y cuantificar alguna relación funcional entre las dos variables CONF y JOUR: ¿Existe una relación posible entre las modalidades de publicación? La correlación nos indica si se puede decir que existe relación entre un par de variables. La regresión consiste en cifrar exactamente los coeficientes de tal relación lineal entre variables. En las gráficas de dispersión de las figuras 5 y 6 intuitivamente se observa que no hay una relación entre ambas modalidades de publicación.

En el modelo de regresión, como sabemos, se dice que una variable depende de la otra: Y depende de X. Esto se escribe Y = f(X) y se lee Y es función de X. Debido a que Y depende de X, Y es la variable dependiente y X es la variable independiente. Identificar cuál es la variable dependiente y cuál es la variable independiente depende de la lógica y de lo que se intente medir. Digamos que se desea analizar la relación entre la publicación de “artículos de conferencia” (CONF) y de “artículos de revista” (JOUR). Se presume que pueda existir una relación entre estas dos modalidades de publicación de artículos científicos: o bien “artículos de revista” es la variable dependiente y “artículos de conferencia” es la variable independiente (figura 5), o bien inversamente “artículos de conferencia” es la variable dependiente y “artículos de revista” es la variable independiente (figura 6). El resultado es elocuente como puede constarse en las dos figuras. Si relación hay entre estas dos variables ella no responde al modelo de la regresión simple o bivariante. Habría que analizar si las modalidades de publicación se relacionan entre ellas de acuerdo con un modelo de regresión múltiple, Y = f(X1, X2, …, Xk), que supone entonces identificar previamente las k variables explicativas. Dejemos este planteamiento como “offene Frage.”

Figura 5. La recta de regresión de la nube de puntos JOUR


JOUR = artículos de revista (en inglés, journal)

Figura 6. La recta de regresión de la nube de puntos CONF


CONF = artículos de conferencia

3 - Productividad científica

Pasemos de la “producción” a considerar la “productividad científica”. Por una parte tenemos la producción que se dimensiona por la cantidad de artículos, y por otra parte tenemos la productividad que se mide por la cantidad de artículos que produce cada investigador en un campo científico o tecnológico dentro de un periodo de tiempo. El primer aspecto fue analizado anteriormente. Aquí nos interesamos por el segundo aspecto: la productividad de los investigadores-autores. Estimamos que ella se define por la llamada “ley de Lotka” (Lotka, Alfred J. (1926). "The frequency distribution of scientific productivity". Journal of the Washington Academy of Sciences 16 (12): 317–324), o “ley de la productividad científica”, que consiste en una ley de potencia inversa que describe la tasa de productividad en términos de artículos científicos publicados en un periodo de tiempo. La formula de Lotka establece que el número de autores que producen n publicaciones es aproximadamente 1/n^a de aquellos que publican 1 articulo. La formula puede escribirse y =C/n^a en donde y es la frecuencia relativa (o numero relativo o proporcional) de autores con n publicaciones, C y el exponente a son constantes que dependen del campo especifico. Lotka sugirió que el exponente a es casi siempre igual a 2, y la función puede entonces denominarse "inverse square law". Esto significa que el numero de autores produciendo 2 publicaciones es 1 / 2^2 = 1 / 4 = 0,250 de aquellos que producen 1 publicación; aquellos que producen 3 publicaciones es 1 / 3^2 = 1 / 9 = 0,110 y así sucesivamente. La determinación de las constantes empíricas, C y a, para un determinado set de datos puede hacerse por medio de una transformación logarítmica log y = log C – a log n, y utilizar la regresión lineal clásica (o método de mínimos cuadrados). También puede utilizarse el coeficiente de correlación lineal, 0 < r < 1, como medida de la bondad de ajuste (“goodness-of-fit”) entre la ecuación y los datos observados.

Figura 3. La productividad científica entre 1990 y 2010

a) la productividad de artículos de revista (JOUR)


n = número de artículos de revista; exponente a = 2; C = 1.

Coeficiente de correlación = 0,99977195

b) la productividad de artículos de conferencia (CONF)


n = número de artículos de conferencia; exponente a = 2; C = 1    
Coeficiente de correlación = 0,997736267
Ambas modalidades de publicación siguen curvas de una misma forma descendente a medida que se pasa de los autores de 1 artículo a los de 2 y así sucesivamente. Entre 1,  2 y 3 artículos la caída del número de autores es fuerte, luego declina más lentamente hasta alcanzar el autor de 30 artículos de revista y el autor de 35 artículos de conferencia. Coloquialmente se dice que “muchos producen poco y pocos producen mucho”. Además, el ajuste entre los datos y lo previsto por la ley de Lotka es fuerte como lo inican los coeficientes de correlación. Por último, como se tiene el nombre de cada investigador en los datos, podemos - si se quiere, o se requiere, - identificar cada uno de ellos dentro de una posición de productividad.
Se asocia la ley de Lotka a la máxima que "el éxito llama al éxito" ("success breeds success"), o a que “los ricos de hacen más ricos” (“the rich get richer”). Máximas que nos conducen a la “curva de la repartición de ingresos” de Pareto (1896) -  ("La Courbe de la Repartition de la Richesse". In: G. Busino, editor (1965). Œuvres Complètes de Vilfredo Pareto. Geneva: Librairie Droz, t. 3 Ecrits sur la courbe de la répartition de la richesse).
Si la “ley de Pareto” (que originalmente se refiere a la distribución de ingresos) se formula (x(m)/x)^a, donde: x > x(m) es la riqueza de la gente más pobre (el subíndice m significa mínimo), y se aplica a nuestros datos, con los parámetros x > x(m) = 1 y a = 2,  se obtienen los mismos resultados, la misma distribución. Nótese que cuanto más grande es el parámetro a, más pequeña será la proporción de investigadores muy “ricos” en artículos publicados. Hecho que podemos estimarlo como un proceso de concentración de la “renta” entendida ésta como el número de artículos publicados en el periodo, por tanto plantearnos las “medidas de desigualdad”
Estudio en curso de elaboración

Volver al PLAN DE ANALISIS

ELECTRICAL ENGINEERING, POWER SYSTEMS AND APPLICACIONS, AND POWER SYSTEM MANAGEMENT, OPERATION AND ECONOMICS

PLAN DE ANALISIS

1) Producción científica – la cantidad de artículos publicados
2) Fuerza de producción científica – los autores y coautores de los artículos
3) Actores institucionales – aquellos en donde la investigación se ha realizado
4) Clases de conocimiento – cuyo modelo es un grafo de categorías
5) Conexión ciencia-tecnología – por medio de los códigos de clasificación INSPEC y IPC

INTRODUCCION

El título corresponde en el sistema de clasificación de la base de datos INSPEC al campo definido por:

 B Electrical and electronics engineering
 B8 Power systems and applications
 B8110B Power system management, operation and economics

Antes habíamos dicho que lo económico imbricado con las clases de energía que han sido objeto del estudio anterior (ver Análisis de la investigación), correspondía a las categorías del sistema de clasificación de la base de datos INSPEC: “B8110B Power system management, operation and economics”, “B8120 Power transmission, distribution and supply”, “B8110D Power system planning and layout”. Ahora abordamos la primera categoría: “B8110B Power system management, operation and economics”. Al decir “lo económico”, se quería señalar que este aspecto se presenta al interior de la “electrical and electronic engineering”, es decir desde un enfoque de ingeniería y no de economía o de ingeniería comercial.

Los Datos

El total de la muestra: 230 artículos de revistas (53%) y conferencias (47%) publicados entre 1976-2011. Este conjunto es el resultado de la consulta (efectuada el 28/07/2011) de la base de datos INSPEC.

Organización del estudio

Primero los resultados de la investigación que se miden por la cantidad de artículos publicados en revistas y conferencias cubiertas por la base INSPEC.
Segundo los investigadores como fuerza de producción de artículos y que aparecen como los autores y coautores de esos artículos.
Tercero las afiliaciones de los autores y que se consideran como los actores institucionales de la investigación científica realizada. En otras palabras, los centros de investigación.
Cuarto las clases de conocimiento definidas por el sistema de clasificación INSPEC y con las que se construye una red de conocimiento.
Quinto la conexión ciencia-tecnología a través de las categorías INSPEC y CIP, o Clasificación Internacional de Patentes (más conocida como IPC, International Patent Classificacion) y que ambas se encuentran simultáneamente en el campo “clasificación” de los datos.