martes, 16 de diciembre de 2014

La geografía del plagio científico

Noticias de última hora y el análisis del mundo de la política científica
Estudio de masiva archivo de pre-impresión alude a la geografía de plagio



Por John Bohannon

Nuevos análisis de los cientos de miles de manuscritos técnicos presentados a arXiv, el repositorio de preimpresión artículos digitales, están ofreciendo algunas ideas interesantes en las consecuencias y la geografía de plagio científico. Parece que copiar texto de otros documentos es más común en algunos países que en otros, pero el resultado es el mismo para los autores Generalmente OMS copia de extensamente: sus trabajos citados no tienen mucho.

Desde su fundación en 1991, arXiv ha convertido en el referente más grandes del mundo para compartir los hallazgos de la física, las matemáticas y otros campos matemáticos. Publica Cientos de papeles al día y se acerca rápidamente su presentación millones. Cualquier persona puede enviar en un papel, y presentaciones no obtener una revisión por pares completa. Sin embargo, los papeles no pasan por un proceso de control de calidad. El control final es un programa informático que compara el texto del papel con el texto de todos los otros artículos ya publicados en arXiv. El objetivo es que los papeles de bandera que tienen una alta probabilidad de tener trabajo publicado plagiado.

"Superposición de texto" es el término técnico, ya veces resulta ser inocente. Por ejemplo, un artículo de revisión Might cita generosamente de una ponencia el autor cita, o el autor podría reciclar y ligeramente actualizado frases de su propio trabajo anterior. Los papeles arXiv para el detector de plagio ofrece opiniones de tal extremo. "Es una máquina muy sofisticada logística aprendizaje clasificador", dice el fundador Paul Ginsparg arXiv, un físico de la Universidad de Cornell. "Tiene formas especiales de detección de cotizaciones bloque, texto en cursiva, el texto entre comillas, como estados de cuenta así de teoremas matemáticos, para evitar falsos positivos."

Sólo cuando no hay ninguna razón obvia para un autor que tiene trozos significativos de texto copiado desde ya publicado el trabajo, sobre todo si ese trabajo anterior no es citado y no tiene ningún solapamiento en la autoría, no el software, pongan una "bandera" para el artículo, incluidas enlaces a los documentos de la cuales tiene superposición de texto. Esa norma "es mucho más indulgente" que Críticas los utilizados por la mayoría de las revistas científicas, dice Ginsparg.

Para explorar algunas de las consecuencias de la "reutilización texto," Ph.D. Ginsparg y Cornell física estudiante Daniel Citron En comparación con el texto de la convocatoria ahora de los 757 000 artículos presentados a arXiv entre 1991 y 2012. El titular de ese estudio, publicado el lunes en las Actas de la Academia Nacional de Ciencias (PNAS) es que cuanto más texto un documento poaches desde ya obra publicada, la menor frecuencia que el papel tiende a ser citado. (El documento completo también está disponible de forma gratuita en arXiv.) También se encontró que la reutilización de texto es sorprendentemente común. Después de la filtración de los comentarios de los artículos y legítimamente citando, aproximadamente uno de cada 16 autores arXiv se encontró que han copiado las largas frases y oraciones de su propio trabajo publicado anteriormente que suman aproximadamente la misma cantidad de texto este artículo entero. Más preocupante aún, aproximadamente uno de cada 1.000 de los autores que presenten copiar el equivalente del valor de un párrafo de texto de los documentos de otras personas sin citarlas.

Entonces, ¿dónde en el mundo es todo esto reutilización texto está sucediendo? Brilla por falta en el artículo de PNAS es un mapa global del potencial de plagio. Cada vez que un autor presenta un documento a arXiv, el autor declara su país de residencia. Por lo tanto, debería ser posible revelar las que los países tienen la mayor proporción de los plagiarios. La razón hay mapa se incluyó, Ginsparg de peaje ScienceInsider, es que se detecta toda la superposición de texto en Reviews su estudio no es necesariamente el plagio.

Ginsparg estaba de acuerdo, sin embargo, para compartir los datos con abanderamiento ScienceInsider de arXiv. Desde el 1 de agosto de 2011, cuando comenzó arXiv sistemáticamente marcar la superposición de texto, 106.262 autores de 151 naciones se han presentado un total de 301.759 artículos. (Cada artículo puede tener muchos más co-autores). En general, 3,2% (9591) de los documentos se encuentra en posición. No son sólo los documentos presentados en masa por unas cuantas manzanas podridas, tampoco. Esos papeles marcados Llegaron del 6% (6737) de los autores que presenten. Dicho de otra manera, uno de cada 16 investigadores que han presentado un documento a arXiv desde agosto de 2011 ha sido marcado por el detector de plagio al menos una vez.

El mapa de arriba, preparado por ScienceInsider, adopta un enfoque conservador. Se muestra sólo la incidencia de los autores de bandera para los 57 países con al menos 100 trabajos presentados, para minimizar la distorsión de los pequeños tamaños de muestra. (En Etiopía, por ejemplo, sólo hay tres autores que presenten y dos de ellos han sido marcado.)

Los investigadores de los países que presentan la parte del león de arXiv papeles-Estados Unidos, Canadá, y un pequeño número de países industrializados de Europa y Asia-creciente nicho de plagiar menudo menos de investigadores en otros lugares. Por ejemplo, más del 20% (38 de 186) de los autores que presenten trabajos de Bulgaria se encuentra en posición, más de ocho veces la proporción de Nueva Zelanda (cinco de 207). En Japón, alrededor del 6% (269 de 4.759) de los autores que presenten se encuentra en posición, en comparación con más del 15% (164 de 1054) de Irán.

Estas disparidades pueden deberse en parte a las diferentes culturas académicas, Ginsparg y Citron Revisiones su opinión en el estudio de PNAS. Ellos atribuyen las plagio científico a "diferencias en la infraestructura académica y tutoría, o incentivos que hacen hincapié en la calidad sobre la cantidad de la publicación."

* Corrección de 11 de diciembre, 16:57: La carpeta se ha corregido para reflejar las actuales fronteras nacionales.

Science Magazine

No hay comentarios:

Publicar un comentario en la entrada