Personal tools
You are here: Home Lingüística del texto científico (COTECA)
Document Actions

Corpus Textual del Español Científico de la Argentina

by Gerardo Giansante last modified 2008-07-02 12:55

El proyecto COTECA (Corpus Textual del Español Científico de la Argentina) tiene como propósito general contribuir al conocimiento del español oral y escrito que emplean los investigadores argentinos de distintas disciplinas. Este propósito se materializa en dos objetivos específicos principales: la constitución de un corpus textual del español científico empleado en Argentina, en las modalidades oral y escrita; y la realización de investigaciones lingüísticas que lo toman como base empírica, en particular en las dimensiones textual, léxico-gramatical y terminológica. 

El COTECA aspira a ser, en el largo plazo, un corpus representativo del español científico-académico empleado en Argentina, basado en criterios y principios de organización que permitan su actualización permanente. La calidad de dicho corpus se garantiza mediante la elección cuidadosa de las fuentes, que se realiza con el asesoramiento de especialistas en las áreas temáticas del proyecto. 

El diseño y la organización del COTECA se fundamentan en los desarrollos teóricos y metodológicos de la lingüística textual y de la lingüística de corpus. El COTECA se distingue de otros corpus textuales por una afinada categorización de los textos, basada en trabajos de investigación del equipo.  

El diseño del COTECA contempla los criterios de: a) diversidad disciplinar: en el corpus estarán representadas las ciencias exactas y naturales y las sociales y humanísticas, si bien en la primera etapa hemos comenzado por la biología (en sentido amplio) y la economía; la selección de las disciplinas obedece a su importancia en el panorama científico y a su impacto social; b) diversidad genérica: se han elegido, para la primera etapa de conformación del corpus, géneros centrales de la actividad científico-académica, tanto orales como escritos. El espectro de “textos de especialidad” considerado incluye desde géneros que transmiten conocimiento nuevo y original (artículo de investigación, tesis, ponencias en congresos) hasta géneros que pueden considerarse de alta divulgación (artículos de revistas de divulgación, entrevistas a científicos y conferencias de divulgación). El corpus reunido hasta el momento se compone de unas 3.000.000 de palabras (alrededor de 400 textos), y se encuentra en distintos formatos (esencialmente Word, RTF y PDF). En una próxima etapa, el corpus estará a disposición de la comunidad de investigadores para consulta y realización de investigaciones.

Directora: Guiomar E. Ciapuscio

Codirectora: Andreína Adelstein 


Powered by Plone, the Open Source Content Management System

This site conforms to the following standards: