EspañolEnglish
Corpus Textual del Español Científico de la Argentina
El proyecto COTECA (Corpus Textual del Español Científico de la Argentina) tiene como propósito general contribuir al conocimiento del español oral y escrito que emplean los investigadores argentinos de distintas disciplinas. Este propósito se materializa en dos objetivos específicos principales: la constitución de un corpus textual del español científico empleado en Argentina, en las modalidades oral y escrita; y la realización de investigaciones lingüísticas que lo toman como base empírica, en particular en las dimensiones textual, léxico-gramatical y terminológica. 
 
El COTECA aspira a ser, en el largo plazo, un corpus representativo del español científico-académico empleado en Argentina, basado en criterios y principios de organización que permitan su actualización permanente. La calidad de dicho corpus se garantiza mediante la elección cuidadosa de las fuentes, que se realiza con el asesoramiento de especialistas en las áreas temáticas del proyecto. 
 
El diseño y la organización del COTECA se fundamentan en los desarrollos teóricos y metodológicos de la lingüística textual y de la lingüística de corpus. El COTECA se distingue de otros corpus textuales por una afinada categorización de los textos, basada en trabajos de investigación del equipo.  
 
El diseño del COTECA contempla los criterios de: a) diversidad disciplinar:en el corpus estarán representadas las ciencias exactas y naturales y las sociales y humanísticas, si bien en la primera etapa hemos comenzado por la biología (en sentido amplio) y la economía; la selección de las disciplinas obedece a su importancia en el panorama científico y a su impacto social; b) diversidad genérica: se han elegido, para la primera etapa de conformación del corpus, géneros centrales de la actividad científico-académica, tanto orales como escritos. El espectro de “textos de especialidad” considerado incluye desde géneros que transmiten conocimiento nuevo y original (artículo de investigación, tesis, ponencias en congresos) hasta géneros que pueden considerarse de alta divulgación (artículos de revistas de divulgación, entrevistas a científicos y conferencias de divulgación). El corpus reunido hasta el momento se compone de unas 3.000.000 de palabras (alrededor de 400 textos), y se encuentra en distintos formatos (esencialmente Word, RTF y PDF). En una próxima etapa, el corpus estará a disposición de la comunidad de investigadores para consulta y realización de investigaciones.
 
 
La primera fase del proyecto (2006-2008) fue financiada por el CONICET y contó con un equipo de trabajo más numeroso (ver “Integrantes”); la segunda fase (en curso) está siendo financiada por la Agencia Nacional de Promoción Científica.
 
Financiación
En la primera fase el proyecto estuvo financiado por el PIP 6165 del CONICET. La segunda fase está financiada por el PICT 1551 (2007) de la Agencia Nacional de Promoción Científica y Tecnológica (2009-2011).
 
Directora: Guiomar E. Ciapuscio
 
Codirectora: Andreína Adelstein
 
Equipo de trabajo
 
Primera fase
Estudiantes que colaboran en el Coteca:
  • Carolina Bartalini
  • Silvina Bongiovanni
  • Josefina D´Alessio
  • Gabriel Dvoskin
  • Julieta Straccia
  • Agostina Weler
 
Segunda fase
  • Guiomar Ciapuscio (directora)
  • Andreína Adelstein (investigadora integrante)
  • Susana Gallardo (investigadora integrante)
  • Laura Ferrari (tesista)
  • Carla Miotto (tesista)
  • Marina Berri (tesista)
  • Daniela Stagnaro (tesista)